IBM

IA générative et LLMs : Architecture et préparation des données

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

IBM

IA générative et LLMs : Architecture et préparation des données

Ce cours fait partie de plusieurs programmes.

Joseph Santarcangelo
Roodra Pratap Kanwar

Instructeurs : Joseph Santarcangelo

56 183 déjà inscrits

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

442 avis

niveau Intermédiaire

Expérience recommandée

Planning flexible
6 heures à compléter
Apprenez Ă  votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

442 avis

niveau Intermédiaire

Expérience recommandée

Planning flexible
6 heures à compléter
Apprenez Ă  votre propre rythme

Ce que vous apprendrez

  • Faire la diffĂ©rence entre les architectures et les modèles IA gĂ©nĂ©ratifs, tels que les RNN, les transformateurs, les VAE, les GAN et les modèles de diffusion

  • DĂ©crire comment les serveurs d'authentification, tels que GPT, BERT, BART et T5, sont appliquĂ©s dans les tâches de traitement du langage naturel

  • Mettre en Ĺ“uvre la tokenisation pour prĂ©traiter le texte brut Ă  l'aide de bibliothèques NLP comme NLTK, spaCy, BertTokenizer et XLNetTokenizer

  • CrĂ©er un chargeur de donnĂ©es NLP dans PyTorch qui gère la tokenisation, la numĂ©risation et le padding pour les ensembles de donnĂ©es textuelles

Compétences que vous acquerrez

  • CatĂ©gorie : Pipelines de donnĂ©es
  • CatĂ©gorie : Traitement du langage naturel
  • CatĂ©gorie : Modèle de formation
  • CatĂ©gorie : PrĂ©traitement des donnĂ©es
  • CatĂ©gorie : Candidature au LLM
  • CatĂ©gorie : RĂ©seaux neuronaux rĂ©currents (RNN)
  • CatĂ©gorie : Architectures de modèles gĂ©nĂ©ratifs
  • CatĂ©gorie : ModĂ©lisation des grandes langues

Outils que vous découvrirez

  • CatĂ©gorie : IA gĂ©nĂ©rative
  • CatĂ©gorie : RĂ©seaux adversoriels gĂ©nĂ©ratifs (GAN)
  • CatĂ©gorie : Visage Ă©treint
  • CatĂ©gorie : PyTorch (Bibliothèque d'apprentissage automatique)

Détails à connaître

Certificat partageable

Ajouter Ă  votre profil LinkedIn

Évaluations

4 devoirs

Enseigné en Anglais
95%
La plupart des étudiants ont apprécié ce cours

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours est disponible dans le cadre de
Lorsque vous vous inscrivez à ce cours, vous devez également sélectionner un programme spécifique.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • AcquĂ©rez une comprĂ©hension de base d'un sujet ou d'un outil
  • DĂ©veloppez des compĂ©tences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 2 modules dans ce cours

Dans ce module, vous découvrirez l'importance de l'IA générative et la façon dont elle transforme divers domaines par la génération de contenu, la création de codes et la synthèse d'images. Vous explorerez les architectures clés de l'IA générative, telles que les réseaux antagonistes génératifs (GAN), les autoencodeurs variationnels (VAE), les modèles de diffusion et les transformateurs, et comprendrez les différences dans leurs approches de formation. Vous examinerez également comment les grands modèles de langage (LLM) tels que les transformateurs génératifs pré-entraînés (GPT) et les représentations d'encodeurs bidirectionnels à partir de transformateurs (BERT) sont appliqués dans la construction d'applications basées sur le NLP. Enfin, grâce à un laboratoire pratique, vous créerez un simple chatbot en utilisant la bibliothèque de transformateurs Hugging Face et vous serez initié aux outils et bibliothèques essentiels utilisés dans le développement de l'IA générative.

Inclus

5 vidéos3 lectures2 devoirs1 élément d'application3 plugins

Dans ce module, vous apprendrez à préparer les données pour l'entraînement de grands modèles de langage (LLM) en mettant en œuvre la symbolisation et en construisant des chargeurs de données. Vous explorerez différentes méthodes de tokenisation et comprendrez comment les tokenizers convertissent le texte brut en entrée prête pour le modèle. Vous mettrez en œuvre la tokenisation à l'aide de bibliothèques telles que NLTK, spaCy, BertTokenizer et XLNetTokenizer. En outre, vous apprendrez le rôle des chargeurs de données dans le pipeline d'entraînement et utiliserez la classe DataLoader dans PyTorch pour créer un chargeur de données avec une fonction collate personnalisée qui traite des lots de texte. Ces compétences pratiques sont essentielles pour construire des pipelines NLP efficaces pour la formation LLM. En outre, des documents de soutien, tels qu'une antisèche et un glossaire, renforceront votre apprentissage.

Inclus

2 vidéos6 lectures2 devoirs2 éléments d'application2 plugins

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Évaluations de l’enseignant
(85 évaluations)
Joseph Santarcangelo
IBM
37 Cours2 507 511 apprenants

Offert par

IBM

En savoir plus sur Apprentissage automatique

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

  • 5 stars

    77,70 %

  • 4 stars

    14,86 %

  • 3 stars

    4,72 %

  • 2 stars

    1,57 %

  • 1 star

    1,12 %

Affichage de 3 sur 442

SK

Révisé le 30 juil. 2025

SH

Révisé le 23 juil. 2025

SS

Révisé le 12 nov. 2025

Foire Aux Questions