Qu'est-ce que je recevrai si je m'abonne à ce certificat ?

Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours du certificat et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - à partir de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.

IA générative et LLMs : Architecture et préparation des données

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

IA générative et LLMs : Architecture et préparation des données

Ce cours fait partie de plusieurs programmes.

Instructeurs : Joseph Santarcangelo

56 183 déjà inscrits

Inclus avec

2 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

442 avis

niveau Intermédiaire

Expérience recommandée

Planning flexible

6 heures à compléter

Apprenez à votre propre rythme

2 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

442 avis

niveau Intermédiaire

Expérience recommandée

Planning flexible

6 heures à compléter

Apprenez à votre propre rythme

Ce que vous apprendrez

Faire la différence entre les architectures et les modèles IA génératifs, tels que les RNN, les transformateurs, les VAE, les GAN et les modèles de diffusion
Décrire comment les serveurs d'authentification, tels que GPT, BERT, BART et T5, sont appliqués dans les tâches de traitement du langage naturel
Mettre en œuvre la tokenisation pour prétraiter le texte brut à l'aide de bibliothèques NLP comme NLTK, spaCy, BertTokenizer et XLNetTokenizer
Créer un chargeur de données NLP dans PyTorch qui gère la tokenisation, la numérisation et le padding pour les ensembles de données textuelles

Compétences que vous acquerrez

Catégorie : Pipelines de données
Catégorie : Traitement du langage naturel
Catégorie : Modèle de formation
Catégorie : Prétraitement des données
Catégorie : Candidature au LLM
Catégorie : Réseaux neuronaux récurrents (RNN)
Catégorie : Architectures de modèles génératifs
Catégorie : Modélisation des grandes langues

Outils que vous découvrirez

Catégorie : IA générative
Catégorie : Réseaux adversoriels génératifs (GAN)
Catégorie : Visage étreint
Catégorie : PyTorch (Bibliothèque d'apprentissage automatique)

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

4 devoirs

Enseigné en Anglais

95%

La plupart des étudiants ont apprécié ce cours

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours est disponible dans le cadre de

Lorsque vous vous inscrivez à ce cours, vous devez également sélectionner un programme spécifique.

Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable

Il y a 2 modules dans ce cours

Prêt à explorer le monde passionnant de l'IA générative et des grands modèles de langage (LLM) ? Ce cours IBM, qui fait partie du certificat professionnel Generative IA Engineering Essentials with LLMs, vous permet d'acquérir des compétences pratiques pour exploiter l'IA afin de transformer les industries.

Conçu pour les data scientists, les ingénieurs ML et les passionnés d'IA, vous apprendrez à différencier les diverses architectures et modèles d'IA générative, tels que les réseaux neurones récurrents (RNN), les transformateurs, les réseaux antagonistes génératifs (GAN), les autoencodeurs variationnels (VAE) et les modèles de diffusion. Vous découvrirez également comment les LLM, tels que les transformateurs génératifs pré-entraînés (GPT) et les représentations d'encodeurs bidirectionnels à partir de transformateurs (BERT), permettent d'effectuer des tâches linguistiques dans le monde réel. Mettez en pratique les techniques de tokenisation en utilisant NLTK, spaCy, et Hugging Face, et construisez des pipelines de données efficaces avec les chargeurs de données PyTorch pour préparer les modèles pour l'entraînement. Une compréhension de base de Python, PyTorch, et une familiarité avec l'apprentissage automatique et les réseaux neurones sont utiles mais pas obligatoires. Inscrivez-vous dès aujourd'hui et préparez-vous à lancer votre voyage dans l'IA générative !

Dans ce module, vous découvrirez l'importance de l'IA générative et la façon dont elle transforme divers domaines par la génération de contenu, la création de codes et la synthèse d'images. Vous explorerez les architectures clés de l'IA générative, telles que les réseaux antagonistes génératifs (GAN), les autoencodeurs variationnels (VAE), les modèles de diffusion et les transformateurs, et comprendrez les différences dans leurs approches de formation. Vous examinerez également comment les grands modèles de langage (LLM) tels que les transformateurs génératifs pré-entraînés (GPT) et les représentations d'encodeurs bidirectionnels à partir de transformateurs (BERT) sont appliqués dans la construction d'applications basées sur le NLP. Enfin, grâce à un laboratoire pratique, vous créerez un simple chatbot en utilisant la bibliothèque de transformateurs Hugging Face et vous serez initié aux outils et bibliothèques essentiels utilisés dans le développement de l'IA générative.

Inclus

5 vidéos3 lectures2 devoirs1 élément d'application3 plugins

5 vidéosTotal 28 minutes

Vue d'ensemble de l'ingénierie de l'IA avec les LLM6 minutes
Introduction au cours3 minutes
Importance de l'IA générative6 minutes
Architectures et modèles IA génératifs6 minutes
IA générative pour le NLP7 minutes

3 lecturesTotal 15 minutes

Produit phare d'IBM : watsonx.governance2 minutes
Aperçu du cours10 minutes
Résumé et points forts3 minutes

2 devoirsTotal 25 minutes

Quiz pratique : Aperçu et architecture de l'IA générative10 minutes
Quiz noté : Architecture de l'IA générative15 minutes

1 élément d'applicationTotal 60 minutes

Lab : Explorer les bibliothèques d'IA générative60 minutes

3 pluginsTotal 32 minutes

Conseils utiles pour l'achèvement des cours2 minutes
Lecture : Les bases des hallucinations de l'IA10 minutes
Lecture : Vue d'ensemble des bibliothèques et des outils20 minutes

Dans ce module, vous apprendrez à préparer les données pour l'entraînement de grands modèles de langage (LLM) en mettant en œuvre la symbolisation et en construisant des chargeurs de données. Vous explorerez différentes méthodes de tokenisation et comprendrez comment les tokenizers convertissent le texte brut en entrée prête pour le modèle. Vous mettrez en œuvre la tokenisation à l'aide de bibliothèques telles que NLTK, spaCy, BertTokenizer et XLNetTokenizer. En outre, vous apprendrez le rôle des chargeurs de données dans le pipeline d'entraînement et utiliserez la classe DataLoader dans PyTorch pour créer un chargeur de données avec une fonction collate personnalisée qui traite des lots de texte. Ces compétences pratiques sont essentielles pour construire des pipelines NLP efficaces pour la formation LLM. En outre, des documents de soutien, tels qu'une antisèche et un glossaire, renforceront votre apprentissage.

Inclus

2 vidéos6 lectures2 devoirs2 éléments d'application2 plugins

2 vidéosTotal 14 minutes

Tokenisation7 minutes
Aperçu des chargeurs de données7 minutes

6 lecturesTotal 14 minutes

Données d'entraînement et diversité pour une formation LLM efficace5 minutes
Résumé et points forts2 minutes
Prochaines étapes : Explorer IBM watsonx.governance1 minute
Conclusion du cours3 minutes
Félicitations et prochaines étapes2 minutes
Équipe et remerciements1 minute

2 devoirsTotal 25 minutes

Quiz pratique : Préparation des données10 minutes
Quiz noté : Préparation des données pour les LLM15 minutes

2 éléments d'applicationTotal 120 minutes

Lab : Mise en œuvre de la tokenisation60 minutes
Lab : Création d'un chargeur de données NLP60 minutes

2 pluginsTotal 9 minutes

Aide-mémoire : IA générative et LLMs : Architecture et préparation des données5 minutes
Glossaire du cours : IA générative et LLMs : Architecture et préparation des données4 minutes

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Évaluations de l’enseignant

(85 évaluations)

Joseph Santarcangelo

IBM

37 Cours2 507 511 apprenants

Offert par

IBM

En savoir plus sur Apprentissage automatique

Statut : Essai gratuit
Coursera
Generative AI and Large Language Models
Cours
Statut : Essai gratuit
Packt
Generative AI, LLMs, and Advanced Applications with Python
Cours
Statut : Essai gratuit
Edureka
Generative AI Architecture and Application Development
Cours
Statut : Essai gratuit
IBM
Generative AI Engineering with LLMs
Spécialisation

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

5 stars
77,70 %
4 stars
14,86 %
3 stars
4,72 %
2 stars
1,57 %
1 star
1,12 %

Affichage de 3 sur 442

Révisé le 30 juil. 2025

I would expect more hands on and code submissions

Révisé le 23 juil. 2025

his course is sufficient to introduce the different architectures of LLMs and enable you to prepare data for training models.

Révisé le 12 nov. 2025

Labs could have been made a little more lucid and comprehensive with comments for unusual syntaxes and appropriate visuals for the subject matter. Great course, regardless.

Voir plus d’avis

Foire Aux Questions

Il ne vous faudra que deux semaines pour terminer ce cours si vous consacrez deux heures d'étude par semaine.

Il sera bon que vous ayez une connaissance de base de Python et PyTorch et une familiarité avec l'apprentissage automatique et les concepts de réseaux neurones.

Ce cours fait partie d'une spécialisation. Lorsque vous terminerez la spécialisation, vous vous préparerez avec les compétences et la confiance nécessaires pour occuper des postes tels que ingénieur IA, ingénieur NLP, ingénieur en apprentissage automatique, ingénieur en apprentissage profond et scientifique des données.

Seul un navigateur web moderne est nécessaire pour suivre ce cours et tous les travaux pratiques.

Vous aurez accès gratuitement à des environnements basés sur le cloud pour effectuer les travaux pratiques.

Vous vous inscrirez à des plateformes telles que Hugging Face et utiliserez des fonctionnalités qui ne sont pas facturées.

Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.