Coursera

Construire des systèmes LLM fiables

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Coursera

Construire des systèmes LLM fiables

Inclus avec Coursera Plus

Demander à Coursera

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

2 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

2 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Créer des scripts intégrant des métriques lexicales et sémantiques pour évaluer les modèles de langage à grande échelle (LLM), diagnostiquer les « hallucinations » et trouver un équilibre entre le taux de rappel des recherches vectorielles et la latence.

  • Utiliser les tests d'hypothèse, les intervalles de confiance et les mesures de significativité pour évaluer la précision du modèle et valider les résultats des expériences A/B.

  • Utilisez le SQL paramétré et les fonctions de manipulation de données pour segmenter les journaux des utilisateurs, calculer la durée de conservation et extraire en toute sécurité des ensembles de données à grande échelle.

  • Analyser les lacunes en matière de performances des modèles de langage à grande échelle (LLM) afin de hiérarchiser les corrections techniques et de mettre en œuvre des mesures correctives visant à garantir la fiabilité en environnement de production.

Compétences que vous acquerrez

  • Catégorie : Modélisation des grandes langues
  • Catégorie : Débogage
  • Catégorie : Génération assistée par récupération
  • Catégorie : MLOps (Machine Learning Operations)
  • Catégorie : Méthodes statistiques
  • Catégorie : Intelligence artificielle et apprentissage automatique (IA/ML)
  • Catégorie : Optimisation des performances
  • Catégorie : SQL
  • Catégorie : Analyse statistique
  • Catégorie : Évaluation du modèle
  • Catégorie : Tests d'hypothèses statistiques
  • Catégorie : Prise de décision fondée sur des données
  • Catégorie : Tests de performance
  • Catégorie : Candidature au LLM

Outils que vous découvrirez

  • Catégorie : Programmation Python
  • Catégorie : Bases de données vectorielles
  • Catégorie : Langages de requête

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

mars 2026

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise en Apprentissage automatique

Ce cours fait partie de la Certificat Professionnel LLM Engineering That Works : Invitation, mise au point et récupération
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à ce Certificat Professionnel.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable auprès de Coursera

Il y a 5 modules dans ce cours

Ce module pose les bases de l'évaluation quantitative des modèles de langage à grande échelle (LLM). Les apprenants découvriront pourquoi il n'est pas viable de se fier à l'intuition pour évaluer les performances d'un modèle et exploreront les indicateurs fondamentaux utilisés pour créer des systèmes d'évaluation automatisés et objectifs. Nous aborderons à la fois les indicateurs de similarité lexicale (tels que BLEU et ROUGE-L), qui évaluent la structure du texte, et les indicateurs sémantiques (tels que la similarité cosinus), qui rendent compte du sens. À l’issue de ce module, les apprenants disposeront des connaissances théoriques et du code pratique nécessaires pour créer leur premier script d’évaluation automatisé.

Inclus

8 vidéos3 lectures3 devoirs3 laboratoires non notés

Lorsqu’un chatbot en production commence à fournir des réponses erronées, comment identifier le problème et y remédier ? Ce module permet aux professionnels de l’IA, aux ingénieurs en apprentissage automatique et aux analystes de données d’acquérir les compétences essentielles au débogage des modèles de langage de grande envergure (LLM) en production. Allez au-delà de la théorie et découvrez le processus systématique et axé sur les données que les professionnels utilisent pour résoudre le problème critique des « hallucinations » de l’IA. Vous serez ainsi en mesure de passer de la simple observation des défaillances de l’IA à leur diagnostic et à leur résolution de manière experte.

Inclus

5 vidéos3 lectures3 devoirs2 laboratoires non notés

Lorsqu'il s'agit de prendre des décisions de déploiement aux enjeux importants, un simple score de précision ne suffit pas. Ce module vous fournit les méthodes statistiques nécessaires pour valider de manière rigoureuse les améliorations de performances des modèles de langage à grande échelle (LLM). À l'issue de ce module, vous serez en mesure d'aller au-delà des évaluations subjectives du type « ça semble mieux » pour affirmer avec certitude « nous pouvons prouver que c'est mieux », garantissant ainsi que chaque décision de déploiement s'appuie sur des preuves statistiques solides.

Inclus

5 vidéos2 lectures3 devoirs3 laboratoires non notés

Dans le domaine de l'IA à grande échelle, des requêtes lentes et des recherches inefficaces peuvent paralyser un système. Ce module vous apporte les compétences essentielles pour éviter cela, en mettant l'accent sur des techniques pratiques d'optimisation des bases de données et des recherches vectorielles. À l'issue de ce module, vous serez en mesure d'analyser et d'optimiser systématiquement les systèmes de recherche en production, garantissant ainsi que vos applications d'IA soient non seulement puissantes, mais aussi rapides et fiables.

Inclus

4 vidéos3 lectures4 devoirs3 laboratoires non notés

Dans ce module, vous réaliserez un audit de performance de bout en bout en comparant deux variantes de LLM à l’aide d’un ensemble de données de test A/B. Vous mettrez en place un pipeline pour calculer des indicateurs de performance clés, notamment la similarité lexicale et sémantique, et vous utiliserez des tests statistiques A/B pour valider les améliorations apportées aux modèles. Le projet aboutira à un rapport complet dans lequel vous établirez une corrélation entre les taux d’hallucinations et les journaux de recherche, puis vous synthétiserez vos conclusions sous forme de recommandations fondées sur les données à l’intention des parties prenantes, afin d’orienter la décision relative au déploiement en production dans une application d’assistance client.

Inclus

2 lectures1 devoir

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Professionals from the Industry
489 Cours112 906 apprenants

Offert par

Coursera

En savoir plus sur Apprentissage automatique

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.