Qu'est-ce que je recevrai si je m'abonne à ce certificat ?

Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours du certificat et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - à partir de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.

Construire des systèmes LLM fiables

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Construire des systèmes LLM fiables

Ce cours fait partie de Certificat Professionnel LLM Engineering That Works : Invitation, mise au point et récupération

Instructeur : Professionals from the Industry

Inclus avec

Demander à Coursera

5 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Intermédiaire

Expérience recommandée

2 semaines à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

5 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Intermédiaire

Expérience recommandée

2 semaines à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

Ce que vous apprendrez

Créer des scripts intégrant des métriques lexicales et sémantiques pour évaluer les modèles de langage à grande échelle (LLM), diagnostiquer les « hallucinations » et trouver un équilibre entre le taux de rappel des recherches vectorielles et la latence.
Utiliser les tests d'hypothèse, les intervalles de confiance et les mesures de significativité pour évaluer la précision du modèle et valider les résultats des expériences A/B.
Utilisez le SQL paramétré et les fonctions de manipulation de données pour segmenter les journaux des utilisateurs, calculer la durée de conservation et extraire en toute sécurité des ensembles de données à grande échelle.
Analyser les lacunes en matière de performances des modèles de langage à grande échelle (LLM) afin de hiérarchiser les corrections techniques et de mettre en œuvre des mesures correctives visant à garantir la fiabilité en environnement de production.

Compétences que vous acquerrez

Catégorie : Modélisation des grandes langues
Catégorie : Débogage
Catégorie : Génération assistée par récupération
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Méthodes statistiques
Catégorie : Intelligence artificielle et apprentissage automatique (IA/ML)
Catégorie : Optimisation des performances
Catégorie : SQL
Catégorie : Analyse statistique
Catégorie : Évaluation du modèle
Catégorie : Tests d'hypothèses statistiques
Catégorie : Prise de décision fondée sur des données
Catégorie : Tests de performance
Catégorie : Candidature au LLM

Outils que vous découvrirez

Catégorie : Programmation Python
Catégorie : Bases de données vectorielles
Catégorie : Langages de requête

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

mars 2026

Évaluations

14 affectations¹

Noté par l'IA voir l'avis de non-responsabilité

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise en Apprentissage automatique

Ce cours fait partie de la Certificat Professionnel LLM Engineering That Works : Invitation, mise au point et récupération

Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à ce Certificat Professionnel.

Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable auprès de Coursera

Il y a 5 modules dans ce cours

« Construire des systèmes LLM fiables » est une formation complète destinée aux professionnels de l’IA qui souhaitent aller au-delà des modèles de base et créer des applications prêtes à l’emploi. S’il est facile d’amener un LLM à générer du texte, garantir un résultat toujours précis, pertinent et fiable constitue un défi technique de taille. Cette formation propose un cadre systématique permettant d’aborder l’ensemble du cycle de vie de la fiabilité des LLM.

Vous commencerez par apprendre à évaluer quantitativement les performances du modèle à l’aide d’un ensemble de métriques lexicales et sémantiques, telles que BLEU, ROUGE-L et la similarité cosinus. Vous vous plongerez dans le débogage, en utilisant l’analyse des journaux et la manipulation des données pour mettre au jour les causes profondes des défaillances critiques, telles que les « hallucinations », en les mettant en corrélation avec les performances du système de recherche. La formation met l’accent sur la rigueur statistique : elle vous apprendra à concevoir et analyser des tests A/B, à appliquer des tests d’hypothèses et à calculer des intervalles de confiance afin de prouver la pertinence de vos optimisations. Enfin, vous optimiserez les couches de données fondamentales, en apprenant à ajuster les requêtes SQL et les paramètres de recherche vectorielle afin d’atteindre l’équilibre parfait entre le taux de rappel et la latence.

Ce module pose les bases de l'évaluation quantitative des modèles de langage à grande échelle (LLM). Les apprenants découvriront pourquoi il n'est pas viable de se fier à l'intuition pour évaluer les performances d'un modèle et exploreront les indicateurs fondamentaux utilisés pour créer des systèmes d'évaluation automatisés et objectifs. Nous aborderons à la fois les indicateurs de similarité lexicale (tels que BLEU et ROUGE-L), qui évaluent la structure du texte, et les indicateurs sémantiques (tels que la similarité cosinus), qui rendent compte du sens. À l’issue de ce module, les apprenants disposeront des connaissances théoriques et du code pratique nécessaires pour créer leur premier script d’évaluation automatisé.

Inclus

8 vidéos3 lectures3 devoirs3 laboratoires non notés

8 vidéosTotal 44 minutes

Comment calculer les métriques lexicales : BLEU & ROUGE-L en Python ?6 minutes
Comment calculer la similarité sémantique avec les emboîtements ?6 minutes
Pourquoi deviner quand on peut savoir ? Le cas de l'incitation "meilleure5 minutes
Le langage de l'expérimentation : hypothèses, valeurs p et puissance statistique5 minutes
Les chiffres à la loupe : Analyse des tests A/B en Python7 minutes
Du rapport à l'action : La boucle d'optimisation3 minutes
Étude de cas : Évaluation comparative d'un outil d'analyse des sentiments6 minutes
Rédiger votre premier rapport d'évaluation6 minutes

3 lecturesTotal 17 minutes

Guide d'évaluation des modèles de langage (LLM) : indicateurs lexicaux et sémantiques5 minutes
Concevoir une compétition équitable : les tests A/B pour les modèles de langage de grande envergure (LLM)7 minutes
Mise en place d'un processus d'évaluation reproductible5 minutes

3 devoirsTotal 50 minutes

Bilan des connaissances : choisir vos indicateurs10 minutes
Contrôle des connaissances : Concepts des tests statistiques10 minutes
Constituez votre boîte à outils d'évaluation des modèles de langage à grande échelle (LLM)30 minutes

3 laboratoires non notésTotal 128 minutes

Création de votre premier script d'évaluation automatisé60 minutes
Tests de Significativité statistique60 minutes
Planifier votre stratégie d'optimisation8 minutes

Lorsqu’un chatbot en production commence à fournir des réponses erronées, comment identifier le problème et y remédier ? Ce module permet aux professionnels de l’IA, aux ingénieurs en apprentissage automatique et aux analystes de données d’acquérir les compétences essentielles au débogage des modèles de langage de grande envergure (LLM) en production. Allez au-delà de la théorie et découvrez le processus systématique et axé sur les données que les professionnels utilisent pour résoudre le problème critique des « hallucinations » de l’IA. Vous serez ainsi en mesure de passer de la simple observation des défaillances de l’IA à leur diagnostic et à leur résolution de manière experte.

Inclus

5 vidéos3 lectures3 devoirs2 laboratoires non notés

5 vidéosTotal 29 minutes

Pourquoi les journaux de bord sont-ils importants ? Le cas d'Air Canada ?6 minutes
Calcul de la rétention dans Pandas6 minutes
Pourquoi le RAG échoue-t-il : la cause profonde des hallucinations ?6 minutes
Mise en relation des erreurs avec la récupération dans Pandas6 minutes
Visualisation de la démonstration avec Matplotlib5 minutes

3 lecturesTotal 28 minutes

Anatomie d'un fichier journal8 minutes
Le dossier technique : de l'analyse à l'action10 minutes
Rédaction du mémoire d'ingénierie10 minutes

3 devoirsTotal 40 minutes

Bilan des connaissances : indicateurs de rétention5 minutes
Évaluation des connaissances : communication des résultats5 minutes
Rapport de diagnostic LLM30 minutes

2 laboratoires non notésTotal 120 minutes

Laboratoire n° 1 : Segmentation des utilisateurs et identification du taux d'abandon60 minutes
Exercice n° 2 : Identification de la cause première60 minutes

Lorsqu'il s'agit de prendre des décisions de déploiement aux enjeux importants, un simple score de précision ne suffit pas. Ce module vous fournit les méthodes statistiques nécessaires pour valider de manière rigoureuse les améliorations de performances des modèles de langage à grande échelle (LLM). À l'issue de ce module, vous serez en mesure d'aller au-delà des évaluations subjectives du type « ça semble mieux » pour affirmer avec certitude « nous pouvons prouver que c'est mieux », garantissant ainsi que chaque décision de déploiement s'appuie sur des preuves statistiques solides.

Inclus

5 vidéos2 lectures3 devoirs3 laboratoires non notés

5 vidéosTotal 30 minutes

Pourquoi les notes individuelles sont trompeuses8 minutes
Calcul des intervalles de Wilson en Python4 minutes
Pourquoi l'intuition ne suffit pas dans les tests A/B6 minutes
Réalisation d'un test du chi carré en Python6 minutes
Visualiser la confiance avec Matplotlib5 minutes

2 lecturesTotal 14 minutes

Concepts fondamentaux : confiance et importance8 minutes
Raconter des histoires à l'aide de visuels statistiques6 minutes

3 devoirsTotal 40 minutes

Quiz sur les intervalles de confiance5 minutes
Quiz sur la communication des résultats5 minutes
Rapport d'évaluation du LLM30 minutes

3 laboratoires non notésTotal 110 minutes

Travail pratique n° 1 : Quantification de la précision d'un modèle20 minutes
Travail pratique n° 2 : Validation d'une amélioration du modèle30 minutes
Exercice n° 3 : Créer un tableau comparatif60 minutes

Dans le domaine de l'IA à grande échelle, des requêtes lentes et des recherches inefficaces peuvent paralyser un système. Ce module vous apporte les compétences essentielles pour éviter cela, en mettant l'accent sur des techniques pratiques d'optimisation des bases de données et des recherches vectorielles. À l'issue de ce module, vous serez en mesure d'analyser et d'optimiser systématiquement les systèmes de recherche en production, garantissant ainsi que vos applications d'IA soient non seulement puissantes, mais aussi rapides et fiables.

Inclus

4 vidéos3 lectures4 devoirs3 laboratoires non notés

4 vidéosTotal 26 minutes

De l'inefficacité à l'optimisation7 minutes
Le compromis entre le rappel et la latence5 minutes
Optimisation d'un indice HNSW8 minutes
Au-delà des tests ponctuels : la nécessité d'une analyse comparative continue5 minutes

3 lecturesTotal 25 minutes

Modèles de requêtes sécurisés et efficaces10 minutes
Comprendre les paramètres de recherche vectorielle10 minutes
Indicateurs clés d'un cadre d'analyse comparative5 minutes

4 devoirsTotal 85 minutes

Sécurité SQL et modèles15 minutes
Quiz sur les scénarios de réglage des paramètres15 minutes
Interprétation des résultats des tests de performance10 minutes
Soumettez votre rapport d'optimisation des performances45 minutes

3 laboratoires non notésTotal 140 minutes

Identification des requêtes les plus lentes à l'aide de requêtes SQL paramétrées20 minutes
Réglage des paramètres HNSW pour le rappel et la latence60 minutes
Créer une suite d'outils d'analyse comparative automatisée60 minutes

Dans ce module, vous réaliserez un audit de performance de bout en bout en comparant deux variantes de LLM à l’aide d’un ensemble de données de test A/B. Vous mettrez en place un pipeline pour calculer des indicateurs de performance clés, notamment la similarité lexicale et sémantique, et vous utiliserez des tests statistiques A/B pour valider les améliorations apportées aux modèles. Le projet aboutira à un rapport complet dans lequel vous établirez une corrélation entre les taux d’hallucinations et les journaux de recherche, puis vous synthétiserez vos conclusions sous forme de recommandations fondées sur les données à l’intention des parties prenantes, afin d’orienter la décision relative au déploiement en production dans une application d’assistance client.

Inclus

2 lectures1 devoir

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Professionals from the Industry

489 Cours112 906 apprenants

Offert par

Coursera

En savoir plus sur Apprentissage automatique

Statut : Gratuit
DeepLearning.AI
Quality and Safety for LLM Applications
Projet
Packt
LLM Engineer’s Handbook
Cours
Statut : Essai gratuit
Packt
Building and Fine-Tuning LLM Applications
Cours
Statut : Essai gratuit
Coursera
Optimize & Interface LLM Apps Effectively
Cours

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

Ce cours suppose des connaissances de base en statistiques. Il comprend des cours pratiques et appliqués sur les intervalles de confiance et les tests d'hypothèse, et propose des exemples détaillés étape par étape afin que les professionnels ayant des connaissances statistiques limitées puissent suivre facilement. Si vous débutez dans le domaine des tests d'hypothèse, pensez à suivre un petit cours de remise à niveau en statistiques.

Vous serez amené(e) à écrire des scripts d'évaluation en Python, à analyser des journaux et des ensembles de données segmentés, à réaliser des analyses de tests A/B, à utiliser SQL pour l'extraction de données et à évaluer les paramètres de recherche vectorielle (par exemple, HNSW) couramment utilisés avec les bases de données vectorielles. Aucun outil propriétaire n'est requis.

Cette formation met l'accent sur des pratiques d'ingénierie mesurables et reproductibles : pipelines d'évaluation automatisés, conception d'expériences statistiques, débogage basé sur les journaux et optimisation au niveau de la couche de données. Ces compétences vous aideront à hiérarchiser les corrections et à valider les améliorations dans des environnements de production réels.

Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.

Plus de questions

Visitez le Centre d'Aide pour les Étudiants

Aide financière disponible,

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.