Coursera

Évaluer et optimiser les performances du LLM

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Coursera

Évaluer et optimiser les performances du LLM

LearningMate

Instructeur : LearningMate

Inclus avec Coursera Plus

Demander à Coursera

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

4 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

4 heures à compléter
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Évaluer les modèles de langage à grande échelle (LLM) à l'aide d'indicateurs tels que BLEU et ROUGE, réaliser des tests A/B pour en déterminer la signification statistique, et optimiser les performances des modèles grâce à des stratégies fondées sur les données.

Compétences que vous acquerrez

  • Catégorie : Développement de scripts de test
  • Catégorie : Prise de décision fondée sur des données
  • Catégorie : Analyse statistique
  • Catégorie : Évaluation du modèle
  • Catégorie : Emboîtements
  • Catégorie : Traitement du langage naturel
  • Catégorie : Modélisation des grandes langues
  • Catégorie : Méthodes statistiques
  • Catégorie : Probabilités et statistiques
  • Catégorie : Inférence statistique
  • Catégorie : Candidature au LLM
  • Catégorie : Tests d'hypothèses statistiques
  • Catégorie : Scripting
  • Catégorie : Mesure de la performance
  • Catégorie : Optimisation du modèle

Outils que vous découvrirez

  • Catégorie : Ingénierie rapide

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation "LLM Optimisation et évaluation"
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 3 modules dans ce cours

Ce module d’introduction pose les bases de l’évaluation quantitative des modèles de langage à grande échelle (LLM). Les apprenants découvriront pourquoi il n’est pas viable de se fier à l’intuition pour évaluer les performances d’un modèle et exploreront les indicateurs fondamentaux utilisés pour créer des systèmes d’évaluation automatisés et objectifs. Nous aborderons à la fois les indicateurs de similarité lexicale (tels que BLEU et ROUGE-L), qui évaluent la structure du texte, et les indicateurs sémantiques (tels que la similarité cosinus), qui rendent compte du sens. À l’issue de ce module, les apprenants disposeront des connaissances théoriques et du code pratique nécessaires pour créer leur premier script d’évaluation automatisé.

Inclus

2 vidéos1 lecture1 devoir1 laboratoire non noté

Ce module permet de passer des métriques brutes à des conclusions fiables. Les apprenants découvriront pourquoi la rigueur statistique est indispensable lorsqu’on compare les résultats des grands modèles de langage (LLM). Ils apprendront à formuler des hypothèses claires, à concevoir et analyser des tests A/B, ainsi qu’à interpréter des résultats tels que les valeurs p et les intervalles de confiance afin de distinguer les gains de performance réels du bruit aléatoire. À l’issue de ce module, les apprenants seront en mesure de prendre en toute confiance des décisions fondées sur les données, en s’assurant que les modifications apportées aux prompts, aux modèles ou aux paramètres conduisent à des améliorations statistiquement significatives.

Inclus

3 vidéos1 lecture1 devoir1 laboratoire non noté

Ce module permet de passer des métriques brutes à des conclusions fiables. Les apprenants découvriront pourquoi la rigueur statistique est indispensable lorsqu’on compare les résultats des grands modèles de langage (LLM). Ils apprendront à formuler des hypothèses claires, à concevoir et analyser des tests A/B, ainsi qu’à interpréter des résultats tels que les valeurs p et les intervalles de confiance afin de distinguer les gains de performance réels du bruit aléatoire. À l’issue de ce module, les apprenants seront en mesure de prendre en toute confiance des décisions fondées sur les données, en s’assurant que les modifications apportées aux prompts, aux modèles ou aux paramètres conduisent à des améliorations statistiquement significatives.

Inclus

3 vidéos1 lecture1 devoir1 laboratoire non noté

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

LearningMate
276 Cours34 751 apprenants

Offert par

Coursera

En savoir plus sur Apprentissage automatique

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.