Évaluer et optimiser les performances du LLM

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Évaluer et optimiser les performances du LLM

Ce cours fait partie de Spécialisation "LLM Optimisation et évaluation"

Instructeur : LearningMate

Inclus avec

Demander à Coursera

3 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Intermédiaire

Expérience recommandée

4 heures à compléter

Planning flexible

Apprenez à votre propre rythme

3 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Intermédiaire

Expérience recommandée

4 heures à compléter

Planning flexible

Apprenez à votre propre rythme

Ce que vous apprendrez

Évaluer les modèles de langage à grande échelle (LLM) à l'aide d'indicateurs tels que BLEU et ROUGE, réaliser des tests A/B pour en déterminer la signification statistique, et optimiser les performances des modèles grâce à des stratégies fondées sur les données.

Compétences que vous acquerrez

Catégorie : Développement de scripts de test
Catégorie : Prise de décision fondée sur des données
Catégorie : Analyse statistique
Catégorie : Évaluation du modèle
Catégorie : Emboîtements
Catégorie : Traitement du langage naturel
Catégorie : Modélisation des grandes langues
Catégorie : Méthodes statistiques
Catégorie : Probabilités et statistiques
Catégorie : Inférence statistique
Catégorie : Candidature au LLM
Catégorie : Tests d'hypothèses statistiques
Catégorie : Scripting
Catégorie : Mesure de la performance
Catégorie : Optimisation du modèle

Outils que vous découvrirez

Catégorie : Ingénierie rapide

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

3 affectations¹

Noté par l'IA voir l'avis de non-responsabilité

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation "LLM Optimisation et évaluation"

Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.

Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable

Il y a 3 modules dans ce cours

Vous avez intégré un puissant modèle linguistique à grande échelle (LLM) à votre application. Les premiers résultats sont impressionnants, et votre équipe est enthousiaste. Mais c’est là que les questions difficiles commencent. La nouvelle consigne est-elle vraiment meilleure que l’ancienne, ou donne-t-elle simplement une meilleure « impression » ? Comment prouver aux parties prenantes que le passage de GPT-3.5 à GPT-4 justifie le surcoût ? Lorsque deux modèles fournissent des réponses légèrement différentes, comment déterminer lequel est objectivement supérieur ?

À l’issue de cette formation, vous aurez l’assurance nécessaire pour guider votre équipe vers des décisions intelligentes et fondées sur des preuves, qui amélioreront de manière mesurable vos applications d’IA. Prêt à devenir un expert en LLM ? Il est temps d’apporter une rigueur scientifique à l’art de l’IA. Inscrivez-vous à la formation « Évaluer et optimiser les performances des LLM » et acquérez les compétences essentielles pour créer, valider et perfectionner la prochaine génération de modèles linguistiques.

Ce module d’introduction pose les bases de l’évaluation quantitative des modèles de langage à grande échelle (LLM). Les apprenants découvriront pourquoi il n’est pas viable de se fier à l’intuition pour évaluer les performances d’un modèle et exploreront les indicateurs fondamentaux utilisés pour créer des systèmes d’évaluation automatisés et objectifs. Nous aborderons à la fois les indicateurs de similarité lexicale (tels que BLEU et ROUGE-L), qui évaluent la structure du texte, et les indicateurs sémantiques (tels que la similarité cosinus), qui rendent compte du sens. À l’issue de ce module, les apprenants disposeront des connaissances théoriques et du code pratique nécessaires pour créer leur premier script d’évaluation automatisé.

Inclus

2 vidéos1 lecture1 devoir1 laboratoire non noté

2 vidéosTotal 12 minutes

Comment calculer les métriques lexicales : BLEU & ROUGE-L en Python ?6 minutes
Comment calculer la similarité sémantique avec les emboîtements ?6 minutes

1 lectureTotal 5 minutes

Guide d'évaluation des modèles de langage (LLM) : indicateurs lexicaux et sémantiques5 minutes

1 devoirTotal 10 minutes

Bilan des connaissances : choisir vos indicateurs10 minutes

1 laboratoire non notéTotal 60 minutes

Création de votre premier script d'évaluation automatisé60 minutes

Ce module permet de passer des métriques brutes à des conclusions fiables. Les apprenants découvriront pourquoi la rigueur statistique est indispensable lorsqu’on compare les résultats des grands modèles de langage (LLM). Ils apprendront à formuler des hypothèses claires, à concevoir et analyser des tests A/B, ainsi qu’à interpréter des résultats tels que les valeurs p et les intervalles de confiance afin de distinguer les gains de performance réels du bruit aléatoire. À l’issue de ce module, les apprenants seront en mesure de prendre en toute confiance des décisions fondées sur les données, en s’assurant que les modifications apportées aux prompts, aux modèles ou aux paramètres conduisent à des améliorations statistiquement significatives.

Inclus

3 vidéos1 lecture1 devoir1 laboratoire non noté

3 vidéosTotal 16 minutes

Pourquoi deviner quand on peut savoir ? Le cas de l'incitation "meilleure5 minutes
Le langage de l'expérimentation : hypothèses, valeurs p et puissance statistique5 minutes
Les chiffres à la loupe : Analyse des tests A/B en Python7 minutes

1 lectureTotal 7 minutes

Concevoir une compétition équitable : les tests A/B pour les modèles de langage de grande envergure (LLM)7 minutes

1 devoirTotal 10 minutes

Contrôle des connaissances : Concepts des tests statistiques10 minutes

1 laboratoire non notéTotal 60 minutes

Tests de Significativité statistique60 minutes

Inclus

3 vidéos1 lecture1 devoir1 laboratoire non noté

3 vidéosTotal 16 minutes

Du rapport à l'action : La boucle d'optimisation3 minutes
Étude de cas : Évaluation comparative d'un outil d'analyse des sentiments6 minutes
Rédiger votre premier rapport d'évaluation6 minutes

1 lectureTotal 5 minutes

Mise en place d'un processus d'évaluation reproductible5 minutes

1 devoirTotal 30 minutes

Projet final : Créez votre boîte à outils d'évaluation du LLM30 minutes

1 laboratoire non notéTotal 8 minutes

Planifier votre stratégie d'optimisation8 minutes

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

LearningMate

276 Cours34 751 apprenants

Offert par

Coursera

En savoir plus sur Apprentissage automatique

Statut : Essai gratuit
Simplilearn
LLM Benchmarking and Evaluation Training
Cours
Statut : Essai gratuit
Coursera
Evaluating LLM Performance and Efficiency
Cours
Statut : Essai gratuit
Coursera
Harnessing LLMs: Strategy, Fine-Tuning & Evaluation
Spécialisation
Statut : Essai gratuit
Coursera
LLM Optimization & Evaluation
Spécialisation

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.

Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.

Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.

Plus de questions

Visitez le Centre d'Aide pour les Étudiants

Aide financière disponible,

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.