Coursera

Pipelines de données ML et communication d'informations sur l'IA

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Coursera

Pipelines de données ML et communication d'informations sur l'IA

Inclus avec Coursera Plus

Demander à Coursera

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Mettre en place des pipelines de données d'apprentissage automatique évolutifs pour collecter, nettoyer et valider des ensembles de données destinés aux workflows d'apprentissage automatique

  • Appliquer des techniques de transformation des données et d'ingénierie des caractéristiques afin d'améliorer les performances du modèle

  • Analyser des ensembles de données et communiquer les conclusions tirées à l'aide de visualisations et de rapports analytiques

  • Décomposer les problèmes complexes d'apprentissage automatique en composants modulaires afin d'obtenir des solutions d'IA évolutives

Compétences que vous acquerrez

  • Catégorie : Présentation des données
  • Catégorie : Tests A/B
  • Catégorie : Traitement des données
  • Catégorie : Transformation des données
  • Catégorie : Récit de données
  • Catégorie : Extraire, transformer, charger
  • Catégorie : Prétraitement des données
  • Catégorie : Qualité des données
  • Catégorie : Pipelines de données
  • Catégorie : Modèle de formation
  • Catégorie : Visualisation des données
  • Catégorie : Analyse des données
  • Catégorie : Prise de décision fondée sur des données
  • Catégorie : Ingénierie des fonctionnalités
  • Catégorie : Évaluation du modèle
  • Catégorie : Apprentissage automatique
  • Catégorie : Gouvernance des données

Outils que vous découvrirez

  • Catégorie : Pandas (paquetage Python)
  • Catégorie : Apache Spark
  • Catégorie : PySpark

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

mars 2026

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise en Apprentissage automatique

Ce cours fait partie de la Certificat Professionnel Transformers Unleashed : Maîtriser l'architecture de l'IA moderne
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à ce Certificat Professionnel.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable auprès de Coursera

Il y a 9 modules dans ce cours

Vous mettrez en œuvre des pipelines ETL pour extraire, nettoyer et partitionner de grands ensembles de données en vue de l'entraînement des modèles. Vous organiserez des flux de travail permettant de préparer des données évolutives et prêtes pour le machine learning à l'aide d'outils de niveau production.

Inclus

3 vidéos1 lecture1 devoir

Vous évaluerez la qualité des données, leur traçabilité et les pratiques de gouvernance afin de garantir la reproductibilité des flux de travail d'apprentissage automatique. Vous mettrez en place des contrôles de validation et des normes de documentation favorisant la traçabilité et la confiance.

Inclus

2 vidéos2 lectures2 devoirs1 laboratoire non noté

Vous mettrez en œuvre des techniques de jointure, d'agrégation et de transformation des données à l'aide de SQL et de Pandas. Vous préparerez des ensembles de données structurés permettant une analyse et une visualisation précises.

Inclus

3 vidéos2 lectures2 devoirs1 laboratoire non noté

Vous évaluerez les conclusions analytiques à la lumière des hypothèses et traduirez les résultats en informations claires, sous forme visuelle et écrite. Vous communiquerez les tendances et les implications de manière à faciliter la prise de décision des parties prenantes.

Inclus

3 vidéos2 lectures2 devoirs

Vous analyserez les résultats de l'analyse exploratoire des données afin d'orienter les décisions relatives à l'ingénierie des caractéristiques. Vous identifierez des tendances, des différences entre les segments et des signaux statistiques permettant d'améliorer les données d'entrée du modèle.

Inclus

3 vidéos2 lectures2 devoirs

Vous évaluerez les performances du modèle et son impact sur l'activité à l'aide de tests A/B. Vous interpréterez les résultats des expériences et établirez un lien entre les variations de performances et les résultats mesurables en termes de retour sur investissement.

Inclus

2 vidéos2 lectures2 devoirs1 laboratoire non noté

Vous analyserez des problèmes complexes liés à l'apprentissage automatique en les décomposant en sous-tâches modulaires et réutilisables. Vous identifierez les composants essentiels du système et définirez des limites claires entre eux.

Inclus

4 vidéos1 lecture1 devoir1 laboratoire non noté

Vous créerez des représentations abstraites, telles que des organigrammes et du pseudocode, afin de guider la mise en œuvre de solutions d'apprentissage automatique. Vous concevrez des artefacts favorisant la clarté, l'évolutivité et la cohérence technique.

Inclus

2 vidéos1 lecture2 devoirs

Dans le cadre de ce projet, vous devrez concevoir et mettre en œuvre un pipeline de données d’apprentissage automatique de type production, capable de transformer des données brutes structurées en un ensemble de données prêt à être utilisé par un modèle et de générer des informations exploitables. Vous simulerez le travail d’une équipe d’ingénieurs en IA chargée de préparer les données pour la modélisation prédictive et de communiquer les résultats aux parties prenantes. Votre pipeline ingérera les données brutes, effectuera le prétraitement et l’ingénierie des caractéristiques, entraînera un modèle d’apprentissage automatique simple et évaluera ses performances à l’aide de métriques appropriées. Au-delà de la mise en œuvre du pipeline, vous analyserez les résultats du modèle et rédigerez un bref rapport d’analyse expliquant les principales conclusions, les implications en termes de performances du modèle et les améliorations potentielles à apporter au pipeline. Le livrable final est un script ou un notebook Python prêt à être intégré à votre portfolio, accompagné d’une analyse structurée démontrant votre capacité à construire des pipelines de données fiables et à communiquer des informations issues de l’IA dans un contexte professionnel.

Inclus

2 lectures1 devoir

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Professionals from the Industry
486 Cours111 611 apprenants

Offert par

Coursera

En savoir plus sur Apprentissage automatique

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.