Coursera

Ingénieur, Validation et Gouvernance des données de ML

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Coursera

Ingénieur, Validation et Gouvernance des données de ML

Ce cours fait partie de plusieurs programmes.

ansrsource instructors

Instructeur : ansrsource instructors

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

2 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

2 heures à compléter
Planning flexible
Apprenez à votre propre rythme

Compétences que vous acquerrez

  • Catégorie : Gouvernance des données
  • Catégorie : Gestion des données
  • Catégorie : Tenue de registres

Outils que vous découvrirez

  • Catégorie : Apache Spark
  • Catégorie : Flux d'air Apache
  • Catégorie : Databricks
  • Catégorie : PySpark

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

mars 2026

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours est disponible dans le cadre de
Lorsque vous vous inscrivez à ce cours, vous devez également sélectionner un programme spécifique.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a un module dans ce cours

Cette courte formation vous aide à construire et à valider des pipelines de données prêts pour le ML en toute confiance. Vous commencerez par apprendre à concevoir des flux de travail ETL qui ingèrent, nettoient et partitionnent de grands ensembles de données à l'aide d'outils comme Airflow et Spark. Vous verrez comment des équipes réelles gèrent les journaux de flux de clics, traitent les données nulles et préparent des données d'entraînement partitionnées à l'échelle. Ensuite, vous évaluerez la qualité des données, la gouvernance et le lignage afin que vos pipelines restent fiables et reproductibles. Vous travaillerez avec des techniques pratiques telles que les contrôles de dérive des schémas, les suites d'attentes et les enregistrements de lignage prêts pour l'audit. Grâce à de courtes vidéos, des lectures appliquées, des exercices pratiques et une évaluation finale notée, vous repartirez en sachant comment concevoir des pipelines fiables et les valider pour une utilisation en production.

Inclus

6 vidéos3 lectures3 devoirs1 laboratoire non noté

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

ansrsource instructors
245 Cours17 867 apprenants

Offert par

Coursera

En savoir plus sur Apprentissage automatique

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.