Ce cours vous apprend à transformer des ensembles de données réels en ressources analytiques fiables grâce à des techniques pratiques et reproductibles de nettoyage des données. Vous apprendrez à évaluer les caractéristiques catégorielles et à sélectionner les stratégies d’encodage optimales, à mesurer et à documenter la qualité des données, ainsi qu’à appliquer des approches efficaces pour traiter les valeurs manquantes. À l’aide de Python et de pandas, vous vous exercerez à évaluer la cardinalité, à mettre en œuvre l’encodage cible, à valider l’exhaustivité avec Great Expectations et à établir une traçabilité transparente des transformations. Vous nettoierez également des champs hétérogènes tels que les âges, les valeurs aberrantes de salaire et les dates afin de garantir des résultats cohérents et prêts à être utilisés dans des modèles. Conçu pour les analystes, les ingénieurs de données et les professionnels du machine learning, ce cours vous dote des compétences professionnelles nécessaires pour préparer des ensembles de données de haute qualité permettant d’obtenir des informations fiables et de réaliser une modélisation prédictive.

Ingénierie des données et fiabilité des pipelines pour l'apprentissage automatique
Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Ingénierie des données et fiabilité des pipelines pour l'apprentissage automatique
Ce cours fait partie de Spécialisation "L'apprentissage automatique simplifié pour les ingénieurs logiciels"

Instructeur : Professionals from the Industry
Inclus avec
Demander à Coursera
Expérience recommandée
Ce que vous apprendrez
Transformer et valider les données destinées à l'apprentissage automatique à l'aide de techniques d'encodage, de nettoyage et d'assurance qualité des données
Concevoir et coordonner des pipelines de données d'apprentissage automatique garantissant la fiabilité, l'actualité et les performances des pipelines
Gérer le développement reproductible en apprentissage automatique à l'aide d'outils de contrôle de version et de gestion d'environnement
Compétences que vous acquerrez
- Catégorie : Traitement des données
- Catégorie : MLOps (Machine Learning Operations)
- Catégorie : Pipelines de données
- Catégorie : Gestion des paquets et des logiciels
- Catégorie : Intégration des données
- Catégorie : Environnement de développement
- Catégorie : Transformation des données
- Catégorie : Ingénierie des fonctionnalités
- Catégorie : Assurance qualité
- Catégorie : Qualité des données
- Catégorie : Prétraitement des données
- Catégorie : Nettoyage des données
- Catégorie : Gestion des coûts
- Catégorie : Flux de données
- Catégorie : Extraire, transformer, charger
- Catégorie : Environnement virtuel
- Catégorie : Analyse exploratoire des données
- Catégorie : Utilisation des ressources
Outils que vous découvrirez
- Catégorie : Flux d'air Apache
- Catégorie : Git (système de contrôle de version)
Détails à connaître

Ajouter à votre profil LinkedIn
mars 2026
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 10 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeur

Offert par
En savoir plus sur Gestion des données
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Foire Aux Questions
Plus de questions
Aide financière disponible,
¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.




