Ce cours vous apprend à transformer des ensembles de données réels en ressources analytiques fiables grâce à des techniques pratiques et reproductibles de nettoyage des données. Vous apprendrez à évaluer les caractéristiques catégorielles et à sélectionner les stratégies d’encodage optimales, à mesurer et à documenter la qualité des données, ainsi qu’à appliquer des approches efficaces pour traiter les valeurs manquantes. À l’aide de Python et de pandas, vous vous exercerez à évaluer la cardinalité, à mettre en œuvre l’encodage cible, à valider l’exhaustivité avec Great Expectations et à établir une traçabilité transparente des transformations. Vous nettoierez également des champs hétérogènes tels que les âges, les valeurs aberrantes de salaire et les dates afin de garantir des résultats cohérents et prêts à être utilisés dans des modèles. Conçu pour les analystes, les ingénieurs de données et les professionnels du machine learning, ce cours vous dote des compétences professionnelles nécessaires pour préparer des ensembles de données de haute qualité permettant d’obtenir des informations fiables et de réaliser une modélisation prédictive.

Transformation de données : Nettoyer, encoder, valider
Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Transformation de données : Nettoyer, encoder, valider
Ce cours fait partie de Spécialisation "Du plan au bytecode : L'architecture des systèmes d'IA évolutifs"

Instructeur : ansrsource instructors
Inclus avec
Expérience recommandée
Ce que vous apprendrez
Évaluer et encoder les caractéristiques catégorielles à l'aide de stratégies optimales, tout en mesurant et en documentant la qualité des données avec Great Expectations.
Nettoyer les champs de données brutes issues du monde réel et établir une traçabilité des transformations en Python et avec pandas afin de produire des ensembles de données fiables et prêts à être utilisés dans des modèles.
Compétences que vous acquerrez
- Catégorie : Qualité des données
- Catégorie : Intégrité des données
- Catégorie : Documentation technique
- Catégorie : Ingénierie des fonctionnalités
- Catégorie : Analyse exploratoire des données
- Catégorie : Traitement des données
- Catégorie : Transformation des données
- Catégorie : Manipulation de données
- Catégorie : Modélisation prédictive
- Catégorie : Prétraitement des données
- Catégorie : Validation des données
- Catégorie : Nettoyage des données
- Catégorie : Assurance qualité
- Catégorie : Analyse descriptive
Outils que vous découvrirez
- Catégorie : Pandas (paquetage Python)
Détails à connaître

Ajouter à votre profil LinkedIn
mars 2026
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a un module dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeur

Offert par
En savoir plus sur Gestion des données
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuitCoursera
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Foire Aux Questions
Plus de questions
Aide financière disponible,
¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.




