Vous développerez les compétences en diagnostic et en prévention nécessaires pour garantir la fiabilité et la préparation à la production des pipelines de données. Dans cette formation, vous apprendrez à définir des tests automatisés de qualité des données, à remonter à la source des anomalies et à appliquer des techniques avancées de débogage en Python pour résoudre les défaillances complexes des pipelines — trois compétences que les employeurs recherchent systématiquement chez les ingénieurs de données.

Qualité des données et débogage pour des pipelines fiables
Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Qualité des données et débogage pour des pipelines fiables
Ce cours fait partie de Certificat Professionnel Ingénierie des données en open source avec Spark, dbt & Airflow

Instructeur : Professionals from the Industry
Inclus avec
Expérience recommandée
Ce que vous apprendrez
Définissez et automatisez les tests de qualité des données à l'aide de YAML afin de valider le nombre de lignes, les seuils de valeurs nulles et l'unicité des données dans l'ensemble des jeux de données du pipeline.
Suivre les anomalies des données à chaque étape du pipeline en analysant les journaux et les tableaux de bord afin d'identifier et de corriger la cause exacte de la défaillance.
Utilisez des outils de débogage Python avancés — notamment les points d'arrêt conditionnels, les points de surveillance et pdb — pour diagnostiquer et résoudre les problèmes liés au pipeline.
Résolvez les bogues complexes liés à la concurrence en analysant les traces de pile et en recoupant les journaux des threads afin d'identifier les interblocages et les conditions de concurrence dans le code.
Compétences que vous acquerrez
- Catégorie : Optimisation des performances
- Catégorie : Gestion de la mémoire
- Catégorie : Intégrité des données
- Catégorie : Fiabilité
- Catégorie : CI/CD
- Catégorie : Débogage
- Catégorie : Qualité des données
- Catégorie : Automatisation des tests
- Catégorie : Pipelines de données
- Catégorie : Intégrations AI
- Catégorie : Analyse des causes profondes
- Catégorie : Outils de test
- Catégorie : Validation des données
- Catégorie : Détection des anomalies
Outils que vous découvrirez
- Catégorie : YAML
- Catégorie : IA générative
- Catégorie : Programmation Python
Détails à connaître

Ajouter à votre profil LinkedIn
mars 2026
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise en Analyse des données
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable auprès de Coursera

Il y a 8 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeur

Offert par
En savoir plus sur Analyse des données
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Foire Aux Questions
Plus de questions
Aide financière disponible,
¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.




