Coursera

Qualité des données et débogage pour des pipelines fiables

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Coursera

Qualité des données et débogage pour des pipelines fiables

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Débutant

Expérience recommandée

7 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Débutant

Expérience recommandée

7 heures à compléter
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Définissez et automatisez les tests de qualité des données à l'aide de YAML afin de valider le nombre de lignes, les seuils de valeurs nulles et l'unicité des données dans l'ensemble des jeux de données du pipeline.

  • Suivre les anomalies des données à chaque étape du pipeline en analysant les journaux et les tableaux de bord afin d'identifier et de corriger la cause exacte de la défaillance.

  • Utilisez des outils de débogage Python avancés — notamment les points d'arrêt conditionnels, les points de surveillance et pdb — pour diagnostiquer et résoudre les problèmes liés au pipeline.

  • Résolvez les bogues complexes liés à la concurrence en analysant les traces de pile et en recoupant les journaux des threads afin d'identifier les interblocages et les conditions de concurrence dans le code.

Compétences que vous acquerrez

  • Catégorie : Optimisation des performances
  • Catégorie : Gestion de la mémoire
  • Catégorie : Intégrité des données
  • Catégorie : Fiabilité
  • Catégorie : CI/CD
  • Catégorie : Débogage
  • Catégorie : Qualité des données
  • Catégorie : Automatisation des tests
  • Catégorie : Pipelines de données
  • Catégorie : Intégrations AI
  • Catégorie : Analyse des causes profondes
  • Catégorie : Outils de test
  • Catégorie : Validation des données
  • Catégorie : Détection des anomalies

Outils que vous découvrirez

  • Catégorie : YAML
  • Catégorie : IA générative
  • Catégorie : Programmation Python

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

mars 2026

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise en Analyse des données

Ce cours fait partie de la Certificat Professionnel Ingénierie des données en open source avec Spark, dbt & Airflow
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à ce Certificat Professionnel.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable auprès de Coursera

Il y a 8 modules dans ce cours

Vous acquerrez des connaissances de base sur les cadres de référence en matière de qualité des données et définirez des approches systématiques pour tester l'intégrité des données par le biais de validations portant sur le volume, l'exhaustivité et l'unicité.

Inclus

3 vidéos1 lecture1 devoir

Vous mettrez en œuvre des tests automatisés de qualité des données à l'aide d'une configuration YAML et d'outils conformes aux normes du secteur, afin de créer des systèmes de validation prêts pour la production, dotés de contrôles de qualité et de fonctionnalités de surveillance.

Inclus

2 vidéos3 lectures2 devoirs1 laboratoire non noté

Vous apprendrez une méthodologie systématique d'analyse des causes profondes des anomalies dans les pipelines de données, grâce à l'analyse des tableaux de bord de surveillance et à des techniques d'investigation méthodiques.

Inclus

1 vidéo2 lectures1 devoir1 laboratoire non noté

Vous mettrez en œuvre des stratégies efficaces pour garantir l'intégrité des canalisations grâce à des interventions ciblées, des techniques de validation et des procédures de remise en état systématiques.

Inclus

2 vidéos2 lectures2 devoirs

Vous apprendrez des approches systématiques de débogage à l'aide de points d'arrêt conditionnels, de l'inspection de la mémoire et de techniques d'analyse méthodiques, afin de passer d'un débogage par essais et erreurs à une résolution efficace des problèmes dans les pipelines de données Python.

Inclus

3 vidéos1 lecture2 devoirs

Vous développerez des approches systématiques pour interpréter des traces de pile complexes, établir des corrélations entre les modèles de journaux et reconstituer des scénarios de défaillance dans des environnements Python multithread, afin d'identifier les problèmes de concurrence tels que les blocages (deadlocks) et les conditions de course (race conditions).

Inclus

3 vidéos1 lecture2 devoirs1 laboratoire non noté

Vous mettrez en place un système complet de surveillance de la qualité des données en développant des tests automatisés, en analysant les anomalies dans les données et en résolvant les problèmes complexes liés aux pipelines. Ce projet intègre des cadres de référence en matière de qualité des données, des techniques d'analyse des causes profondes et des compétences avancées en débogage au sein d'une solution unique prête à être déployée en production.

Inclus

4 lectures1 devoir

Vous découvrirez comment les outils d'IA générative améliorent les workflows d'ingénierie des données dans les domaines du DevOps, de l'optimisation des performances et de l'assurance qualité. Vous découvrirez des applications concrètes de l'assistance par l'IA dans le contrôle de version, la conteneurisation, l'automatisation CI/CD, l'optimisation des requêtes et le débogage.

Inclus

3 lectures1 devoir

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Professionals from the Industry
484 Cours110 888 apprenants

Offert par

Coursera

En savoir plus sur Analyse des données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.