Coursera

Construire des pipelines de données automatisés avec Spark, dbt et Airflow

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Coursera

Construire des pipelines de données automatisés avec Spark, dbt et Airflow

Inclus avec Coursera Plus

Demander à Coursera

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Débutant

Expérience recommandée

9 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Débutant

Expérience recommandée

9 heures à compléter
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Construisez des pipelines de données de bout en bout qui ingèrent automatiquement depuis des bases de données, des API et des flux à l'aide des outils Spark, dbt et Airflow.

  • Concevoir des modèles de données avec un suivi historique à l'aide de modèles SCD de type 2 afin de préserver l'historique complet des changements pour l'analyse.

  • Créez des flux de travail automatisés avec une logique de relance intelligente, une surveillance des accords de niveau de service et un paramétrage pour la fiabilité de la production.

  • Optimiser les performances des jobs Spark à l'aide de stratégies de partitionnement et de mise en cache pour obtenir des améliorations de plus de 30 % du temps d'exécution.

Compétences que vous acquerrez

  • Catégorie : Traitement des données
  • Catégorie : Pipelines de données
  • Catégorie : Sécurité des entreprises
  • Catégorie : Cartographie des données
  • Catégorie : Conception de diagrammes
  • Catégorie : Extraire, transformer, charger
  • Catégorie : Niveau de service
  • Catégorie : Transformation des données
  • Catégorie : Flux de données
  • Catégorie : Modélisation des données
  • Catégorie : Architecture des données
  • Catégorie : Entreposage de données
  • Catégorie : Intégration des données
  • Catégorie : Diagrammes de flux de données (DFD)
  • Catégorie : Développement de bases de données

Outils que vous découvrirez

  • Catégorie : Flux d'air Apache
  • Catégorie : Apache Spark

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

mars 2026

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise en Analyse des données

Ce cours fait partie de la Certificat Professionnel Ingénierie des données en open source avec Spark, dbt & Airflow
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à ce Certificat Professionnel.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable auprès de Coursera

Il y a 11 modules dans ce cours

Vous apprendrez les concepts fondamentaux et les outils nécessaires pour créer une documentation visuelle systématique des architectures de pipelines de données.

Inclus

3 vidéos2 lectures1 devoir

Vous appliquerez des techniques avancées pour créer des diagrammes de flux de données de qualité professionnelle qui représentent avec précision les systèmes de données complexes de l'entreprise et soutiennent la collaboration des parties prenantes.

Inclus

2 vidéos2 lectures3 devoirs

Vous établirez la compréhension fondamentale et les compétences de base pour créer des étapes modulaires de pipeline de données, en vous concentrant sur les principes de séparation des préoccupations et les fondamentaux de l'intégration des outils.

Inclus

1 vidéo1 lecture1 devoir

Vous mettrez en œuvre des pipelines de données complets de bout en bout en intégrant des composants modulaires avec des outils standard de l'industrie, ce qui aboutira à une évaluation complète de leurs capacités de développement de pipelines.

Inclus

2 lectures3 devoirs

Vous établirez les connaissances de base de l'architecture des connecteurs et réaliserez leur première configuration de connecteur de base de données à l'aide d'Airbyte.

Inclus

2 vidéos2 lectures1 devoir

Vous mettrez en œuvre une intégration complète de données multi-sources en configurant des connecteurs de streaming et d'API, en appliquant des modèles de sécurité d'entreprise et en démontrant votre maîtrise par une configuration complète des connecteurs.

Inclus

2 vidéos2 lectures2 devoirs

Vous comprendrez les concepts fondamentaux de la logique SCD2 et commencerez à appliquer ces principes pour créer des modèles de données qui préservent le contexte historique dans les entrepôts de données des entreprises.

Inclus

3 vidéos1 lecture1 devoir

Vous mettrez en œuvre des modèles SCD2 prêts pour la production en utilisant dbt, en créant des systèmes automatisés de suivi historique avec une détection appropriée des changements, des périodes de validité et une gestion de l'état actuel.

Inclus

2 vidéos2 lectures3 devoirs

Vous comprendrez les concepts fondamentaux et les principes de conception pour créer des flux de données robustes avec Apache Airflow.

Inclus

3 vidéos1 lecture1 devoir

Vous mettrez en œuvre des flux de travail Airflow de niveau production avec des mécanismes de réessai, une surveillance des accords de niveau de service et une paramétrisation pour une résilience des pipelines de données prête à l'emploi.

Inclus

2 vidéos1 lecture2 devoirs1 laboratoire non noté

Vous intégrerez des compétences en ingénierie des données pour construire un pipeline de données automatisé complet qui traite diverses sources de données, applique un suivi historique et orchestre des flux de travail. Ce projet synthétise les capacités de cartographie, de transformation, d'intégration, de modélisation et d'automatisation dans un système de données prêt à la production.

Inclus

4 lectures1 devoir

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Professionals from the Industry
487 Cours112 316 apprenants

Offert par

Coursera

En savoir plus sur Analyse des données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.