Vous maîtriserez l'art de créer des pipelines de données prêts pour la production qui traitent automatiquement des millions d'enregistrements. Dans ce cours pratique, vous concevrez des flux de travail de bout en bout qui intègrent diverses sources de données - des bases de données et API aux flux en temps réel - en utilisant des outils standard tels qu'Apache Spark, dbt et Apache Airflow. Vous apprendrez à créer des modèles de données robustes qui préservent les modifications historiques, à mettre en œuvre des optimisations de performances qui réduisent le temps de traitement de 30 % ou plus, et à construire des flux de travail automatisés avec une logique de relance intelligente et des alertes de surveillance. À la fin, vous aurez créé un système de pipeline de données complet qui démontre les compétences techniques dont les équipes d'ingénierie des données ont le plus besoin. Vous saurez comment unifier les sources de données fragmentées, appliquer des techniques de transformation avancées et garantir la fiabilité de vos pipelines à l'échelle. Cette expérience pratique se traduit directement par les défis auxquels vous serez confronté en tant qu'ingénieur de données, analyste de données ou toute personne travaillant avec des systèmes de données à grande échelle dans les organisations modernes.

Construire des pipelines de données automatisés avec Spark, dbt et Airflow
Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Construire des pipelines de données automatisés avec Spark, dbt et Airflow
Ce cours fait partie de Certificat Professionnel Ingénierie des données en open source avec Spark, dbt & Airflow

Instructeur : Professionals from the Industry
Inclus avec
Demander à Coursera
Expérience recommandée
Ce que vous apprendrez
Construisez des pipelines de données de bout en bout qui ingèrent automatiquement depuis des bases de données, des API et des flux à l'aide des outils Spark, dbt et Airflow.
Concevoir des modèles de données avec un suivi historique à l'aide de modèles SCD de type 2 afin de préserver l'historique complet des changements pour l'analyse.
Créez des flux de travail automatisés avec une logique de relance intelligente, une surveillance des accords de niveau de service et un paramétrage pour la fiabilité de la production.
Optimiser les performances des jobs Spark à l'aide de stratégies de partitionnement et de mise en cache pour obtenir des améliorations de plus de 30 % du temps d'exécution.
Compétences que vous acquerrez
- Catégorie : Traitement des données
- Catégorie : Pipelines de données
- Catégorie : Sécurité des entreprises
- Catégorie : Cartographie des données
- Catégorie : Conception de diagrammes
- Catégorie : Extraire, transformer, charger
- Catégorie : Niveau de service
- Catégorie : Transformation des données
- Catégorie : Flux de données
- Catégorie : Modélisation des données
- Catégorie : Architecture des données
- Catégorie : Entreposage de données
- Catégorie : Intégration des données
- Catégorie : Diagrammes de flux de données (DFD)
- Catégorie : Développement de bases de données
Outils que vous découvrirez
- Catégorie : Flux d'air Apache
- Catégorie : Apache Spark
Détails à connaître

Ajouter à votre profil LinkedIn
mars 2026
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise en Analyse des données
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable auprès de Coursera

Il y a 11 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeur

Offert par
En savoir plus sur Analyse des données
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Foire Aux Questions
Plus de questions
Aide financière disponible,
¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.








