Edureka

Lakehouse Architecture et Delta Lake avec Databricks

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Edureka

Lakehouse Architecture et Delta Lake avec Databricks

Edureka

Instructeur : Edureka

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Concevoir et mettre en œuvre des architectures « Lakehouse » à l'aide de Databricks et de Delta Lake afin de remplacer les plateformes de données existantes

  • Mettre en place des pipelines de données de bout en bout à l'aide de l'architecture Medallion (Bronze, Silver, Gold), avec traitement incrémental et capture des données modifiées (Change Data Capture)

  • Appliquer les techniques d'optimisation des performances de Delta Lake — notamment le saut de données, la compaction des fichiers et le « Liquid Clustering » — pour prendre en charge les charges de travail liées à la BI et au ML

  • Gérer la fiabilité des données en environnement de production grâce aux transactions ACID, au « time travel », à l'application des schémas et au contrôle de la concurrence

Compétences que vous acquerrez

  • Catégorie : Évolutivité
  • Catégorie : Technologies de stockage des données
  • Catégorie : Qualité des données
  • Catégorie : SQL
  • Catégorie : Optimisation des performances
  • Catégorie : Intégration des données
  • Catégorie : Données en temps réel
  • Catégorie : Pipelines de données
  • Catégorie : Gestion des données
  • Catégorie : Traitement des transactions
  • Catégorie : Big Data
  • Catégorie : Architecture des données
  • Catégorie : Entreposage de données
  • Catégorie : Infrastructure de données
  • Catégorie : Traitement des données

Outils que vous découvrirez

  • Catégorie : Databricks
  • Catégorie : Lacs de données
  • Catégorie : Apache Spark

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

février 2026

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Il y a 4 modules dans ce cours

Ce module présente l'évolution des plateformes de données modernes, depuis les entrepôts de données traditionnels et les lacs de données jusqu'à l'architecture unifiée « Lakehouse ». Les apprenants explorent les concepts fondamentaux de Databricks, Apache Spark et Delta Lake qui permettent un traitement des données évolutif, fiable et gouverné.

Inclus

15 vidéos5 lectures4 devoirs

Ce module est consacré aux fonctionnalités CORE de Delta Lake, notamment l'architecture de stockage, la gestion des métadonnées, le traitement transactionnel et le contrôle des schémas. Les participants acquièrent une expérience pratique des opérations CRUD, des pipelines de données incrémentiels, de la fonction « Time Travel » et du streaming afin de mettre en place des flux de données fiables et prêts à être déployés en production.

Inclus

12 vidéos4 lectures4 devoirs

Ce module est consacré à la conception d'architectures « Lakehouse » évolutives à l'aide des modèles Medallion, ainsi qu'à l'optimisation de Delta Lake en termes de performances et de rentabilité. Les participants apprennent à créer des pipelines de données multicouches et à appliquer des techniques d'optimisation avancées pour prendre en charge les charges de travail liées à la BI et au machine learning.

Inclus

13 vidéos5 lectures4 devoirs

Ce module est consacré à la conception d'architectures « Lakehouse » évolutives à l'aide des modèles Medallion, ainsi qu'à l'optimisation de Delta Lake en termes de performances et de rentabilité. Les participants apprennent à créer des pipelines de données multicouches et à appliquer des techniques d'optimisation avancées pour prendre en charge les charges de travail liées à la BI et au machine learning.

Inclus

9 vidéos3 lectures4 devoirs

Instructeur

Edureka
Edureka
211 Cours190 700 apprenants

Offert par

Edureka

En savoir plus sur Gestion des données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.