Quand recevrai-je mon certificat de cours ?

Si vous terminez le cours avec succès, votre certificat de cours électronique sera ajouté à votre page de réalisations - de là, vous pouvez imprimer votre certificat de cours ou l'ajouter à votre profil LinkedIn.

Pourquoi ne puis-je pas suivre ce cours ?

Ce cours n'est actuellement accessible qu'aux apprenants qui ont payé ou reçu une aide financière, le cas échéant.

Une aide financière est-elle disponible ?

Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.

Construire des applications de données modernes en utilisant Databricks Lakehouse

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Construire des applications de données modernes en utilisant Databricks Lakehouse

Instructeur : Packt - Course Instructors

Inclus avec

Demander à Coursera

10 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Débutant

Expérience recommandée

1 semaine à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

10 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Débutant

Expérience recommandée

1 semaine à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

Ce que vous apprendrez

Déployer des pipelines de données en temps quasi réel à l'aide de Delta Live Tables
Orchestrer les pipelines de données avec les workflows Databricks
Mettre en œuvre la validation des données et contrôler leur qualité

Compétences que vous acquerrez

Catégorie : Gestion des données
Catégorie : Intégrité des données
Catégorie : Évolutivité
Catégorie : Validation des données
Catégorie : Qualité des données
Catégorie : Infrastructure de données
Catégorie : Stockage des données
Catégorie : Architecture des données
Catégorie : Données en temps réel
Catégorie : Gouvernance des données
Catégorie : Informatique en nuage
Catégorie : Sécurité des données
Catégorie : Transformation des données
Catégorie : Pipelines de données

Outils que vous découvrirez

Catégorie : Lacs de données
Catégorie : Apache Spark
Catégorie : Databricks
Catégorie : Terraform

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

10 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Il y a 10 modules dans ce cours

Dans le monde actuel axé sur les données, la création d'applications de données évolutives et efficaces est cruciale pour rester à la pointe des affaires et de la technologie. Ce cours explore la puissance de Databricks Lakehouse, une plateforme unifiée pour la gestion et l'analyse de grands volumes de données, et vous guide à travers les compétences essentielles pour créer des applications de données modernes. Tout au long du cours, vous apprendrez à travailler avec Delta Live Tables pour la transformation, la gestion et l'assurance qualité des données. Vous plongerez également dans le catalogue Unity de Databricks pour améliorer la gouvernance, le lignage des données et la gestion des emplacements. L'expérience pratique du déploiement et de la maintenance des pipelines DLT à l'aide de Terraform vous prépare à relever les défis de l'infrastructure de données dans le monde réel. Ce cours se distingue par la combinaison de la compréhension théorique et des applications pratiques dans le monde réel. Vous obtiendrez un ensemble robuste de compétences dans la gestion, la gouvernance et la surveillance des pipelines de données, vous préparant à construire des applications de données de niveau production avec Databricks Lakehouse. Conçu pour les professionnels qui cherchent à approfondir leur expertise dans l'architecture de données moderne, ce cours convient aux ingénieurs de données, aux scientifiques de données et aux professionnels de l'informatique qui veulent tirer parti de Databricks pour résoudre les problèmes de données du monde réel.

Dans cette section, nous explorons les pipelines de données en temps réel avec Delta Live Tables (DLT), analysons l'architecture Delta Lake et concevons des solutions de streaming évolutives pour les environnements Lakehouse

Inclus

2 vidéos6 lectures1 devoir

2 vidéosTotal 2 minutes

Aperçu du cours1 minute
Introduction aux tables en direct Delta - Vidéo de présentation1 minute

6 lecturesTotal 60 minutes

Introduction10 minutes
Le chalet des Databricks10 minutes
Points de vue10 minutes
Catalogue Unity10 minutes
Prise en charge des lectures et écritures simultanées dans les tables10 minutes
Suivi des modifications des tables à l'aide du flux de données de modification10 minutes

1 devoirTotal 10 minutes

Principes de base des tables vivantes Delta10 minutes

Dans cette section, nous abordons l'ingestion de données avec la DLT, l'application de modifications et la configuration de pipelines pour l'évolutivité.

Inclus

1 vidéo6 lectures1 devoir

1 vidéoTotal 1 minute

Appliquer des Transformation de données en cours d'utilisation des Tables directes de Delta - Vidéo de présentation1 minute

6 lecturesTotal 70 minutes

Introduction10 minutes
Utilisation de l'Auto Loader avec DLT10 minutes
Publication d'ensembles de données dans Unity Catalog10 minutes
Paramètres du pipeline de données10 minutes
Types de grappes de pipelines10 minutes
Chargement des dépendances externes20 minutes

1 devoirTotal 10 minutes

Mastering Delta Live Tables Pipelines10 minutes

Dans cette section, nous examinons la mise en œuvre des attentes en matière de qualité des données dans les pipelines DLT, la validation de l'intégrité des données avec des ensembles de données temporaires et la mise en quarantaine des données de mauvaise qualité en vue de leur correction.

Inclus

1 vidéo4 lectures1 devoir

1 vidéoTotal 1 minute

Gestion de la qualité des données à l'aide de Delta Live Tables - Vidéo de présentation1 minute

4 lecturesTotal 50 minutes

Introduction10 minutes
Utilisation d'ensembles de données temporaires pour valider le traitement des données10 minutes
Création d'une nouvelle définition de pipeline DLT10 minutes
Agir sur des attentes déçues20 minutes

1 devoirTotal 10 minutes

Gestion de la qualité des données dans les tables Delta Live10 minutes

Dans cette section, nous abordons la mise à l'échelle des pipelines DLT par le biais de l'optimisation des clusters, de la mise à l'échelle automatique et des techniques Delta Lake.

Inclus

1 vidéo4 lectures1 devoir

1 vidéoTotal 1 minute

Mise à l'échelle des pipelines DLT - Vidéo de présentation1 minute

4 lecturesTotal 40 minutes

Introduction10 minutes
Tâches automatisées de maintenance des tableaux10 minutes
Rapprocher le calcul des données10 minutes
Delta Lake Z-Ordering on Merge Columns (Ordre en Z du lac Delta sur les colonnes de fusion)10 minutes

1 devoirTotal 10 minutes

Optimisation et mise à l'échelle du pipeline DLT10 minutes

Dans cette section, nous explorons la mise en œuvre de la gouvernance des données dans un Lakehouse à l'aide d'Unity Catalog, en nous concentrant sur les contrôles d'accès, la découverte des données et le suivi de la lignée pour la conformité et la sécurité.

Inclus

1 vidéo7 lectures1 devoir

1 vidéoTotal 1 minute

Maîtriser la gouvernance des données dans le Lakehouse avec Unity Catalog - Vidéo de présentation1 minute

7 lecturesTotal 55 minutes

Introduction5 minutes
Un problème qui mérite d'être résolu10 minutes
Types de clusters compatibles avec le catalogue Unity5 minutes
Activation de Unity Catalog sur un espace de travail Databricks existant5 minutes
Découverte de données et catalogage10 minutes
Observabilité avec les tableaux des systèmes10 minutes
Exemple pratique de masquage de données pour les ensembles de données de santé10 minutes

1 devoirTotal 10 minutes

Gouvernance des données dans le Lakehouse avec Unity Catalog10 minutes

Dans cette section, nous abordons la gestion des emplacements de stockage des données dans Unity Catalog avec une gouvernance et un contrôle d'accès sécurisés.

Inclus

1 vidéo3 lectures1 devoir

1 vidéoTotal 1 minute

Gestion des emplacements de données dans Unity Catalog - Vidéo de présentation1 minute

3 lecturesTotal 60 minutes

Introduction10 minutes
Enregistrement de données sur des volumes de stockage dans Unity Catalog20 minutes
Création et gestion d'emplacements de stockage externes dans Unity Catalog30 minutes

1 devoirTotal 10 minutes

Gestion et sécurité des données dans le catalogue Unity10 minutes

Dans cette section, nous explorons le lignage des données dans Unity Catalog, en retraçant les origines, en visualisant les transformations et en identifiant les dépendances pour garantir l'intégrité des données et la détection proactive des problèmes.

Inclus

1 vidéo3 lectures1 devoir

Dans cette section, nous couvrons le déploiement et la gestion des pipelines DLT à l'aide de Terraform dans Databricks.

Inclus

1 vidéo4 lectures1 devoir

1 vidéoTotal 1 minute

Déployer, maintenir et administrer des pipelines DLT à l'aide de Terraform - Vidéo de présentation1 minute

4 lecturesTotal 60 minutes

Introduction30 minutes
Application des modifications de l'espace de travail10 minutes
Catalogue10 minutes
Définition des ressources Terraform10 minutes

1 devoirTotal 10 minutes

Principes fondamentaux de Terraform et du pipeline DLT10 minutes

Dans cette section, nous explorons les Databricks Asset Bundles (DAB) pour rationaliser le déploiement des pipelines de données, en mettant l'accent sur l'intégration GitHub, le contrôle des versions et la collaboration entre équipes.

Inclus

1 vidéo4 lectures1 devoir

1 vidéoTotal 1 minute

Tirer parti de Databricks Asset Bundles pour rationaliser le déploiement des pipelines de données - Vidéo de présentation1 minute

4 lecturesTotal 60 minutes

Introduction20 minutes
Databricks Asset Bundles en action20 minutes
Exercice pratique Déploiement de votre premier DAB10 minutes
Exercice pratique Simplifier la collaboration entre équipes avec les actions GitHub10 minutes

1 devoirTotal 10 minutes

Rationaliser le déploiement des pipelines de données avec Databricks10 minutes

Dans cette section, nous explorons la surveillance des pipelines de données à l'aide de Databricks, en nous concentrant sur la santé, les performances et la qualité des données. Les techniques incluent les alertes DBSQL et les déclencheurs webhook pour la résolution des problèmes en temps réel.

Inclus

1 vidéo4 lectures1 devoir

1 vidéoTotal 1 minute

Surveillance des pipelines de données en production - Vidéo de présentation1 minute

4 lecturesTotal 50 minutes

Introduction10 minutes
Surveillance de la santé et de la performance des pipelines20 minutes
Générer les données à l'aide de dbldatagen10 minutes
Meilleures pratiques pour la résolution des échecs de production10 minutes

1 devoirTotal 10 minutes

Contrôle des pipelines de données en production10 minutes

Instructeur

Packt - Course Instructors

Packt

1 946 Cours578 447 apprenants

Offert par

Packt

En savoir plus sur Analyse des données

Pragmatic AI Labs
Databricks Lakehouse Fundamentals
Cours
Statut : Essai gratuit
Catégorie : Crédit proposé
Edureka
Lakehouse Architecture and Delta Lake with Databricks
Cours
Catégorie : Prévisualisation
Catégorie : Crédit proposé
Pragmatic AI Labs
Data Engineering with Delta Lake on Databricks
Cours
Statut : Essai gratuit
Catégorie : Crédit proposé
Coursera
Build & Analyze Your Data Lakehouse
Cours
Statut : Essai gratuit
Catégorie : Crédit proposé

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

Oui, vous pouvez visionner la première vidéo et le syllabus avant de vous inscrire. Vous devez acheter le cours pour accéder au contenu qui n'est pas inclus dans l'aperçu.

Si vous décidez de vous inscrire au cours avant la date de début de la session, vous aurez accès à toutes les vidéos et à toutes les lectures du cours. Vous pourrez soumettre vos travaux dès le début de la session.

Une fois que vous vous serez inscrit et que votre session aura commencé, vous aurez accès à toutes les vidéos et autres ressources, y compris les lectures et le forum de discussion du cours. Vous pourrez consulter et soumettre des évaluations pratiques, et effectuer les devoirs notés requis pour obtenir une note et un certificat de cours.

Plus de questions

Visitez le Centre d'Aide pour les Étudiants

Aide financière disponible,

Construire des applications de données modernes en utilisant Databricks Lakehouse

Construire des applications de données modernes en utilisant Databricks Lakehouse

Ce que vous apprendrez

Compétences que vous acquerrez

Outils que vous découvrirez

Détails à connaître

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Il y a 10 modules dans ce cours

Introduction aux tables vivantes Delta

Inclus

Appliquer des transformations de données à l'aide des tables Delta Live

Inclus

Gestion de la qualité des données à l'aide des tables Delta Live

Inclus

Mise à l'échelle des pipelines DLT

Inclus

Maîtriser la gouvernance des données dans le Lakehouse avec Unity Catalog

Inclus

Gestion de l'emplacement des données dans Unity Catalog

Inclus

Visualisation du lignage des données à l'aide de Unity Catalog

Inclus

Déployer, maintenir et administrer des pipelines DLT à l'aide de Terraform

Inclus

Tirer parti des ensembles d'actifs Databricks pour rationaliser le déploiement des pipelines de données

Inclus

Contrôle des pipelines de données en production

Inclus

Instructeur

Offert par

En savoir plus sur Analyse des données

Databricks Lakehouse Fundamentals

Lakehouse Architecture and Delta Lake with Databricks

Data Engineering with Delta Lake on Databricks

Build & Analyze Your Data Lakehouse

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.

Réaliser des économies en milieu d'année et donner de l'élan à sa carrière

Aidez votre équipe à s'élever

Foire Aux Questions

Puis-je avoir un aperçu d'un cours avant de m'inscrire ?

Quand aurai-je accès aux cours et aux devoirs ?

Qu'est-ce que j'obtiendrai en m'inscrivant ?

Plus de questions