Packt

Erstellung moderner Datenanwendungen mit Databricks Lakehouse

Holen Sie sich eines unserer besten Angebote und erweitern Sie Ihre Fähigkeiten mit 50% Rabatt auf Coursera Plus. Jetzt sparen.

Packt

Erstellung moderner Datenanwendungen mit Databricks Lakehouse

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Anfänger

Empfohlene Erfahrung

1 Woche zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Anfänger

Empfohlene Erfahrung

1 Woche zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Implementieren Sie Datenpipelines in nahezu Echtzeit mithilfe von Delta Live Tables

  • Datenpipelines mit Databricks-Workflows orchestrieren

  • Datenvalidierung implementieren und die Datenqualität überwachen

Kompetenzen, die Sie erwerben

  • Kategorie: Qualität der Daten
  • Kategorie: Datenverwaltung
  • Kategorie: Validierung von Daten
  • Kategorie: Daten-Infrastruktur
  • Kategorie: Integrität der Daten
  • Kategorie: Skalierbarkeit
  • Kategorie: Datenspeicherung
  • Kategorie: Datenarchitektur
  • Kategorie: Daten-Pipelines
  • Kategorie: Datenumwandlung
  • Kategorie: Cloud Computing
  • Kategorie: Daten in Echtzeit
  • Kategorie: Datenverwaltung
  • Kategorie: Datensicherheit

Werkzeuge, die Sie lernen werden

  • Kategorie: Apache Spark
  • Kategorie: Terraform
  • Kategorie: Daten-Seen
  • Kategorie: Databricks

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

10 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

In diesem Kurs gibt es 10 Module

In diesem Abschnitt befassen wir uns mit Echtzeit-Datenpipelines unter Verwendung von Delta Live Tables (DLT), analysieren die Delta Lake-Architektur und entwerfen skalierbare Streaming-Lösungen für Lakehouse-Umgebungen.

Das ist alles enthalten

2 Videos6 Lektüren1 Aufgabe

In diesem Abschnitt behandeln wir die Datenerfassung mit DLT, die Übernahme von Änderungen und die Konfiguration von Pipelines im Hinblick auf Skalierbarkeit.

Das ist alles enthalten

1 Video6 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der Umsetzung von Anforderungen an die Datenqualität in DLT-Pipelines, der Überprüfung der Datenintegrität anhand temporärer Datensätze sowie der Isolierung von Daten minderer Qualität zur Korrektur.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt behandeln wir die Skalierung von DLT-Pipelines durch Clusteroptimierung, automatische Skalierung und Delta-Lake-Techniken.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der Umsetzung von Data Governance in einem Lakehouse mithilfe von Unity Catalog, wobei der Schwerpunkt auf Zugriffskontrollen, Datenermittlung und der Nachverfolgung von Datenherkünften im Hinblick auf Compliance und Sicherheit liegt.

Das ist alles enthalten

1 Video7 Lektüren1 Aufgabe

In diesem Abschnitt behandeln wir die Verwaltung von Datenspeicherorten in Unity Catalog unter Berücksichtigung sicherer Governance und Zugriffskontrolle.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der Datenherkunft in Unity Catalog: Wir verfolgen die Herkunft der Daten, visualisieren deren Transformationen und identifizieren Abhängigkeiten, um die Datenintegrität zu gewährleisten und Probleme proaktiv zu erkennen.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt behandeln wir die Bereitstellung und Verwaltung von DLT-Pipelines mit Terraform in Databricks.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit Databricks Asset Bundles (DABs) zur Optimierung der Bereitstellung von Datenpipelines, wobei wir den Schwerpunkt auf die GitHub-Integration, die Versionskontrolle und die teamübergreifende Zusammenarbeit legen.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der Überwachung von Datenpipelines mithilfe von Databricks, wobei der Schwerpunkt auf dem Zustand, der Leistung und der Datenqualität liegt. Zu den verwendeten Techniken gehören DBSQL-Warnmeldungen und Webhook-Trigger zur Echtzeit-Behebung von Problemen.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

Dozent

Packt - Course Instructors
Packt
1.946 Kurse575.115 Lernende

von

Packt

Mehr von Datenanalyse entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen