Was erhalte ich, wenn ich das Zertifikat kaufe?

Wenn Sie ein Zertifikat erwerben, erhalten Sie Zugang zu allen Kursmaterialien, einschließlich der benoteten Aufgaben. Nach Abschluss des Kurses wird Ihr elektronisches Zertifikat zu Ihrer Erfolgsseite hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen.

Ist finanzielle Hilfe verfügbar?

Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.

Apache Eisberg: Von Null auf Produktionsdaten Lakehouse

Dozent: Snowflake Northstar

Bei enthalten

Mehr erfahren

Fragen Sie Coursera

3 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

6 Stunden zu vervollständigen

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

3 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

6 Stunden zu vervollständigen

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

Erstellen Sie produktionsreife Iceberg-Lakehouses mit optimierter Partitionierung und Schema-Gestaltung für maximale Abfrageleistung
Migrieren Sie vorhandene Daten nach Iceberg und verwalten Sie Schemaänderungen, Partitionierungsänderungen und Git-ähnliche Arbeitsabläufe – ganz ohne Ausfallzeiten
Wartung von Iceberg-Tabellen in großem Maßstab durch Komprimierung, Snapshot-Verwaltung und Optimierung der Schreibstrategien für parallele Workloads

Kompetenzen, die Sie erwerben

Kategorie: Datenbank-Design
Kategorie: Daten-Pipelines
Kategorie: Validierung von Daten
Kategorie: Leistungsoptimierung
Kategorie: Datenspeicher
Kategorie: Daten-Infrastruktur
Kategorie: Daten importieren/exportieren
Kategorie: Transaktionsverarbeitung
Kategorie: Migration von Daten
Kategorie: Datenarchitektur
Kategorie: Verwaltung von Metadaten
Kategorie: Datenpflege
Kategorie: Datenbank-Management

Werkzeuge, die Sie lernen werden

Kategorie: Apache Hive
Kategorie: Apache Spark
Kategorie: Daten-Seen
Kategorie: Abfragesprachen

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

März 2026

Bewertungen

3 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Weitere Informationen zu Coursera für Unternehmen

Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

In diesem Kurs gibt es 3 Module

Dieser Kurs richtet sich an Dateningenieure, Analytics-Ingenieure, Datenplattform-Ingenieure und Datenarchitekten, die mit Data Lakes arbeiten und ihre Dateninfrastruktur modernisieren möchten. Er ist außerdem wertvoll für Softwareentwickler, die in Datenrollen wechseln, sowie für technische Leiter, die Apache Iceberg für ihre Daten evaluieren.

Am Ende dieses Kurses werden Sie in der Lage sein: - ein Apache Iceberg Lakehouse mithilfe von Katalogen, Objektspeichern und Abfrage-Engines wie Spark und Trino aufzubauen und zu konfigurieren - optimale Tabellenstrukturen mithilfe von versteckter Partitionierung, Sortierreihenfolgen und Spaltenmetriken zu entwerfen, um die Abfrageleistung zu maximieren - Vorhandene Daten aus Hive-Tabellen, Parquet-Dateien, CSV-Dateien und Datenbanken mithilfe von Snapshot-, Migrations- und Reserialisierungsansätzen in Iceberg zu migrieren - Produktionsworkflows mithilfe von „Write-Audit-Publish“ zur Validierung, Verzweigungen zum Testen und Rollback zur Wiederherstellung zu implementieren - Weiterentwicklung von Tabellenschemata und Partitionsspezifikationen ohne Ausfallzeiten oder Neuschreiben von Daten - Durchführung von Wartungsvorgängen, einschließlich der Komprimierung von Datendateien, der Komprimierung von Metadaten und des Ablaufs von Snapshots - Konfiguration von Schreibstrategien (Merge-on-Read vs. Copy-on-Write) und Verteilungsmodi für unterschiedliche Workload-Anforderungen - Verwalten Sie parallele Vorgänge und vermeiden Sie Konflikte in Szenarien mit mehreren Schreibern Um diesen Kurs erfolgreich zu absolvieren, sollten Sie über folgende Voraussetzungen verfügen: - Praktische Kenntnisse in SQL und relationalen Datenbankkonzepten (Tabellen, Schemata, Abfragen) - Grundlegendes Verständnis von Data-Engineering-Konzepten, einschließlich ETL/ELT, Data Warehouses und Data Lakes - Vertrautheit mit Befehlszeilenschnittstellen und Docker zur Ausführung der Kursumgebung - Sicherer Umgang mit dem Lesen und Verstehen von Code-Beispielen in Python/PySpark (Code wird bereitgestellt; Sie müssen nicht von Grund auf neu schreiben) - Erfahrung mit Apache Spark oder verteiltem Rechnen ist hilfreich, aber nicht erforderlich – die Kernkonzepte werden im Laufe des Kurses erläutert Apache Iceberg, Iceberg, Apache und das Apache-Feder-Logo sind entweder eingetragene Marken oder Marken der Apache Software Foundation. Die Verwendung dieser Marken impliziert keine Billigung durch die Apache Software Foundation.

Erfahren Sie, was Apache Iceberg ist und wie seine Metadatenarchitektur leistungsstarke Abfrageoptimierungen ermöglicht. Richten Sie Ihre erste Iceberg-Lakehouse-Umgebung ein und entdecken Sie, wie versteckte Partitionierung und Spaltenmetriken zusammenwirken, um bei Abfragen unnötige Daten zu überspringen. Arbeiten Sie mit echten NYC-Taxi-Daten, um verschiedene Partitionierungsstrategien zu vergleichen und deren Auswirkungen auf die Leistung zu messen.

Das ist alles enthalten

6 Videos3 Lektüren1 Aufgabe

6 VideosInsgesamt 23 Minuten

Einführung in den Kurs3 Minuten
Was bedeutet es, dass Apache Iceberg ein offenes Tabellenformat ist? 3 Minuten
Das offene Seehaus5 Minuten
Daten in eine Apache-Iceberg-Tabelle modellieren5 Minuten
Versteckte Partitionierung in Apache-Iceberg-Tabellen6 Minuten
Zusammenfassung von Modul 12 Minuten

3 LektürenInsgesamt 65 Minuten

Erste Schritte: Einrichten Ihrer Apache Iceberg-Lernumgebung45 Minuten
[WICHTIG] Haben Sie Fragen? Treten Sie dem Q+A Forum für diesen Kurs bei10 Minuten
Einführung in die Datenmodellierung – Übung10 Minuten

1 AufgabeInsgesamt 30 Minuten

Quiz zu Modul 1: Grundlagen von Apache Iceberg30 Minuten

Übertragen Sie vorhandene Daten mithilfe von Migrationsstrategien für Parquet-, Hive-, CSV- und Datenbankquellen in Iceberg. Nutzen Sie Git-ähnliche Funktionen wie „Write-Audit-Publish“ zur Validierung, Verzweigungen für sicheres Experimentieren und Tags zum Markieren von Meilensteinen. Erfahren Sie, wie Sie sowohl Tabellenschemata als auch Partitionsspezifikationen weiterentwickeln können, ohne dass es zu Ausfallzeiten kommt oder Daten neu geschrieben werden müssen.

Das ist alles enthalten

5 Videos3 Lektüren1 Aufgabe

5 VideosInsgesamt 32 Minuten

Bestehende Daten nach Iceberg übertragen8 Minuten
Git-ähnliche Funktionen mit „Write-Audit-Publish“ sowie Verzweigungen und Tags8 Minuten
Schemaentwicklung für Iceberg-Tabellen6 Minuten
Partitionsentwicklung für Iceberg-Tabellen7 Minuten
Zusammenfassung von Modul 23 Minuten

3 LektürenInsgesamt 30 Minuten

Bestehende Tabellen nach Iceberg verschieben10 Minuten
Übung zum sicheren Experimentieren mit Apache Iceberg10 Minuten
Übung zur Entwicklung von Schemata und Partitionen10 Minuten

1 AufgabeInsgesamt 30 Minuten

Quiz zu Modul 2: Einsatz von Eisberg-Tabellen30 Minuten

Optimieren Sie die Schreibleistung und verwalten Sie Iceberg-Tabellen in der Produktion in großem Maßstab. Machen Sie sich mit den Unterschieden zwischen Streaming- und Batch-Erfassungsmustern sowie zwischen „Merge-on-Read“- und „Copy-on-Write“-Strategien vertraut und lernen Sie, wie Sie gleichzeitige Vorgänge sicher handhaben. Führen Sie wichtige Wartungsvorgänge wie Komprimierung und das Ablaufen von Snapshots durch, um die Leistung der Tabellen auch bei zunehmender Größe aufrechtzuerhalten.

Das ist alles enthalten

8 Videos6 Lektüren1 Aufgabe

8 VideosInsgesamt 45 Minuten

Daten in Apache Iceberg einlesen8 Minuten
„Copy on Write“ und „Merge on Read“4 Minuten
Umgang mit Parallelität in Apache Iceberg3 Minuten
Tabellenpflege für Iceberg – Die Grundlagen5 Minuten
Tabellenpflege für Iceberg – Komprimierung und Bereinigung nicht mehr benötigter Dateien7 Minuten
Effizientes Schreiben in Iceberg-Tabellen6 Minuten
Sortierreihenfolgen10 Minuten
Zusammenfassung von Modul 33 Minuten

6 LektürenInsgesamt 60 Minuten

Übung zur Nahrungsaufnahme10 Minuten
Wartungsübung10 Minuten
Übung zu fortgeschrittenen Modellierungs- und Erfassungsverfahren10 Minuten
Zusätzliche Ressourcen10 Minuten
Glossar zum Apache Iceberg-Kurs10 Minuten
Kurs Danksagungen10 Minuten

1 AufgabeInsgesamt 30 Minuten

Quiz zu Modul 3: Betrieb und Optimierung von Apache Iceberg30 Minuten

Dozent

Snowflake Northstar

7 Kurse45.957 Lernende

von

Snowflake

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018

„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020

„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021

„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Schalten Sie den Zugang zu mehr als 10.000 Kursen mit einem Abonnement frei
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich den über 4.700 globalen Unternehmen an, die Coursera for Business wählen

Häufig gestellte Fragen

Ein Apache Iceberg Lakehouse ist eine Speicherarchitektur, die Datenseen eine Zuverlässigkeit auf Datenbankniveau verleiht. Durch den Einsatz der Snowflake-Plattform können Unternehmen Iceberg-Tabellen mit hoher Leistung, nahezu sofortiger Skalierbarkeit und universeller Governance verwalten.

Ja. Sie lernen, wie Sie vorhandene Daten aus Parquet-, CSV- und Legacy-Datenbanken in Iceberg-Formate migrieren, die sich nahtlos in die Snowflake AI Data Cloud integrieren lassen.

Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.