Streaming und Vereinheitlichung von Datenschemata mit CDC

Holen Sie sich eines unserer besten Angebote und erweitern Sie Ihre Fähigkeiten mit 50% Rabatt auf Coursera Plus. Jetzt sparen.

Streaming und Vereinheitlichung von Datenschemata mit CDC

Dieser Kurs ist Teil von Spezialisierung „Echtzeit, wirklich schnell: Kafka & Spark für Data Engineers“

Dozenten: Starweaver

Bei enthalten

Mehr erfahren

Fragen Sie Coursera

3 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

5 Stunden zu vervollständigen

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

3 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

5 Stunden zu vervollständigen

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

Erläutern Sie die Grundlagen von CDC (Binlog/WAL) und Strategien zur Schemaentwicklung.
Konfigurieren Sie lokal eine Schema-Registry-Pipeline mit Debezium und Kafka.
Verwenden Sie Streaming-SQL (Flink/ksqlDB), um abweichende Schemata abzubilden, zu konvertieren und zu einem kanonischen Modell zusammenzuführen.

Kompetenzen, die Sie erwerben

Kategorie: Integrität der Daten
Kategorie: Kontinuierliche Überwachung
Kategorie: Daten-Mapping
Kategorie: Schematische Diagramme
Kategorie: Daten-Pipelines
Kategorie: Cloud-Bereitstellung
Kategorie: Technologien zur Datenspeicherung
Kategorie: SQL
Kategorie: Datenmodellierung
Kategorie: Daten in Echtzeit
Kategorie: Datenerfassung
Kategorie: Datenumwandlung
Kategorie: Validierung von Daten
Kategorie: Datenspeicher
Kategorie: Kontinuierliche Integration

Werkzeuge, die Sie lernen werden

Kategorie: Apache Kafka
Kategorie: PostgreSQL

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

Januar 2026

Bewertungen

5 Zuweisungen¹

KI-bewertet siehe Haftungsausschluss

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Weitere Informationen zu Coursera für Unternehmen

Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung „Echtzeit, wirklich schnell: Kafka & Spark für Data Engineers“

Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.

Lernen Sie neue Konzepte von Branchenexperten
Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 3 Module

Stellen Sie sich vor, Sie könnten Schemaänderungen souverän bereitstellen – in der Gewissheit, dass Ihre Pipeline diese problemlos verarbeitet, die Verbraucher einwandfrei funktionieren und Ihre Daten konsistent bleiben. Das ist der Unterschied zwischen der Hoffnung, dass Ihre CDC-Pipeline funktioniert, und der Gewissheit, dass sie es tut. In diesem Kurs lernen Sie, wie Sie eine funktionsfähige, herstellerneutrale CDC-Pipeline und eine einzige, einheitliche Tabelle aus sich weiterentwickelnden Quellschemata aufbauen. Ausgehend von Debezium, das Änderungen aus Postgres/MySQL in Kafka streamt, nutzen Sie die Schema Registry, um die Kompatibilität sicherzustellen, und wenden anschließend Streaming-SQL in Flink (oder ksqlDB) an, um abweichende Felder abzubilden, zu konvertieren und zu einem kanonischen Modell zusammenzuführen. Abschließend speichern Sie die Ergebnisse in einer Apache-Iceberg-Tabelle und fragen diese sofort mit Trino ab. Dabei lernen Sie praktische Strategien kennen, um Schema-Drift zu bewältigen, Kompatibilitätsmodi (rückwärtskompatibel/vollständig) auszuwählen und Störungen bei nachgelagerten Verbrauchern zu vermeiden. Alles läuft lokal mit Docker, sodass Sie die Inhalte überall reproduzieren und die gleichen Muster später auf Ihren Cloud-Stack übertragen können.

Dieser Kurs richtet sich an Entwickler, die mit Kafka, Debezium und Streaming-SQL arbeiten und Kenntnisse in den Bereichen zuverlässige Schemaentwicklung und kanonische Modellierung benötigen. Die Teilnehmer sollten über Grundkenntnisse in SQL und Docker verfügen und mit Kafka oder Streaming-Konzepten vertraut sein. Am Ende des Kurses sind Sie in der Lage, eine kleine End-to-End-CDC-Pipeline zu implementieren, die Daten aus einer Quelldatenbank streamt und sich weiterentwickelnde Schemata in einer einzigen abfragbaren Tabelle zusammenführt.

Stellen Sie einen lokalen Stack aus Debezium, Kafka, Schema Registry und Flink/ksqlDB bereit, um Änderungen auf Zeilenebene in Echtzeit zu beobachten. Ändern Sie das Quellschema gezielt und nutzen Sie anschließend Streaming-SQL, um Felder abzubilden, zu konvertieren und zu einer kanonischen Tabelle zusammenzuführen. Führen Sie „Upserts“ unter Verwendung stabiler Schlüssel durch und überprüfen Sie, ob die Daten korrekt in Iceberg gespeichert wurden. Am Ende haben Sie eine funktionsfähige CDC-Schleife sowie einen einheitlichen, abfragbaren Datensatz eingerichtet.

Das ist alles enthalten

4 Videos2 Lektüren1 Aufgabe

4 VideosInsgesamt 37 Minuten

Einführung und Begrüßung4 Minuten
Von CDC bis Analytics: Vollständiger Überblick über die Architektur11 Minuten
Ein tiefer Einblick in den Datenfluss: Von der Quelle zum Lakehouse12 Minuten
Live Build: Schemata mit Streaming SQL vereinheitlichen10 Minuten

2 LektürenInsgesamt 10 Minuten

Willkommen zum Kurs: Kursübersicht5 Minuten
Schema-Entwicklung – Weitere Ressourcen5 Minuten

1 AufgabeInsgesamt 30 Minuten

Praktisches Lernen (HOL): CDC-Grundlagen und sichere Schemaentwicklung30 Minuten

Lernen Sie, Störungen bei den Endnutzern zu vermeiden, indem Sie die Kompatibilität sowohl auf der Ebene der einzelnen Objekte als auch auf globaler Ebene sicherstellen. Wir werden gezielt ein inkompatibles Schema einsetzen, den Fehler beobachten und unter Verwendung von Standardwerten und transitiven Modi sicher fortfahren. Implementieren Sie praktische Schutzmaßnahmen wie CI-Schema-Prüfungen, DLQs, Warnmeldungen und Lag-Probes, um sicherzustellen, dass Probleme umgehend erkannt und eingedämmt werden. Der Schwerpunkt liegt auf wiederholbarer Wiederherstellung, nicht auf Heldentaten.

Das ist alles enthalten

3 Videos1 Lektüre1 Aufgabe

3 VideosInsgesamt 30 Minuten

Von Debezium bis Kafka: Anbindung von CDC an die Schema-Registry11 Minuten
Ein Schema absichtlich brechen: Und es wieder reparieren9 Minuten
Beobachtbarkeit und Sicherheitsvorkehrungen10 Minuten

1 LektüreInsgesamt 5 Minuten

Kompatibilitätsmodi in der Praxis5 Minuten

1 AufgabeInsgesamt 30 Minuten

Praktisches Lernen (HOL): Behebung einer Kompatibilitätsänderung30 Minuten

Entwickeln Sie ein robustes kanonisches Modell, das Namenskonventionen, Datentypen und Einheiten, Nullbarkeit sowie Soft-Delete-Mechanismen umfasst, und speichern Sie es mithilfe von Streaming-Upserts in Iceberg auf MinIO. Führen Sie sofortige Abfragen mit Trino durch und nutzen Sie Time-Travel-Funktionen zur Validierung oder zur Fehlerbehebung bei Regressionen. Das Projekt umfasst die Erstellung einer denormalisierten Ansicht „Neueste Daten pro Kunde“ für Analysezwecke sowie die Erörterung von Partitionierungsstrategien, Löschvorgängen bei Gleichheit und Datenkomprimierung. Die Teilnehmer erwerben skalierbare Muster, die für den Einsatz von Laptops bis hin zu Cloud-Umgebungen geeignet sind.

Das ist alles enthalten

4 Videos1 Lektüre3 Aufgaben

4 VideosInsgesamt 36 Minuten

Grundlagen des kanonischen Schemas7 Minuten
SQL-Muster für das Streaming: Casts, Coalesce, Upserts, Joins13 Minuten
Speichern und Abfragen mit Iceberg + Trino12 Minuten
Zusammenfassung + nächste Schritte3 Minuten

1 LektüreInsgesamt 5 Minuten

Das Wichtigste über Eisberg-Spülbecken5 Minuten

3 AufgabenInsgesamt 120 Minuten

Streaming und Vereinheitlichung von Datenschemata mit CDC30 Minuten
Praktisches Lernen (HOL): Bearbeitung der aktuellen Kundenaufträge30 Minuten
Projekt: Von CDC-Datenströmen zu verlässlichen Kundenaufträgen 60 Minuten

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozenten

Starweaver

Coursera

571 Kurse1.159.189 Lernende

von

Coursera

Mehr von Software-Entwicklung entdecken

Status: Kostenloser Testzeitraum
Coursera
Manage Schema Evolution in Real‑Time Data
Kurs
Packt
Kafka for Developers - Data Contracts Using Schema Registry
Kurs
Status: Kostenloser Testzeitraum
Coursera
Unify Diverse Data Sources
Kurs
Status: Kostenloser Testzeitraum
Coursera
Ensure Consistency in Streaming Pipelines
Kurs

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018

„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020

„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021

„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen

Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.

Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzufügen.

Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.

Weitere Fragen

Besuchen Sie die das Hilfe-Center für Kursteilnehmer.

Finanzielle Unterstützung verfügbar,

¹ Einige Aufgaben in diesem Kurs werden mit AI bewertet. Für diese Aufgaben werden Ihre Daten in Übereinstimmung mit Datenschutzhinweis von Courseraverwendet.