Coursera

Data Engineering & Pipeline-Zuverlässigkeit für maschinelles Lernen

Holen Sie sich eines unserer besten Angebote und erweitern Sie Ihre Fähigkeiten mit 50% Rabatt auf Coursera Plus. Jetzt sparen.

Coursera

Data Engineering & Pipeline-Zuverlässigkeit für maschinelles Lernen

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

9 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

9 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Daten für maschinelles Lernen mithilfe von Kodierungs-, Bereinigungs- und Datenqualitätsverfahren transformieren und validieren

  • Entwicklung und Koordination von ML-Datenpipelines, die Zuverlässigkeit, Aktualität und Leistungsfähigkeit der Pipelines gewährleisten

  • Verwalten Sie die reproduzierbare ML-Entwicklung mithilfe von Versionskontroll- und Umgebungsmanagement-Tools

Kompetenzen, die Sie erwerben

  • Kategorie: Datenwrangling
  • Kategorie: MLOps (Operationen für maschinelles Lernen)
  • Kategorie: Daten-Pipelines
  • Kategorie: Entwicklungsumgebung
  • Kategorie: Datenumwandlung
  • Kategorie: Qualität der Daten
  • Kategorie: Vorverarbeitung von Daten
  • Kategorie: Qualitätssicherung
  • Kategorie: Paket- und Softwareverwaltung
  • Kategorie: Integration von Daten
  • Kategorie: Technische Merkmale
  • Kategorie: Bereinigung von Daten
  • Kategorie: Kostenmanagement
  • Kategorie: Datenfluss
  • Kategorie: Extrahieren, Transformieren, Laden
  • Kategorie: Virtuelle Umgebung
  • Kategorie: Explorative Datenanalyse
  • Kategorie: Nutzung der Ressourcen

Werkzeuge, die Sie lernen werden

  • Kategorie: Apache Airflow
  • Kategorie: Git (Versionskontrollsystem)

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

März 2026

Bewertungen

13 Zuweisungen¹

KI-bewertet siehe Haftungsausschluss
Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung „Maschinelles Lernen leicht gemacht für Software-Ingenieure“
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 10 Module

Sie werden kategoriale Merkmale analysieren, um unter Berücksichtigung der Kardinalität und der Modellanpassung die optimale Kodierungsstrategie zu ermitteln.

Das ist alles enthalten

2 Videos2 Lektüren1 Aufgabe

Sie werden Kennzahlen zur Datenqualität auswerten und den Datenverarbeitungsweg dokumentieren, um Transparenz und Zuverlässigkeit zu gewährleisten.

Das ist alles enthalten

1 Video1 Lektüre1 Aufgabe

Sie wenden Techniken zur Imputation, Kennzeichnung und Validierung fehlender oder Nullwerte an, um konsistente, modellfähige Datensätze zu erstellen.

Das ist alles enthalten

1 Video1 Lektüre2 Aufgaben

Sie werden ETL- und ELT-Pipelines einsetzen, um Daten aus verschiedenen Quellen mithilfe strukturierter Transformations-Workflows in einen Feature Store zu importieren.

Das ist alles enthalten

2 Videos1 Lektüre1 Aufgabe

Sie analysieren Schemaänderungen in vorgelagerten Systemen und implementieren Sicherheitsmaßnahmen, um die Ausfallsicherheit der Datenpipeline und die Kompatibilität mit nachgelagerten Systemen zu gewährleisten.

Das ist alles enthalten

2 Videos1 Lektüre

Sie werden die Aktualität der Daten, Verzögerungen und die Erfolgsraten der Datenpipeline anhand der Service Level Agreements bewerten, um die Betriebssicherheit zu beurteilen.

Das ist alles enthalten

1 Video1 Lektüre3 Aufgaben

Sie werden Verzweigungsstrategien der Versionskontrolle anwenden, um Code, Experimente und Projektartefakte effektiv zu verwalten.

Das ist alles enthalten

3 Videos1 Lektüre2 Aufgaben

Sie werden Tools für virtuelle Umgebungen einsetzen, um reproduzierbare Projektumgebungen mit stabilen Abhängigkeiten zu konfigurieren.

Das ist alles enthalten

2 Videos1 Lektüre1 Unbewertetes Labor

Sie analysieren die Ressourcenauslastung in Bezug auf CPU, GPU und Speicher, um die Rechenkosten während der Experimentierphase zu optimieren.

Das ist alles enthalten

2 Videos1 Lektüre2 Aufgaben

In diesem Projekt entwerfen und implementieren Sie eine produktionsreife Machine-Learning-Datenpipeline für ein Risikomodellierungsszenario im Finanzdienstleistungsbereich. Der Rohdatensatz enthält fehlende Werte, inkonsistente kategoriale Einträge, potenzielle Ausreißer und simulierte Schema-Drifts. Ihre Aufgabe besteht darin, diesen Datensatz in einen validierten, modellbereiten Feature-Store umzuwandeln. Sie bereinigen und verarbeiten strukturierte tabellarische Daten, wählen Kodierungsstrategien basierend auf der Kardinalität der Merkmale aus, implementieren eine Datenvalidierung mit Great Expectations, erkennen Schemaänderungen zwischen den Pipeline-Läufen, generieren SLA-Metriken zur Bewertung der Zuverlässigkeit und speichern die verarbeiteten Merkmale im Parquet-Format. Über die CORE-Pipeline hinaus wenden Sie zudem professionelle Entwicklungspraktiken an, die in produktiven ML-Teams Standard sind: Einrichten einer virtuellen Umgebung zur Reproduzierbarkeit, Verwendung von Verzweigungsstrategien in der Versionskontrolle zur Verwaltung Ihrer Arbeit sowie Analyse der Ressourcenauslastung, um die Rechenkosten zu verstehen. Ihr Endergebnis ist ein modulares Python-Skript sowie eine strukturierte schriftliche technische Erläuterung, die Ihre Fähigkeit unter Beweis stellt, eine zuverlässige, produktionsgerechte ML-Dateninfrastruktur zu entwerfen.

Das ist alles enthalten

2 Lektüren1 Aufgabe

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozent

Professionals from the Industry
487 Kurse112.316 Lernende

von

Coursera

Mehr von Datenverwaltung entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen

¹ Einige Aufgaben in diesem Kurs werden mit AI bewertet. Für diese Aufgaben werden Ihre Daten in Übereinstimmung mit Datenschutzhinweis von Courseraverwendet.