In diesem Kurs lernen Sie, wie Sie reale Datensätze mithilfe praktischer, reproduzierbarer Techniken zur Datenbereinigung in zuverlässige Analysegrundlagen umwandeln können. Sie lernen, wie Sie kategoriale Merkmale bewerten und optimale Kodierungsstrategien auswählen, die Datenqualität messen und dokumentieren sowie effektive Ansätze zum Umgang mit fehlenden Werten anwenden. Mithilfe von Python und pandas üben Sie, die Kardinalität zu bewerten, Zielkodierungen zu implementieren, die Vollständigkeit mit Great Expectations zu validieren und transparente Transformationspfade zu erstellen. Außerdem bereinigen Sie unübersichtliche Felder wie Altersangaben, Gehaltsausreißer und Datumsangaben, um konsistente, modellreife Ergebnisse zu gewährleisten. Dieser Kurs richtet sich an Analysten, Dateningenieure und ML-Praktiker und vermittelt Ihnen die praxisnahen Fähigkeiten, die Sie benötigen, um hochwertige Datensätze aufzubereiten, die zuverlässige Erkenntnisse und prädiktive Modellierung ermöglichen.

Data Engineering & Pipeline-Zuverlässigkeit für maschinelles Lernen
Holen Sie sich eines unserer besten Angebote und erweitern Sie Ihre Fähigkeiten mit 50% Rabatt auf Coursera Plus. Jetzt sparen.

Data Engineering & Pipeline-Zuverlässigkeit für maschinelles Lernen
Dieser Kurs ist Teil von Spezialisierung „Maschinelles Lernen leicht gemacht für Software-Ingenieure“

Dozent: Professionals from the Industry
Bei enthalten
Empfohlene Erfahrung
Was Sie lernen werden
Daten für maschinelles Lernen mithilfe von Kodierungs-, Bereinigungs- und Datenqualitätsverfahren transformieren und validieren
Entwicklung und Koordination von ML-Datenpipelines, die Zuverlässigkeit, Aktualität und Leistungsfähigkeit der Pipelines gewährleisten
Verwalten Sie die reproduzierbare ML-Entwicklung mithilfe von Versionskontroll- und Umgebungsmanagement-Tools
Kompetenzen, die Sie erwerben
- Kategorie: Datenwrangling
- Kategorie: MLOps (Operationen für maschinelles Lernen)
- Kategorie: Daten-Pipelines
- Kategorie: Entwicklungsumgebung
- Kategorie: Datenumwandlung
- Kategorie: Qualität der Daten
- Kategorie: Vorverarbeitung von Daten
- Kategorie: Qualitätssicherung
- Kategorie: Paket- und Softwareverwaltung
- Kategorie: Integration von Daten
- Kategorie: Technische Merkmale
- Kategorie: Bereinigung von Daten
- Kategorie: Kostenmanagement
- Kategorie: Datenfluss
- Kategorie: Extrahieren, Transformieren, Laden
- Kategorie: Virtuelle Umgebung
- Kategorie: Explorative Datenanalyse
- Kategorie: Nutzung der Ressourcen
Werkzeuge, die Sie lernen werden
- Kategorie: Apache Airflow
- Kategorie: Git (Versionskontrollsystem)
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
März 2026
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 10 Module
Erwerben Sie ein Karrierezertifikat.
Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
Dozent

von
Mehr von Datenverwaltung entdecken
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Häufig gestellte Fragen
Weitere Fragen
Finanzielle Unterstützung verfügbar,
¹ Einige Aufgaben in diesem Kurs werden mit AI bewertet. Für diese Aufgaben werden Ihre Daten in Übereinstimmung mit Datenschutzhinweis von Courseraverwendet.




