Packt

Datentechnik mit Scala und Spark

Holen Sie sich eines unserer besten Angebote und erweitern Sie Ihre Fähigkeiten mit 50% Rabatt auf Coursera Plus. Jetzt sparen.

Packt

Datentechnik mit Scala und Spark

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

2 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

2 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Eine Entwicklungsumgebung für die Erstellung von Datenpipelines in Scala einrichten

  • Verwenden Sie Spark DataFrames, Datasets und SQL mit Scala zur Datenverarbeitung

  • Daten mit Deequ aufbereiten und bereinigen, um die Datenqualität zu verbessern

Kompetenzen, die Sie erwerben

  • Kategorie: Datenverarbeitung
  • Kategorie: Datenspeicher
  • Kategorie: Integrität der Daten
  • Kategorie: Testgetriebene Entwicklung (TDD)
  • Kategorie: Datenarchitektur
  • Kategorie: Validierung von Daten
  • Kategorie: Einheitliche Prüfung
  • Kategorie: Daten-Pipelines
  • Kategorie: Kontinuierliche Integration
  • Kategorie: Qualität der Daten
  • Kategorie: CI/CD
  • Kategorie: Datenumwandlung
  • Kategorie: Instandhaltbarkeit
  • Kategorie: Leistungsoptimierung
  • Kategorie: Kontinuierliche Bereitstellung

Werkzeuge, die Sie lernen werden

  • Kategorie: Scala-Programmierung
  • Kategorie: Daten-Seen
  • Kategorie: Apache Kafka
  • Kategorie: Apache Spark
  • Kategorie: Apache Airflow

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

März 2026

Bewertungen

13 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

In diesem Kurs gibt es 13 Module

In diesem Abschnitt befassen wir uns mit funktionaler Programmierung, Funktionen höherer Ordnung, polymorphen Funktionen und Musterabgleich in Scala für Anwendungen im Bereich Data Engineering.

Das ist alles enthalten

2 Videos6 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit cloudbasierten und lokalen Umgebungen für Data-Engineering-Pipelines und konzentrieren uns dabei auf Einrichtungsprozesse, Vor- und Nachteile sowie praktische Anwendungsbeispiele.

Das ist alles enthalten

1 Video5 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit den APIs von Spark und konzentrieren uns dabei auf DataFrame und Dataset für die verteilte Datenverarbeitung.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der Verwendung der Spark-JDBC-API für den Datenbankzugriff, der Gestaltung von Datenbankschnittstellen und der Durchführung von Operationen unter Einbeziehung von Konfigurationsdaten.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit Objektspeichern, Data Lakes und Lakehouses und konzentrieren uns dabei auf deren Rolle bei der effizienten Verwaltung groß angelegter Datenworkflows.

Das ist alles enthalten

1 Video6 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit Spark-Transformationen, Aggregationen, Joins und Fensterfunktionen, um die Datenverarbeitung für BI und Analytik zu optimieren. Zu den wichtigsten Konzepten zählen die effiziente Datenbearbeitung und die Entwicklung von Datenpipelines.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit Deequ, um Datenqualitätsprüfungen durchzuführen, die Vollständigkeit und Richtigkeit zu analysieren und Einschränkungen festzulegen, um zuverlässige Datenpipelines zu gewährleisten.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit testgetriebener Entwicklung, statischer Codeanalyse und Linting, um die Codequalität, Wartbarkeit und Konsistenz in Data-Engineering-Projekten zu verbessern.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit CI/CD-Verfahren unter Verwendung von GitHub zur Automatisierung von Scala-Datenpipeline-Workflows, wobei der Schwerpunkt auf GitHub Actions, Versionskontrolle und zuverlässigen Bereitstellungsprozessen liegt.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der Orchestrierung von Datenpipelines mithilfe von Tools wie Airflow, Argo, Databricks und Azure Data Factory. Dabei konzentrieren wir uns auf das Workflow-Design, das Aufgabenmanagement und praktische Implementierungsstrategien.

Das ist alles enthalten

1 Video6 Lektüren1 Aufgabe

In diesem Abschnitt analysieren wir die Spark-UI-Metriken, um Leistungsprobleme zu identifizieren, das Daten-Shuffling zu optimieren und die Rechenressourcen für eine effiziente Datenverarbeitung bedarfsgerecht anzupassen.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der Erstellung von Batch-Pipelines unter Verwendung von Spark und Scala, wobei der Schwerpunkt auf der Medallion-Architektur, der Datenerfassung, der Datentransformation und der Orchestrierung für eine skalierbare Datenverarbeitung liegt.

Das ist alles enthalten

1 Video5 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der Erstellung von Echtzeit-Datenpipelines unter Verwendung von Spark, Scala und Kafka für IoT-Anwendungen. Zu den wichtigsten Konzepten zählen die Datenerfassung, die Datentransformation und die Gestaltung der Ausgabeschicht.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

Dozent

Packt - Course Instructors
Packt
1.946 Kurse573.323 Lernende

von

Packt

Mehr von Datenverwaltung entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen