Illinois Tech

Technologien für große Daten

Holen Sie sich eines unserer besten Angebote und erweitern Sie Ihre Fähigkeiten mit 50% Rabatt auf Coursera Plus. Jetzt sparen.

Illinois Tech

Technologien für große Daten

Dieser Kurs ist Teil mehrerer Programme.

Bei Coursera Plus enthalten

Fragen Sie Coursera

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

2.5 months to complete
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Auf einen Abschluss hinarbeiten
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

2.5 months to complete
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Auf einen Abschluss hinarbeiten

Was Sie lernen werden

  • Anwendungsfälle und Domänen von Big-Data-Problemen verstehen und identifizieren

  • Auswahl und Umsetzung technischer Lösungen im Zusammenhang mit Big-Data-Systemen

  • Entwicklung und Einsatz verschiedener Open-Source-Softwaresysteme (Apache) im Big-Data-Tech-Stack

  • Betrieb und Verwaltung verschiedener Cloud-Computing-Softwaredienste (AWS) im Bereich der Big-Data-Infrastruktur

Kompetenzen, die Sie erwerben

  • Kategorie: Große Daten
  • Kategorie: Verteiltes Rechnen
  • Kategorie: Datenverarbeitung
  • Kategorie: Daten-Ethik
  • Kategorie: Cloud Computing
  • Kategorie: Datenarchitektur
  • Kategorie: Datenverwaltung
  • Kategorie: Technologien zur Datenspeicherung
  • Kategorie: Daten-Infrastruktur
  • Kategorie: Datenbanken
  • Kategorie: Daten in Echtzeit

Werkzeuge, die Sie lernen werden

  • Kategorie: Apache Cassandra
  • Kategorie: MongoDB
  • Kategorie: Apache Hadoop
  • Kategorie: Apache Spark
  • Kategorie: NoSQL
  • Kategorie: Datenbank-Management-Systeme
  • Kategorie: Apache Hive
  • Kategorie: Apache Kafka
  • Kategorie: Daten-Seen

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

54 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist als Teil verfügbar
Wenn Sie sich für diesen Kurs anmelden, müssen Sie auch ein bestimmtes Programm auswählen.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 9 Module

Willkommen bei „Big Data Technologies“! In Modul 1 erwerben die Studierenden ein grundlegendes Verständnis von Analysedaten, deren inhärentem Wert und den Methoden, mit denen sich Rohdaten in wertvolle Erkenntnisse umwandeln lassen. Dieses Modul behandelt die Herausforderungen beim Umgang mit großen Datensätzen, einschließlich deren Erfassung, Verarbeitung und Analyse, und bietet gleichzeitig einen umfassenden Überblick über die Ursprünge, Eigenschaften und praktischen Anwendungen von Big Data. Darüber hinaus setzen sich die Studierenden mit den wirtschaftlichen, logistischen und ethischen Aspekten im Zusammenhang mit Big Data auseinander und lernen die beruflichen Vorteile kennen, die sich für Datenwissenschaftler ergeben, die sich mit der Analyse von Big Data auskennen.

Das ist alles enthalten

16 Videos10 Lektüren8 Aufgaben1 Diskussionsthema

Modul 2 führt die Studierenden in die Herausforderungen beim Aufbau und der Verwaltung verteilter Systeme für die Speicherung und Verarbeitung von Big Data ein. Es behandelt die Ursprünge, Konzepte, Kernkomponenten und wesentlichen Merkmale von Hadoop und befasst sich dabei mit den Tools und Diensten des Hadoop-Ökosystems. Die Studierenden erwerben Kenntnisse über verteilte Dateisysteme, insbesondere HDFS, das Ressourcenmanagement von YARN sowie verschiedene Technologien für die effektive Speicherung und Organisation von Big Data.

Das ist alles enthalten

13 Videos7 Lektüren6 Aufgaben

In Modul 3 setzen sich die Studierenden mit den Unterschieden bei der Verarbeitung kleiner bis mittlerer gegenüber riesigen Datenmengen mittels verteilter Datenverarbeitung auseinander. Dieses Modul behandelt die Schlüsselkonzepte des MapReduce-Frameworks, darunter auch, wie es große Datenverarbeitungsaufgaben in kleinere, parallel ablaufende Aufgaben aufteilt, um eine effiziente Ausführung zu gewährleisten. Die Studierenden lernen außerdem die Phasen von MapReduce, die Rolle von Map- und Reduce-Funktionen, Optimierungsmuster sowie die Vorteile und Einschränkungen verschiedener Entwicklungsansätze kennen, darunter Java-basiertes MapReduce und Hadoop Streaming.

Das ist alles enthalten

18 Videos8 Lektüren7 Aufgaben

In Modul 4 befassen sich die Studierenden mit Apache Spark als leistungsstarkem Framework für die verteilte Datenverarbeitung, das sich für interaktive, Batch- und Streaming-Aufgaben eignet. Dieses Modul behandelt die Kernfunktionen von Spark, darunter maschinelles Lernen, Graphverarbeitung sowie die Verarbeitung strukturierter und unstrukturierter Daten, und hebt dabei insbesondere das Potenzial der In-Memory-Verarbeitung sowie den einheitlichen Charakter des Frameworks hervor. Die Teilnehmer vergleichen Spark mit MapReduce, lernen die Hauptkomponenten von Spark, die Ausführungsarchitektur, Resilient Distributed Datasets (RDDs), DataFrames, Datasets sowie die verschiedenen Methoden zur Erstellung und Optimierung von DataFrames für eine effiziente Datenverarbeitung kennen.

Das ist alles enthalten

25 Videos7 Lektüren6 Aufgaben

In Modul 5 beschäftigen sich die Teilnehmer eingehender mit den Möglichkeiten von Spark zur Datenbearbeitung und -transformation. Das Modul behandelt grundlegende Operationen wie das Auswählen, Filtern und Sortieren von Daten sowie das Verknüpfen von DataFrames und das Durchführen von Aggregationen. Die Teilnehmer lernen außerdem den Umgang mit Nullwerten, die Verwendung von Spark SQL für Datenabfragen und die Leistungsoptimierung durch Caching. Zu den praktischen Anwendungen gehören das Erstellen und Bearbeiten von DataFrames, das Ausführen von Transformationen und Aktionen sowie das effiziente Schreiben von Daten in verschiedene Formate.

Das ist alles enthalten

19 Videos11 Lektüren10 Aufgaben

Modul 6 führt die Studierenden in die Grenzen der Batch-Verarbeitung und die Bedeutung der Echtzeit-Datenverarbeitung ein. Es behandelt wesentliche Aspekte der Stream-Verarbeitung, einschließlich Datenerfassung und -analyse, wobei der Schwerpunkt auf Tools wie Apache Kafka für die Stream-Erfassung und Spark Structured Streaming für eine skalierbare und fehlertolerante Datenverarbeitung liegt. Die Studierenden befassen sich außerdem mit verschiedenen Entwurfsmustern zur Organisation von Big-Data-Clustern, dem Konzept der Data Lakes sowie der Lambda-Architektur zur Vereinheitlichung der Echtzeit- und Batch-Datenverarbeitung in modernen Datenumgebungen.

Das ist alles enthalten

16 Videos6 Lektüren6 Aufgaben

In Modul 7 setzen sich die Studierenden mit den Vorteilen und Grenzen relationaler Datenbanken im Big-Data-Kontext sowie mit dem Konzept verteilter Datenbanksysteme auseinander. Dieses Modul behandelt NoSQL-Datenbanken, ihre vielfältigen Datenmodelle sowie ihre Vorteile hinsichtlich Skalierbarkeit und Flexibilität. Die Studierenden lernen außerdem praktische Anwendungsfälle, Datenpartitionierung, Konsistenzmodelle und das CAP-Theorem kennen und erwerben so ein umfassendes Verständnis dafür, wie NoSQL-Datenbanken große Datensätze über Cluster hinweg verwalten und dabei Skalierbarkeit und Verfügbarkeit gewährleisten.

Das ist alles enthalten

18 Videos6 Lektüren6 Aufgaben

In Modul 8 befassen sich die Studierenden mit bestimmten NoSQL-Datenbanktypen – nämlich Schlüssel-Wert-, Wide-Column- und Dokumentendatenbanken. Zwei ähnliche Systeme, HBase und Cassandra, werden im Kontext des CAP-Theorems und der damit verbundenen CP/AP-Abwägungen untersucht und gegenübergestellt. Themen wie Konsistenz und Verfügbarkeit werden im Zusammenhang mit konkreten Anwendungsszenarien für HBase und Cassandra erörtert – dabei werden die allgemeinen Anwendungsbereiche beider Systeme hervorgehoben. Abschließend wird die Dokumentendatenbank MongoDB im Zusammenhang mit Anwendungsfällen der Verarbeitung natürlicher Sprache bzw. von Text betrachtet – und die Nutzung sowie die Architektur von MongoDB im Vergleich zu herkömmlichen RDBMS analysiert.

Das ist alles enthalten

9 Videos4 Lektüren4 Aufgaben

Dieses Modul enthält die abschließende Kursbeurteilung, mit der Ihr Verständnis des Kursmaterials und Ihre Fähigkeit, das im Kurs erworbene Wissen anzuwenden, beurteilt werden sollen.

Das ist alles enthalten

1 Aufgabe

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Auf einen Abschluss hinarbeiten

Dieses Kurs ist Teil des/der folgenden Studiengangs/Studiengänge, die von Illinois Techangeboten werden. Wenn Sie zugelassen werden und sich immatrikulieren, können Ihre abgeschlossenen Kurse auf Ihren Studienabschluss angerechnet werden und Ihre Fortschritte können mit Ihnen übertragen werden.¹

Dozent

Yousef Elmehdwi
Illinois Tech
4 Kurse7.709 Lernende

von

Illinois Tech

Mehr von Software-Entwicklung entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen