Illinois Tech

Datenaufbereitung und -analyse

Holen Sie sich eines unserer besten Angebote und erweitern Sie Ihre Fähigkeiten mit 50% Rabatt auf Coursera Plus. Jetzt sparen.

Illinois Tech

Datenaufbereitung und -analyse

Dieser Kurs ist Teil mehrerer Programme.

Ming-Long Lam
Jawahar Panchal

Dozenten: Ming-Long Lam

2.794 bereits angemeldet

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

2 months to complete
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

2 months to complete
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • 1. Anwendung geeigneter Techniken zur Gewinnung von Erkenntnissen aus Daten.

    2. Selbstbewusstes Präsentieren umsetzbarer LÜsungen vor den Interessengruppen des Unternehmens.

Kompetenzen, die Sie erwerben

  • Kategorie: Vorverarbeitung von Daten
  • Kategorie: Bewertung des Modells
  • Kategorie: Entscheidungsbaum-Lernen
  • Kategorie: Bereinigung von Daten
  • Kategorie: Korrelationsanalyse
  • Kategorie: Explorative Datenanalyse
  • Kategorie: Methoden des maschinellen Lernens
  • Kategorie: Statistische Methoden
  • Kategorie: Algorithmen fĂźr maschinelles Lernen
  • Kategorie: Maschinelles Lernen
  • Kategorie: Datenvisualisierung
  • Kategorie: Statistische Analyse
  • Kategorie: Präsentation der Daten
  • Kategorie: Angewandtes maschinelles Lernen
  • Kategorie: Modell Ausbildung
  • Kategorie: Analytik
  • Kategorie: Datenanalyse
  • Kategorie: Datenverarbeitung
  • Kategorie: Wahrscheinlichkeitsrechnung und Statistik
  • Kategorie: Logistische Regression

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufĂźgen

Bewertungen

32 Aufgaben

Unterrichtet in Englisch
Auf einen Abschluss hinarbeiten

Erfahren Sie, wie Mitarbeiter fĂźhrender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist als Teil verfĂźgbar
Wenn Sie sich fßr diesen Kurs anmelden, mßssen Sie auch ein bestimmtes Programm auswählen.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 9 Module

Willkommen bei der Datenaufbereitung und -analyse! Modul 1 fßhrt die Studierenden in die Kunst der Erstellung informativer und visuell ansprechender Histogramme ein, einem grundlegenden Aspekt der Datenvisualisierung. Die Teilnehmer lernen Techniken zur Messung der Lage und Skalierung von Daten kennen und verstehen die Ursachen und Auswirkungen von Rauschen und fehlenden Werten in Datensätzen. In diesem Modul werden auch der CRISP-DM-Prozess, ein strukturierter Ansatz fßr Data Mining, sowie das Analytics Ascendancy Model von Gartner fßr fortgeschrittene Datenanalysen vorgestellt. Darßber hinaus lernen die Teilnehmer den Unterschied zwischen Rohdaten und verarbeiteten Informationen kennen, ein Schlßsselkonzept fßr eine effektive Dateninterpretation und Entscheidungsfindung.

Das ist alles enthalten

10 Videos7 LektĂźren4 Aufgaben1 Diskussionsthema1 Unbewertetes Labor

Modul 2 taucht in die Feinheiten der statistischen Analyse ein, beginnend mit einem grßndlichen Verständnis des Konzepts des P-Wertes und seiner Bedeutung als Indikator fßr Fehler 1. Die Teilnehmer lernen, statistische Tests in Python anzuwenden, um signifikant korrelierte Merkmale zu identifizieren, und erforschen verschiedene Korrelationsmetriken, die auf kategoriale, gemischte und kontinuierliche Merkmale zugeschnitten sind. Dieses Modul legt den Schwerpunkt auf die praktische Anwendung und vermittelt den Studierenden die Fähigkeit, diese Metriken mit Python zu berechnen und zu interpretieren, wodurch ihre Fähigkeit zur Durchfßhrung anspruchsvoller Datenanalysen und zum Ziehen aussagekräftiger Schlussfolgerungen aus komplexen Datensätzen verbessert wird.

Das ist alles enthalten

7 Videos5 LektĂźren4 Aufgaben1 Unbewertetes Labor

Modul 3 bietet einen tiefen Einblick in die Welt der Assoziationsregeln und lehrt die Teilnehmer, wie sie diese Regeln zur Identifizierung wertvoller Merkmalskombinationen, die bestimmte Label-Werte erzeugen, improvisieren können. Die Lernenden beherrschen die Einstellung geeigneter Schwellenwerte für Support und Confidence und gewinnen ein umfassendes Verständnis des Apriori Algorithmus und der Bedeutung von Frequent Itemsets innerhalb dieses Algorithmus. Dieses Modul behandelt die Berechnung gängiger Metriken für Assoziationsregeln und macht die Lernenden mit der relevanten Terminologie vertraut. Darüber hinaus werden die Lernenden die praktische Anwendung von Assoziationsregeln in der Warenkorbanalyse erforschen, einschließlich Strategien für Cross-Selling, Up-Selling und Produktbündelung, wodurch sie mit wertvollen Fähigkeiten für fortgeschrittene datengesteuerte Entscheidungsfindung in Geschäftskontexten ausgestattet werden.

Das ist alles enthalten

7 Videos5 LektĂźren3 Aufgaben1 Unbewertetes Labor

In Modul 4 lernen die Studierenden, Profile von Clustern zu beschreiben und zu interpretieren, und erwerben Kenntnisse in der Bereitstellung der Algorithmen K-Means und K-Modes fßr Clustering. Sie erforschen die Anwendung der Recency, Frequency, and Monetary (RFM) Analyse, um die wertvollsten Kunden im Einzelhandel zu identifizieren. Das Modul behandelt auch die Technik der einfachen Stichprobe mit der MÜglichkeit, Variablen zur Schichtung einzubeziehen, um die Präzision der Datenanalyse zu verbessern. Darßber hinaus wird die Bedeutung der objektiven Validierung von Modellen mithilfe einer Testpartition hervorgehoben, um die Reliabilität und Effektivität der analytischen Modelle in realen Szenarien zu gewährleisten.

Das ist alles enthalten

8 Videos5 LektĂźren4 Aufgaben1 Unbewertetes Labor

Dieses Modul befasst sich mit der Analyse der Bedeutung von Merkmalen beim Maschinellen Lernen und behandelt Shapley-Werte, Methoden zur Feature Selection, statistische Auswertung, Interaktion von Merkmalen, Aliasing und den Algorithmus der kleinsten Quadrate. Die Studierenden werden in der Lage sein, diese Konzepte zu beherrschen, um robuste und interpretierbare Modelle zu erstellen.

Das ist alles enthalten

8 Videos5 LektĂźren4 Aufgaben1 Unbewertetes Labor

In Modul 6 beherrschen die Studierenden die Kunst der Feature Selection beim Maschinellen Lernen, indem sie die Vorwärts- und Rückwärtsselektionsmethode, die All-Possible Subsets-Methode und das Konzept der vollständigen und quasi-vollständigen Trennung erforschen. Die Studierenden lernen außerdem Assoziationsregeln zur Identifizierung von Trennungen kennen, interpretieren Modellparameter und vorhergesagte Wahrscheinlichkeiten und befassen sich mit den Konzepten der Maximum-Likelihood-Schätzung, Quoten und Quotenverhältnissen.

Das ist alles enthalten

6 Videos5 LektĂźren4 Aufgaben1 Unbewertetes Labor

Modul 7 vermittelt den Teilnehmern die Fähigkeit, die Leistungsfähigkeit von baumbasierten Modellen zu nutzen, um verborgene Muster in Ihren Daten aufzudecken. Die Studierenden sind in der Lage, Cluster effektiv zu beschreiben, Algorithmen intelligent zu parametrisieren, Geschäftsregeln aus Baumergebnissen zu konstruieren und Abweichungsmetriken, Entropiewerte und Gini-Indizes fßr eine optimale Baumkonstruktion zu nutzen.

Das ist alles enthalten

7 Videos5 LektĂźren4 Aufgaben1 Unbewertetes Labor

Modul 8 taucht in das Gebiet der Bewertungsmetriken fßr Modelle des Maschinellen Lernens ein. Die Studierenden beherrschen die Konzepte von Präzisions- und Recall-Kurven, Lift-Kurven und Receiver-Operating-Characteristics (ROC)-Kurven. Darßber hinaus lernen die Studierenden Methoden zur Berechnung von Wahrscheinlichkeitsschwellenwerten mithilfe der Kolmogorov-Smirnov-Statistik und F1-Scores kennen. Sie werden in der Lage sein, Metriken wie die Fehlklassifizierungsrate, die Fläche unter der Kurve (AUC) und den mittleren quadratischen Fehler (Root Mean Squared Error, RMSE) sowie Techniken zur Berechnung des RMSE und zur Erkennung von stark fehlangepassten Beobachtungen unter Verwendung modellspezifischer Residuen zu erkunden.

Das ist alles enthalten

8 Videos5 LektĂźren4 Aufgaben1 Unbewertetes Labor

Dieses Modul enthält die abschließende Kursbeurteilung, mit der Ihr Verständnis des Kursmaterials und Ihre Fähigkeit, das im Kurs erworbene Wissen anzuwenden, beurteilt werden soll. Lesen Sie das Kursmaterial gründlich durch, bevor Sie den Test ablegen.

Das ist alles enthalten

1 Aufgabe

Erwerben Sie ein Karrierezertifikat.

FĂźgen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Auf einen Abschluss hinarbeiten

Dieses Kurs ist Teil des/der folgenden Studiengangs/Studiengänge, die von Illinois Techangeboten werden. Wenn Sie zugelassen werden und sich immatrikulieren, kÜnnen Ihre abgeschlossenen Kurse auf Ihren Studienabschluss angerechnet werden und Ihre Fortschritte kÜnnen mit Ihnen ßbertragen werden.š

Dozenten

Ming-Long Lam
Illinois Tech
1 Kurs2.794 Lernende
Jawahar Panchal
Illinois Tech
1 Kurs2.794 Lernende

von

Illinois Tech

Warum entscheiden sich Menschen fĂźr Coursera fĂźr ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen