Packt

Beschleunigen Sie das Modell Training mit PyTorch 2.X

Holen Sie sich eines unserer besten Angebote und erweitern Sie Ihre Fähigkeiten mit 50% Rabatt auf Coursera Plus. Jetzt sparen.

Packt

Beschleunigen Sie das Modell Training mit PyTorch 2.X

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Anfänger

Empfohlene Erfahrung

8 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Anfänger

Empfohlene Erfahrung

8 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Optimieren Sie das Modelltraining mithilfe von PyTorch und Techniken zur Leistungsoptimierung.

  • Nutzen Sie Bibliotheken mit Spezialisierung, um das CPU-basierte Training zu optimieren.

  • Erstellen Sie effiziente Datenpipelines, um die GPU-Auslastung zu verbessern.

Kompetenzen, die Sie erwerben

  • Kategorie: Hardware-Architektur
  • Kategorie: Modell Ausbildung
  • Kategorie: Modell-Optimierung
  • Kategorie: Daten-Pipelines
  • Kategorie: Verteiltes Rechnen
  • Kategorie: LLM-Bewerbung
  • Kategorie: Maschinelles Lernen
  • Kategorie: Leistungsoptimierung
  • Kategorie: Skalierbarkeit
  • Kategorie: Speicherverwaltung
  • Kategorie: Tiefes Lernen

Werkzeuge, die Sie lernen werden

  • Kategorie: AI-Arbeitsabläufe
  • Kategorie: PyTorch (Bibliothek für maschinelles Lernen)

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

Januar 2026

Bewertungen

11 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

In diesem Kurs gibt es 11 Module

In diesem Abschnitt befassen wir uns mit dem Trainingsprozess neuronaler Netze, analysieren Faktoren, die zur Rechenlast beitragen, und bewerten Elemente, die die Trainingszeit beeinflussen.

Das ist alles enthalten

2 Videos3 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit Techniken zur Beschleunigung des Modelltrainings durch Anpassung des Software-Stacks und Skalierung der Ressourcen. Zu den wichtigsten Konzepten zählen vertikale und horizontale Skalierung, Optimierungen auf Anwendungs- und Umgebungsebene sowie praktische Strategien zur Effizienzsteigerung.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der PyTorch 2.0 Compile-API zur Beschleunigung des Trainings von Deep-Learning-Modellen und konzentrieren uns dabei auf die Vorteile des Graph-Modus, die Nutzung der API sowie die Komponenten des Workflows zur Leistungsoptimierung.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit dem Einsatz von OpenMP für Multithreading und IPEX zur Optimierung von PyTorch auf Intel-CPUs, um die Leistung durch Spezialisierung der Bibliotheken zu steigern.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der Erstellung effizienter Datenpipelines, um Engpässe beim Training zu vermeiden. Zu den wichtigsten Konzepten gehören die Konfiguration von Workern, die Optimierung der GPU-Speicherübertragung und die Sicherstellung eines kontinuierlichen Datenflusses für das Training von ML-Modellen.

Das ist alles enthalten

1 Video2 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der Modellvereinfachung durch Pruning- und Komprimierungstechniken, um die Effizienz zu steigern, ohne dabei Leistungseinbußen in Kauf zu nehmen. Für die praktische Umsetzung nutzen wir das Microsoft NNI-Toolkit.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt untersuchen wir Strategien zur gemischten Genauigkeit, mit denen sich die Effizienz des Modelltrainings durch eine Reduzierung des Rechen- und Speicherbedarfs optimieren lässt, ohne dabei Abstriche bei der Genauigkeit zu machen. Dabei konzentrieren wir uns auf die Implementierung in PyTorch und die Hardwareauslastung.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit den Prinzipien des verteilten Trainings, parallelen Strategien und der PyTorch-Implementierung, um die Effizienz des Modelltrainings durch Ressourcenverteilung zu steigern.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit dem verteilten Training auf mehreren CPUs und konzentrieren uns dabei auf die Vorteile, die Umsetzung sowie den Einsatz von Intel oneCCL für eine effiziente Kommunikation in Umgebungen mit begrenzten Ressourcen.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit Trainingsstrategien für mehrere GPUs, analysieren Verbindungstopologien und konfigurieren NCCL für effiziente verteilte Deep-Learning-Operationen.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit dem verteilten Training auf Rechenclustern und konzentrieren uns dabei auf Open MPI und NCCL für eine effiziente Kommunikation und Ressourcenverwaltung über mehrere Rechner hinweg.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

Dozent

Packt - Course Instructors
Packt
1.946 Kurse576.973 Lernende

von

Packt

Mehr von Maschinelles Lernen entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen