Glossar

Epoche

Erfahren Sie mehr über Epochen beim maschinellen Lernen - wie sie sich auf die Modellschulung auswirken, eine Überanpassung verhindern und die Leistung mit Ultralytics YOLO optimieren.

Beim maschinellen Lernen (ML) stellt eine Epoche einen vollständigen Durchlauf des gesamten Trainingsdatensatzes durch den Lernalgorithmus dar. Sie ist ein grundlegendes Konzept im iterativen Prozess des Trainings neuronaler Netze (NN), bei dem Modelle durch wiederholtes Betrachten von Beispielen aus den Daten lernen. Die Anzahl der Epochen ist ein Schlüsselparameter, der bestimmt, wie oft das Modell aus dem gesamten Trainingsdatensatz lernt, was sich direkt auf die endgültige Leistung und Qualität des Modells auswirkt.

Die Rolle der Epochen bei der Modellbildung

Das Hauptziel der Modellschulung besteht darin, ein Modell in die Lage zu versetzen, Muster aus Daten zu lernen. Dies wird erreicht, indem die internen Parameter des Modells, die als Modellgewichte bezeichnet werden, angepasst werden, um eine Verlustfunktion zu minimieren, die den Fehler zwischen den Vorhersagen des Modells und der tatsächlichen Realität quantifiziert. Während einer einzelnen Epoche verarbeitet das Modell jede Datenprobe, und ein Optimierungsalgorithmus wie Stochastic Gradient Descent (SGD) aktualisiert diese Gewichte.

Durch das Training eines Modells über mehrere Epochen hinweg können seine Parameter iterativ verfeinert werden. Mit jedem Durchgang sollte das Modell theoretisch besser in seiner Aufgabe werden, sei es die Bildklassifizierung oder die Objekterkennung. Dieser Prozess wird mit gängigen Deep-Learning-Frameworks wie PyTorch oder TensorFlow gesteuert.

Epochen vs. Iterationen vs. Chargen

Diese Begriffe sind zwar miteinander verwandt, beschreiben aber unterschiedliche Aspekte des Ausbildungsprozesses und werden oft verwechselt.

  • Epoche: Ein vollständiger Zyklus, in dem das Modell den gesamten Trainingsdatensatz gesehen hat.
  • Größe der Charge: Die Anzahl der Trainingsmuster, die in einer einzigen Iteration verwendet werden. Aufgrund von Speicherbeschränkungen ist es oft unpraktisch, den gesamten Datensatz auf einmal zu verarbeiten.
  • Iteration: Eine einzelne Aktualisierung der Gewichte des Modells. Eine Iteration umfasst die Verarbeitung eines Datenstapels und die Durchführung eines Vorwärts- und Rückwärtsdurchlaufs(Backpropagation).

Wenn ein Datensatz zum Beispiel 10.000 Bilder enthält und die Stapelgröße 100 beträgt, besteht eine Epoche aus 100 Iterationen (10.000 Bilder / 100 Bilder pro Stapel).

Bestimmung der richtigen Anzahl von Epochen

Die Wahl der richtigen Epochenzahl ist ein entscheidender Teil der Abstimmung der Hyperparameter. Dabei geht es darum, ein Gleichgewicht zu finden, um zwei häufige Probleme zu vermeiden:

  • Underfitting: Dies tritt auf, wenn das Modell nicht für genügend Epochen trainiert wird. Es lernt die zugrundeliegenden Muster in den Daten nicht und schneidet sowohl bei den Trainings- als auch bei den Testdaten schlecht ab.
  • Überanpassung: Dies geschieht, wenn das Modell für zu viele Epochen trainiert wird. Es beginnt, sich die Trainingsdaten einschließlich des Rauschens zu "merken" und verliert seine Fähigkeit zur Generalisierung auf neue, ungesehene Daten. Es kann zwar eine ausgezeichnete Genauigkeit auf dem Trainingssatz haben, aber seine Leistung auf den Validierungsdaten wird schlecht sein.

Eine gängige Technik zur Bekämpfung der Überanpassung ist das frühzeitige Beenden des Trainings, bei dem das Training gestoppt wird, sobald sich die Leistung des Modells in einem Validierungssatz nicht mehr verbessert. Der Fortschritt kann mit Tools wie TensorBoard oder über Plattformen wie Ultralytics HUB überwacht werden, die helfen, die Trainingsmetriken über Epochen hinweg zu visualisieren.

Beispiele aus der Praxis

Das Konzept der Epochen ist bei Deep-Learning-Anwendungen universell.

  1. Autonomes Fahren: Ein Objekterkennungsmodell für ein autonomes Fahrzeug wird auf einem umfangreichen Datensatz wie Argoverse trainiert. Das Modell, wie z. B. Ultralytics YOLO11, kann für 50-100 Epochen trainiert werden. Nach jeder Epoche wird die Leistung des Modells auf einem Validierungssatz anhand von Metriken wie der mittleren durchschnittlichen Präzision (mAP) gemessen. Vor dem Einsatz wählen die Ingenieure das Modell aus der Epoche aus, das die beste Balance zwischen Geschwindigkeit und Genauigkeit bietet.

  2. Medizinische Bildanalyse: Ein Modell für die Tumorerkennung in Gehirnscans wird auf einem speziellen Datensatz für medizinische Bildgebung trainiert. Da solche Datensätze klein sein können, wird das Modell möglicherweise für mehrere hundert Epochen trainiert. Um eine Überanpassung zu vermeiden, werden Techniken wie die Datenerweiterung eingesetzt, und der Validierungsverlust wird nach jeder Epoche genau überwacht. Auf diese Weise wird sichergestellt, dass das endgültige Modell gut auf Scans von neuen Patienten verallgemeinert werden kann. Die Befolgung etablierter Tipps zur Modellschulung ist entscheidend für den Erfolg bei solch kritischen Anwendungen.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert