Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Epoche

Erfahren Sie mehr über Epochen im maschinellen Lernen–wie sie das Modelltraining beeinflussen, Overfitting verhindern und die Leistung mit Ultralytics YOLO optimieren.

Im maschinellen Lernen (ML) stellt eine Epoche einen vollständigen Durchlauf des gesamten Trainingsdatensatzes durch den Lernalgorithmus dar. Es ist ein grundlegendes Konzept im iterativen Prozess des Trainings von neuronalen Netzen (NN), bei dem Modelle lernen, indem sie wiederholt Beispiele aus den Daten sehen. Die Anzahl der Epochen ist ein wichtiger Parameter, der bestimmt, wie oft das Modell aus dem vollständigen Satz von Trainingsinformationen lernt, was die endgültige Leistung und Qualität des Modells direkt beeinflusst.

Die Rolle von Epochen im Modelltraining

Das Hauptziel des Modelltrainings ist es, einem Modell zu ermöglichen, Muster aus Daten zu lernen. Dies wird erreicht, indem die internen Parameter des Modells, die als Modellgewichte bezeichnet werden, so angepasst werden, dass eine Loss-Funktion minimiert wird, die den Fehler zwischen den Vorhersagen des Modells und der tatsächlichen Ground Truth quantifiziert. Während einer einzelnen Epoche verarbeitet das Modell jede Datenstichprobe, und ein Optimierungsalgorithmus wie Stochastic Gradient Descent (SGD) aktualisiert diese Gewichte.

Das Trainieren eines Modells über mehrere Epochen hinweg ermöglicht es, seine Parameter iterativ zu verfeinern. Mit jedem Durchlauf sollte das Modell theoretisch besser in seiner Aufgabe werden, sei es Bildklassifizierung oder Objekterkennung. Dieser Prozess wird mit gängigen Deep-Learning-Frameworks wie PyTorch oder TensorFlow verwaltet.

Epochen vs. Iterationen vs. Batches

Obwohl verwandt, beschreiben diese Begriffe verschiedene Aspekte des Trainingsprozesses und werden oft verwechselt.

  • Epoche: Ein vollständiger Durchlauf, in dem das Modell den gesamten Trainingsdatensatz gesehen hat.
  • Batch-Größe: Die Anzahl der Trainingsbeispiele, die in einer einzelnen Iteration verwendet werden. Aufgrund von Speicherbeschränkungen ist es oft unpraktisch, den gesamten Datensatz auf einmal zu verarbeiten.
  • Iteration: Eine einzelne Aktualisierung der Gewichte des Modells. Eine Iteration beinhaltet die Verarbeitung eines Daten-Batches und die Durchführung eines Forward- und Backward-Passes (Backpropagation).

Wenn ein Datensatz beispielsweise 10.000 Bilder enthält und die Batch-Größe 100 beträgt, besteht eine Epoche aus 100 Iterationen (10.000 Bilder / 100 Bilder pro Batch).

Bestimmung der richtigen Anzahl von Epochen

Die Wahl der richtigen Anzahl von Epochen ist ein wichtiger Bestandteil des Hyperparameter-Tunings. Es geht darum, ein Gleichgewicht zu finden, um zwei häufige Probleme zu vermeiden:

  • Underfitting: Dies tritt auf, wenn das Modell nicht für genügend Epochen trainiert wird. Es lernt die zugrunde liegenden Muster in den Daten nicht und schneidet sowohl bei den Trainings- als auch bei den Testdaten schlecht ab.
  • Overfitting: Dies geschieht, wenn das Modell zu viele Epochen trainiert wird. Es beginnt, die Trainingsdaten zu "memorieren", einschließlich ihres Rauschens, und verliert seine Fähigkeit, auf neue, ungesehene Daten zu generalisieren. Während es eine ausgezeichnete Genauigkeit auf dem Trainingsdatensatz aufweisen kann, ist seine Leistung auf den Validierungsdaten schlecht.

Eine gängige Technik zur Bekämpfung von Overfitting ist das Early Stopping, bei dem das Training gestoppt wird, sobald sich die Leistung des Modells auf einem Validierungsdatensatz nicht mehr verbessert. Der Fortschritt kann mit Tools wie TensorBoard oder über Plattformen wie Ultralytics HUB überwacht werden, was hilft, Trainingsmetriken über Epochen hinweg zu visualisieren.

Beispiele aus der Praxis

Das Konzept der Epochen ist in Deep-Learning-Anwendungen universell.

  1. Autonomes Fahren: Ein Objekterkennungs-Modell für ein autonomes Fahrzeug wird auf einem riesigen Datensatz wie Argoverse trainiert. Das Modell, wie z. B. Ultralytics YOLO11, könnte für 50-100 Epochen trainiert werden. Nach jeder Epoche wird seine Leistung auf einem Validierungsdatensatz anhand von Metriken wie Mean Average Precision (mAP) gemessen. Ingenieure wählen das Modell aus der Epoche aus, das das beste Gleichgewicht zwischen Geschwindigkeit und Genauigkeit bietet, bevor es bereitgestellt wird.

  2. Medizinische Bildanalyse: Ein Modell zur Tumorerkennung in Gehirnscans wird auf einem spezialisierten medizinischen Bildgebungsdatensatz trainiert. Da solche Datensätze klein sein können, wird das Modell möglicherweise mehrere hundert Epochen lang trainiert. Um ein Overfitting zu verhindern, werden Techniken wie Datenerweiterung eingesetzt und der Validierungsverlust nach jeder Epoche genau überwacht. Dies stellt sicher, dass das endgültige Modell auf Scans von neuen Patienten gut generalisiert. Die Befolgung etablierter Tipps zum Modelltraining ist für den Erfolg in solch kritischen Anwendungen entscheidend.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert