Glossar

Aktives Lernen

Entdecken Sie aktives Lernen, eine kosteneffiziente Methode des maschinellen Lernens, die die Genauigkeit mit weniger Etiketten erhöht. Erfahren Sie, wie es das KI-Training verändert!

Aktives Lernen ist eine spezielle Trainingsmethode beim maschinellen Lernen (ML), bei der ein Lernalgorithmus interaktiv einen Benutzer oder eine andere Informationsquelle (ein "Orakel") abfragen kann, um neue Datenpunkte zu kennzeichnen. Der Kerngedanke ist, dass ein Modell, das die Daten, aus denen es lernt, selbst auswählen kann, mit deutlich weniger Trainingsdaten eine höhere Genauigkeit erreichen kann. Dies ist besonders wertvoll in Bereichen, in denen die Kennzeichnung von Daten teuer und zeitaufwändig ist oder Expertenwissen erfordert. Anstatt den gesamten Datensatz auf einmal zu beschriften, werden beim aktiven Lernen die "informativsten" Stichproben für die Beschriftung priorisiert, wodurch der Modellschulungsprozess wesentlich effizienter wird.

Wie aktives Lernen funktioniert

Der aktive Lernprozess ist zyklisch und wird oft als "Human-in-the-Loop" -Workflow beschrieben. Er folgt in der Regel diesen Schritten:

  1. Erstes Modell-Training: Ein Modell, wie z. B. ein Ultralytics YOLO11-Detektor, wird zunächst auf einem kleinen, anfänglich gekennzeichneten Datensatz trainiert.
  2. Abfrage unmarkierter Daten: Das teilweise trainierte Modell wird dann verwendet, um Vorhersagen für einen großen Pool von nicht gekennzeichneten Daten zu treffen. Auf der Grundlage dieser Vorhersagen wählt das Modell eine Untergruppe von Stichproben aus, bei denen es sich am meisten "unsicher" ist.
  3. Menschliche Beschriftung: Diese unsicheren Proben werden einem menschlichen Experten (dem Orakel) vorgelegt, der die korrekten Bezeichnungen liefert.
  4. Erweiterung des Datensatzes: Die neu beschrifteten Proben werden dem Trainingssatz hinzugefügt.
  5. Neu trainieren: Das Modell wird anhand des aktualisierten, größeren Datensatzes neu trainiert. Dieser Zyklus wiederholt sich, bis die Leistung des Modells einen gewünschten Schwellenwert erreicht oder das Budget für die Beschriftung erschöpft ist.

Der Schlüssel zu diesem Prozess liegt in der Abfragestrategie. Zu den gängigen Strategien gehören das Unsicherheitssampling (Auswahl von Instanzen, bei denen das Modell am wenigsten zuversichtlich ist), die Abfrage durch ein Komitee (Verwendung mehrerer Modelle und Auswahl von Instanzen, bei denen sie sich nicht einig sind) oder die Schätzung der erwarteten Modelländerung. Einen guten Überblick über diese Strategien finden Sie in dieser Active Learning Übersicht.

Anwendungen in der realen Welt

Aktives Lernen ist in Fachgebieten, in denen die Kommentierung durch Experten einen Engpass darstellt, sehr effektiv.

  • Medizinische Bildanalyse: Beim Training einer KI zur Erkennung von Krankheiten wie Krebs anhand von medizinischen Scans stehen möglicherweise Millionen von Bildern zur Verfügung, aber nur ein begrenzter Teil der Zeit eines Radiologen. Anstatt die Bilder nach dem Zufallsprinzip zu beschriften, kann ein aktives Lernsystem die mehrdeutigsten oder seltensten Fälle zur Überprüfung herausfiltern. Dadurch wird die Arbeit des Experten auf die Bereiche konzentriert, in denen sie am dringendsten benötigt wird, und die Entwicklung eines hochpräzisen Modells für Aufgaben wie die Erkennung von Hirntumoren beschleunigt. Die Forschung in diesem Bereich zeigt eine erhebliche Verringerung des Beschriftungsaufwands, wie in Studien wie dieser über die Segmentierung biomedizinischer Bilder beschrieben.
  • Autonomes Fahren: Wahrnehmungssysteme in autonomen Fahrzeugen müssen auf umfangreichen und vielfältigen Datensätzen trainiert werden, die unzählige Fahrszenarien abdecken. Aktives Lernen kann aus den gesammelten Fahrdaten "Grenzfälle" identifizieren - etwa einen Fußgänger, der teilweise durch ein Hindernis verdeckt ist, oder ungewöhnliche Wetterbedingungen -, mit denen das aktuelle Objekterkennungsmodell Schwierigkeiten hat. Durch die Priorisierung dieser schwierigen Szenen für die Beschriftung können die Entwickler die Robustheit und Sicherheit des Modells effektiver verbessern.

Aktives Lernen vs. verwandte Konzepte

Es ist wichtig, Active Learning von anderen Lernparadigmen zu unterscheiden, die ebenfalls mit unbeschrifteten Daten arbeiten:

  • Semi-Überwachtes Lernen: Verwendet beim Training gleichzeitig gekennzeichnete und nicht gekennzeichnete Daten. Im Gegensatz zum aktiven Lernen verwendet es in der Regel passiv alle verfügbaren unmarkierten Daten, anstatt selektiv bestimmte Instanzen nach Markierungen abzufragen.
  • Selbstüberwachtes Lernen: Lernt Repräsentationen aus unmarkierten Daten durch die Erstellung von Vorgabeaufgaben (z. B. Vorhersage eines maskierten Teils eines Bildes). Es erfordert keine menschlichen Anmerkungen während der Pre-Trainingsphase, wohingegen aktives Lernen auf ein Orakel für Beschriftungen angewiesen ist. DeepMind hat diesen Bereich ausgiebig erforscht.
  • Verstärkendes Lernen: Lernt durch Versuch und Irrtum durch Interaktionen mit einer Umgebung, wobei es für Aktionen Belohnungen oder Bestrafungen erhält. Es beinhaltet keine Abfrage nach expliziten Kennzeichnungen wie beim aktiven Lernen.
  • Föderiertes Lernen: Konzentriert sich auf das Trainieren von Modellen über dezentrale Geräte hinweg, wobei die Daten lokal gehalten werden, um in erster Linie Bedenken hinsichtlich des Datenschutzes auszuräumen. Aktives Lernen konzentriert sich auf die effiziente Beschriftungserfassung. Diese Techniken können manchmal auch kombiniert werden.

Werkzeuge und Umsetzung

Die Implementierung von Active Learning beinhaltet häufig die Integration von ML-Modellen mit Annotationstools und die Verwaltung des Daten-Workflows. Frameworks wie scikit-learn bieten einige Funktionalitäten, während für bestimmte Aufgaben spezialisierte Bibliotheken existieren. Annotationssoftware wie Label Studio kann in Active Learning-Pipelines integriert werden und ermöglicht es Annotatoren, Labels für abgefragte Proben bereitzustellen. Eine effektive Verwaltung der sich entwickelnden Datensätze und trainierten Modelle ist von entscheidender Bedeutung, und Plattformen wie Ultralytics HUB bieten eine Infrastruktur für die Organisation dieser Ressourcen während des gesamten Entwicklungszyklus. Weitere Informationen zur Implementierung fortgeschrittener ML-Techniken finden Sie im Ultralytics GitHub-Repository.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert