Active Learning
Entdecke, wie Active Learning das KI-Training optimiert. Lerne, Ultralytics YOLO26 zu verwenden, um informative Daten zu identifizieren, Kennzeichnungskosten zu senken und die Genauigkeit zu steigern.
Aktives Lernen (Active Learning) ist ein strategischer Ansatz im Machine Learning (ML), bei dem der Algorithmus proaktiv die informativsten Datenpunkte für die Kennzeichnung auswählt, anstatt passiv einen bereits gekennzeichneten Datensatz zu akzeptieren. Beim traditionellen überwachten Lernen benötigen Modelle oft enorme Mengen an annotierten Daten, deren Erstellung teuer und zeitaufwendig sein kann. Aktives Lernen optimiert diesen Prozess, indem es "unsichere" oder "schwierige" Beispiele identifiziert – also solche, die nahe an der Entscheidungsgrenze liegen oder bei denen dem Modell die Konfidenz fehlt – und menschliche Annotatoren auffordert, nur diese spezifischen Instanzen zu kennzeichnen. Diese iterative Schleife ermöglicht es Modellen, eine hohe Genauigkeit mit deutlich weniger gekennzeichneten Stichproben zu erreichen, was es für Projekte mit begrenztem Budget oder Zeitdruck äußerst effizient macht.
Link to this sectionSo funktioniert der Zyklus des aktiven Lernens#
Der Kern des aktiven Lernens ist eine Feedbackschleife, die oft als Human-in-the-Loop bezeichnet wird. Anstatt einmal auf einem statischen Datensatz zu trainieren, entwickelt sich das Modell durch Abfrage- und Aktualisierungszyklen weiter.
-
Initialisierung: Der Prozess beginnt mit einem kleinen Satz gekennzeichneter Trainingsdaten, die zum Training eines initialen Modells verwendet werden, wie zum Beispiel Ultralytics YOLO26.
-
Abfrageauswahl (Query Selection): Das Modell evaluiert einen großen Pool unbeschrifteter Daten. Unter Verwendung einer Abfragestrategie – meistens Unsicherheits-Stichprobenziehung (Uncertainty Sampling) – wählt es die Bilder oder Texte aus, bei denen seine Vorhersagen am wenigsten konfident sind.
-
Annotation: Diese hochpriorisierten Stichproben werden an einen menschlichen Experten gesendet, der in der Literatur zum aktiven Lernen oft als "Orakel" bezeichnet wird, um eine Datenkennzeichnung durchzuführen.
-
Umschulung (Retraining): Die neu gekennzeichneten Daten werden dem Trainingsset hinzugefügt und das Modell wird neu trainiert. Dieses aktualisierte Modell ist dann besser gerüstet, um die nächste Charge schwieriger Stichproben auszuwählen.
Link to this sectionAnwendungen in der Praxis#
Aktives Lernen ist in Branchen unverzichtbar, in denen Daten im Überfluss vorhanden sind, die Kennzeichnung jedoch Fachwissen erfordert oder hohe Kosten verursacht.
- Medizinische Bildanalyse: In Bereichen wie der Radiologie erfordert die Kennzeichnung staatlich geprüfte Experten, deren Zeit extrem wertvoll ist. Anstatt einen Arzt zu bitten, Tausende von eindeutigen Scans zu annotieren, kann ein System für aktives Lernen nach mehrdeutigen Fällen filtern – etwa bei frühen Tumoren oder seltenen Anomalien – und so dem Experten ermöglichen, sich nur auf Bilder zu konzentrieren, die die diagnostischen Fähigkeiten des Modells wirklich verbessern.
- Autonome Fahrzeuge: Selbstfahrende Autos erzeugen Petabytes an Videodaten. Jeden Frame zu kennzeichnen ist unmöglich. Aktives Lernen hilft Ingenieuren dabei, Edge Cases zu identifizieren, wie zum Beispiel Fußgänger in Kostümen oder Fahrten bei starkem Schneefall, die Standardmodelle zur Objekterkennung möglicherweise übersehen. Durch die Priorisierung dieser seltenen Szenarien verbessern Unternehmen die Sicherheit, ohne Ressourcen für redundante Autobahnaufnahmen zu verschwenden.
Link to this sectionPython-Beispiel: Filtern unsicherer Vorhersagen#
Das folgende Beispiel demonstriert eine einfache "Unsicherheits-Stichproben"-Logik mit Ultralytics YOLO26. Wir laden ein Modell, führen eine Inferenz auf Bildern durch und markieren diejenigen, bei denen der Konfidenz-Score unter einem bestimmten Schwellenwert liegt, zur manuellen Überprüfung.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# List of unlabeled image paths
unlabeled_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]
# Run inference
results = model(unlabeled_images)
# Identify samples with low confidence for active learning
uncertain_threshold = 0.6
for result in results:
# Check if any detection confidence is below the threshold
if result.boxes.conf.numel() > 0 and result.boxes.conf.min() < uncertain_threshold:
print(f"Active Learning Query: {result.path} needs human labeling.")Link to this sectionUnterscheidung verwandter Konzepte#
Es ist wichtig, aktives Lernen von ähnlichen Trainingsparadigmen zu unterscheiden:
- Semi-überwachtes Lernen: Während beide Methoden unbeschriftete Daten nutzen, weist das semi-überwachte Lernen Daten automatisch Pseudo-Labels basierend auf den hochkonfidenten Vorhersagen des Modells zu. Im Gegensatz dazu fordert das aktive Lernen explizit menschlichen Input für Vorhersagen mit niedriger Konfidenz an.
- Transferlernen: Dies beinhaltet die Verwendung eines vortrainierten Modells (wie eines, das auf ImageNet trainiert wurde) und dessen Anpassung an eine neue Aufgabe. Aktives Lernen konzentriert sich darauf, welche Daten gekennzeichnet werden sollen, während Transferlernen sich auf die Wiederverwendung bereits erlernter Merkmale konzentriert.
- Reinforcement Learning: Hier lernt ein Agent durch Interaktion mit einer Umgebung und den Erhalt von Belohnungen. Aktives Lernen ist anders, da es statische Ground-Truth-Labels von einem Orakel sucht, anstatt eine Sequenz von Aktionen für eine Belohnung zu optimieren.
Link to this sectionIntegration mit MLOps#
Die effektive Implementierung von aktivem Lernen erfordert eine robuste Machine Learning Operations (MLOps)-Pipeline. Du benötigst eine Infrastruktur zur Verwaltung der Datenversionierung, zum Auslösen von Umschulungsaufträgen und zur Bereitstellung der Annotationsschnittstelle für Menschen. Tools, die sich in das Ultralytics-Ökosystem integrieren, ermöglichen es Benutzern, nahtlos zwischen Inferenz, Datenkuration und Training zu wechseln. Zum Beispiel ermöglicht die Verwendung von benutzerdefinierten Trainingsskripten Entwicklern, schnell neue Chargen von Daten aus dem aktiven Lernen in ihre YOLO-Modelle zu integrieren.
Für weitere Informationen zu Stichprobenstrategien greifen Forscher oft auf umfassende Umfragen in der Literatur zum aktiven Lernen zurück. Darüber hinaus ist das Verständnis von Modellevaluierungsmetriken entscheidend, um zu überprüfen, ob die Schleife des aktiven Lernens die Leistung tatsächlich verbessert.






