Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Aktives Lernen

Entdecken Sie Active Learning, eine kosteneffiziente Methode des maschinellen Lernens, die die Genauigkeit mit weniger Labels erhöht. Erfahren Sie, wie es das KI-Training transformiert!

Active Learning is a strategic approach in machine learning (ML) where the algorithm proactively selects the most informative data points for labeling, rather than passively accepting a pre-labeled dataset. In traditional supervised learning, models often require massive amounts of annotated data, which can be expensive and time-consuming to create. Active learning optimizes this process by identifying "uncertain" or "hard" examples—those near the decision boundary or where the model lacks confidence—and requesting human annotators to label only those specific instances. This iterative loop allows models to achieve high accuracy with significantly fewer labeled samples, making it highly efficient for projects with limited budgets or time constraints.

Wie der aktive Lernzyklus funktioniert

Der Kern des aktiven Lernens ist eine Feedbackschleife, die oft als Human-in-the-Loop bezeichnet wird. Anstatt einmalig auf einem statischen Datensatz zu trainieren, entwickelt sich das Modell durch Zyklen von Abfragen und Aktualisierungen weiter.

  1. Initialisierung: Der Prozess beginnt mit einem kleinen Satz beschrifteter Trainingsdaten, die zum Trainieren eines ersten Modells verwendet werden, beispielsweise Ultralytics .
  2. Abfrageauswahl: Das Modell wertet einen großen Pool unbeschrifteter Daten aus. Mithilfe einer Abfragestrategie– meist Unsicherheitssampling – wählt es die Bilder oder Texte aus, bei denen seine Vorhersagen am wenigsten sicher sind.
  3. Anmerkung: Diese Proben mit hoher Priorität werden an einen menschlichen Experten gesendet, der in der Literatur zum aktiven Lernen oft als „Orakel” bezeichnet wird, um die Daten zu kennzeichnen.
  4. Umschulung: Die neu gekennzeichneten Daten werden dem Trainingssatz hinzugefügt, und das Modell wird neu trainiert. Dieses aktualisierte Modell ist dann besser in der Lage, die nächste Charge verwirrender Beispiele auszuwählen.

Anwendungsfälle in der Praxis

Aktives Lernen ist in Branchen unverzichtbar, in denen Daten im Überfluss vorhanden sind, die Beschriftung jedoch Fachwissen oder hohe Kosten erfordert.

  • Medizinische Bildanalyse: In Bereichen wie der Radiologie erfordert die Kennzeichnung von Bildern zertifizierte Experten, deren Zeit äußerst wertvoll ist. Anstatt einen Arzt zu bitten, Tausende von eindeutigen Scans zu kommentieren, kann ein aktives Lernsystem nach mehrdeutigen Fällen filtern – wie Tumoren im Frühstadium oder seltenen Anomalien –, sodass sich der Experte nur auf Bilder konzentrieren kann, die die Diagnosefähigkeit des Modells wirklich verbessern .
  • Autonome Fahrzeuge: Selbstfahrende Autos generieren Petabytes an Videodaten. Es ist unmöglich, jedes einzelne Bild zu kennzeichnen. Aktives Lernen hilft Ingenieuren dabei, Randfälle zu identifizieren, wie Fußgänger, die Kostüme tragen, oder das Fahren bei starkem Schneefall, die von Standardmodellen zur Objekterkennung möglicherweise übersehen werden. Durch die Priorisierung dieser seltenen Szenarien verbessern Unternehmen die Sicherheit, ohne Ressourcen für sich wiederholende Autobahnaufnahmen zu verschwenden.

Python : Filtern unsicherer Vorhersagen

Das folgende Beispiel veranschaulicht eine einfache „Uncertainty Sampling”-Logik unter Verwendung von Ultralytics . Wir laden ein Modell, führen eine Inferenz für Bilder durch und markieren diejenigen, deren Konfidenzscore unter einem bestimmten Schwellenwert liegt, für eine manuelle Überprüfung.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# List of unlabeled image paths
unlabeled_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]

# Run inference
results = model(unlabeled_images)

# Identify samples with low confidence for active learning
uncertain_threshold = 0.6
for result in results:
    # Check if any detection confidence is below the threshold
    if result.boxes.conf.numel() > 0 and result.boxes.conf.min() < uncertain_threshold:
        print(f"Active Learning Query: {result.path} needs human labeling.")

Unterscheidung von verwandten Konzepten

Es ist wichtig, aktives Lernen von ähnlichen Trainingsparadigmen zu unterscheiden:

  • Halbüberwachtes Lernen: Während beide Methoden unbeschriftete Daten verwenden, weist das halbüberwachte Lernen den Daten automatisch Pseudobeschriftungen zu, die auf den Vorhersagen des Modells mit hoher Zuverlässigkeit basieren . Im Gegensatz dazu fordert das aktive Lernen bei Vorhersagen mit geringer Zuverlässigkeit ausdrücklich menschliche Eingaben an.
  • Transferlernen: Dabei wird ein vortrainiertes Modell (z. B. eines, das auf ImageNet) und dessen Anpassung an eine neue Aufgabe. Aktives Lernen konzentriert sich darauf, welche Daten gekennzeichnet werden sollen, während Transferlernen sich auf die Wiederverwendung gelernter Merkmale konzentriert.
  • Verstärkendes Lernen: Hier lernt ein Agent, indem er mit einer Umgebung interagiert und Belohnungen erhält. Aktives Lernen unterscheidet sich davon , da es statische Ground-Truth-Labels von einem Orakel sucht, anstatt eine Abfolge von Aktionen für eine Belohnung zu optimieren.

Integration mit MLOps

Die effektive Umsetzung von aktivem Lernen erfordert eine robuste Machine Learning Operations (MLOps) Pipeline. Sie benötigen eine Infrastruktur, um Datenversionen zu verwalten, Nachschulungsaufträge auszulösen und die Annotationsschnittstelle für Menschen bereitzustellen. Tools, die sich in das Ultralytics integrieren lassen, ermöglichen es Benutzern, nahtlos zwischen Inferenz, Datenkuratierung und Schulung zu wechseln. Mithilfe von benutzerdefinierten Schulungsskripten können Entwickler beispielsweise schnell neue Stapel aktiver Lerndaten in ihre YOLO integrieren.

Für weitere Informationen zu Stichprobenstrategien verweisen Forscher häufig auf umfassende Übersichtsarbeiten in der Literatur zum aktiven Lernen. Darüber hinaus ist das Verständnis von Modellbewertungsmetriken entscheidend, um zu überprüfen, ob der aktive Lernzyklus tatsächlich die Leistung verbessert.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten