Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Aktives Lernen

Entdecken Sie Active Learning, eine kosteneffiziente Methode des maschinellen Lernens, die die Genauigkeit mit weniger Labels erhöht. Erfahren Sie, wie es das KI-Training transformiert!

Aktives Lernen ist ein dynamischer Ansatz im maschinellen Lernens (ML) zur Optimierung des Trainingsprozess zu optimieren, indem selektiv die informativsten Datenpunkte für die Annotation ausgewählt werden. Beim standardmäßigen überwachten Lernen wird ein Modell passiv mit einem großen, vormarkierten Datensatz gefüttert, was ineffizient und kostspielig sein kann, wenn die Daten redundante oder uninformative Beispiele enthalten. Aktives Lernen ändert dieses Paradigma, indem es dem Modell erlaubt interaktiv eine Informationsquelle - häufig einen menschlichen Experten oder ein "Orakel" - abfragt, um Bezeichnungen für bestimmte, mehrdeutige Instanzen. Diese gezielte Strategie reduziert die Menge der Trainingsdaten, die zum Erreichen einer hohen um eine hohe Genauigkeit zu erreichen, was sie ideal für Projekte mit Budgets oder strengen Zeitvorgaben.

Der Zyklus des aktiven Lernens

Der aktive Lernprozess funktioniert als ein iterativer Zyklus, der oft als Mensch-im-Kreislauf-Arbeitsablauf. Dieser Zyklus stellt sicher, dass sich die menschliche Arbeit ausschließlich auf die Daten konzentriert, die am meisten zur Verbesserung des Modells beitragen. Der typische Arbeitsablauf umfasst:

  1. Initialisierung: Ein Modell, wie z. B. Ultralytics YOLO11wird mit einem kleinen, anfänglich markierten markierten Seed-Datensatz trainiert.
  2. Abfragen: Das Modell führt Vorhersagen auf einem großen Pool von unbeschrifteten Daten durch. Mithilfe einer Abfragestrategie identifiziert es identifiziert es Proben, bei denen das Vertrauen gering ist oder wo die Vorhersagen unsicher sind.
  3. Annotation: Diese "unsicheren" Proben mit hoher Priorität werden an einen menschlichen Annotator zur Beschriftung.
  4. Aktualisierung: Die neu beschrifteten Proben werden dem Trainingssatz hinzugefügt und der Modelltrainingsprozess wird wiederholt, um den Algorithmus zu verfeinern.

Die Wirksamkeit dieser Methode hängt stark von der Stichprobenstrategie ab. Unsicherheitsstichproben sind die häufigste Technik, bei der der Algorithmus Instanzen auswählt, die seiner Entscheidungsgrenze am nächsten liegen. Umfassende Details über diese Strategien finden sich in verschiedenen Literaturübersichten zum aktiven Lernen.

Python : Unsicherheitsabtastung mit YOLO11

Der folgende Codeschnipsel zeigt, wie eine einfache Unsicherheitsstichprobenschleife implementiert werden kann. Er lädt ein Modell, macht Vorhersagen auf Bilder und identifiziert diejenigen, die mit geringer Sicherheit erkannt wurden, und markiert sie für eine manuelle Überprüfung.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on a list or directory of unlabeled images
results = model.predict(["image1.jpg", "image2.jpg"])

# Identify images where the model is uncertain
uncertain_samples = []
for result in results:
    # Check if detections exist and if the maximum confidence is below a threshold
    if result.boxes.conf.numel() > 0 and result.boxes.conf.max() < 0.6:
        uncertain_samples.append(result.path)
        print(f"Flagging {result.path} for manual labeling.")

print(f"Total uncertain images found: {len(uncertain_samples)}")

Anwendungsfälle in der Praxis

Aktives Lernen ist besonders wertvoll in Bereichen, in denen Datenbeschriftung teuer ist oder spezielles Fachwissen erfordert. Fachwissen erfordert.

  • Medizinische Bildanalyse: Im Gesundheitswesen erfordert die Gewinnung beschrifteter Daten für Aufgaben wie Hirntumorerkennung erfordert oft die Zeit von hochqualifizierten Radiologen. Anstatt Tausende von Routinescans zu beschriften, können aktive Lernsysteme seltene oder zweideutige Anomalien zur Überprüfung durch Experten identifizieren. Die Forschung im Bereich biomedizinischen Bildsegmentierung hat gezeigt, dass dieser Ansatz den Aufwand für die Beschriftung drastisch reduzieren kann, während die diagnostische Präzision erhalten bleibt.
  • Autonome Fahrzeuge: Selbstfahrende Autos sammeln riesige Mengen an Videodaten. Die Beschriftung jedes einzelnen Bildes ist unpraktisch. Aktives Lernen hilft Ingenieuren, "Grenzfälle" zu finden - wie ungewöhnliche Wetterbedingungen oder Fußgänger in Kostümen -, die das aktuellen Objekterkennungsmodell nur schwer classify. Durch die Priorisierung dieser schwierigen Szenarien können Unternehmen wie NVIDIA die Sicherheit und Robustheit ihrer ihrer Wahrnehmungssysteme.

Abgrenzung zu verwandten Konzepten

Aktives Lernen beinhaltet zwar die Verwendung von nicht beschrifteten Daten, unterscheidet sich aber von anderen Paradigmen des maschinellen Lernens:

  • Semi-Überwachtes Lernen: Bei dieser Methode werden sowohl gekennzeichnete als auch nicht gekennzeichnete Daten beim Training verwendet, aber in der Regel passiv. Es verlässt sich oft auf Annahmen über die Datenverteilung, um Kennzeichnungen weiterzugeben, während beim aktiven Lernen explizit nach neuen Informationen.
  • Selbstüberwachtes Lernen: Bei diesem Ansatz erzeugt das Modell seine eigenen Überwachungssignale aus der Datenstruktur (z. B. die Vorhersage eines fehlenden Teil eines Bildes). Es erfordert keine menschliche Interaktion, um Beschriftungen für den nicht beschrifteten Teil zu erzeugen, ein wichtiger Forschungsbereich von Labors wie Google AI.
  • Verstärkendes Lernen: Hierbei lernt ein Agent, Entscheidungen zu treffen, indem er Belohnungen oder Bestrafungen aus der Umgebung erhält. Im Gegensatz zu aktivem Lernen, bei dem statische Kennzeichnungen für Datenpunkte gesucht werden, konzentriert sich das Verstärkungslernen auf die Optimierung einer Abfolge von Aktionen.

Integration in MLOps

Die Implementierung von aktivem Lernen erfordert einen robusten Operationen für maschinelles Lernen (MLOps) Pipeline zur Verwaltung des Datenflusses zwischen dem Modell, dem Datensatz und der Annotationsschnittstelle. Tools, die Daten unterstützen Versionierung und Verwaltung von Daten unterstützen, sind unerlässlich, um zu verfolgen, welche Proben abgefragt wurden. Während Allzweckbibliotheken wie scikit-learn einen gewissen Nutzen bieten, erfordern Computer-Vision-Workflows oft eine individuelle Integration mit Bilddatensätzen, um die ausgewählten Bilder zu visualisieren und mit effektiv. Fortgeschrittene Benutzer können das Ultralytics GitHub-Repository erkunden, um zu sehen, wie Vorhersageergebnisse strukturiert werden können, um in diese Datenkurationsschleifen zu gelangen.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten