Glossar

Semi-überwachtes Lernen

Entdecken Sie, wie Semi-Supervised Learning gelabelte und nicht gelabelte Daten kombiniert, um KI-Modelle zu verbessern, die Labeling-Kosten zu senken und die Genauigkeit zu erhöhen.

Semi-Überwachtes Lernen (Semi-Supervised Learning, SSL) ist ein leistungsfähiger Mittelweg beim maschinellen Lernen (ML), bei dem eine kleine Menge an gekennzeichneten Daten mit einer großen Menge an nicht gekennzeichneten Daten während des Trainings kombiniert wird. Dieser Ansatz ist besonders wertvoll in Szenarien, in denen die Beschaffung von gekennzeichneten Daten teuer, zeitaufwändig oder unpraktisch ist, während nicht gekennzeichnete Daten im Überfluss vorhanden sind. SSL zielt darauf ab, die zugrundeliegende Struktur in den unmarkierten Daten zu nutzen, um die Modellleistung über das hinaus zu verbessern, was nur mit den begrenzten markierten Daten erreicht werden könnte.

Wie Semi-Supervised Learning funktioniert

SSL-Algorithmen beruhen auf bestimmten Annahmen über die Beziehung zwischen beschrifteten und unbeschrifteten Daten. Zu den gängigen Annahmen gehören die "Glattheitsannahme" (nahe beieinander liegende Punkte teilen wahrscheinlich ein Label) oder die "Clusterannahme" (Daten neigen dazu, verschiedene Cluster zu bilden, und Punkte innerhalb desselben Clusters teilen wahrscheinlich ein Label). Bei diesen Techniken wird häufig ein erstes Modell auf den beschrifteten Daten trainiert und dann verwendet, um Pseudo-Beschriftungen für die unbeschrifteten Daten auf der Grundlage von Vorhersagen mit hoher Zuverlässigkeit zu generieren. Das Modell wird dann sowohl auf den ursprünglich beschrifteten Daten als auch auf den neu pseudo-beschrifteten Daten neu trainiert. Ein anderer Ansatz ist die Konsistenzregulierung, bei der das Modell dazu angehalten wird, für ein unbeschriftetes Beispiel dieselbe Ausgabe zu produzieren, selbst wenn seine Eingabe leicht gestört ist, was häufig durch Datenvergrößerung erreicht wird. Diese Methoden ermöglichen es dem Modell, aus den Mustern und der Verteilung zu lernen, die in dem großen Pool von unbeschrifteten Beispielen enthalten sind. Weitergehende Techniken werden in Ressourcen wie den Google AI Blog-Beiträgen zu SSL erforscht.

Vergleich mit anderen Lernparadigmen

Semi-Supervised Learning nimmt einen einzigartigen Platz zwischen anderen primären Lerntypen ein:

  • Überwachtes Lernen: Verlässt sich vollständig auf gelabelte Trainingsdaten. SSL unterscheidet sich durch die Einbeziehung von unmarkierten Daten, um die Leistung zu verbessern, wenn markierte Daten knapp sind.
  • Unüberwachtes Lernen: Verwendet nur unbeschriftete Daten, um Muster oder Strukturen zu finden, z. B. Clustering oder Dimensionalitätsreduktion. SSL verwendet unmarkierte Daten, leitet aber den Lernprozess mit einer kleinen Menge markierter Beispiele, um Aufgaben wie Klassifizierung oder Regression durchzuführen.
  • Selbstüberwachtes Lernen (SSL): Eine Art des unüberwachten Lernens, bei dem die Beschriftungen automatisch aus den Eingabedaten selbst generiert werden (z. B. Vorhersage eines maskierten Teils eines Bildes). Obwohl es unmarkierte Daten verwendet, unterscheidet sich sein Mechanismus zur Erzeugung von Überwachung von typischen halbüberwachten Methoden, die ausdrücklich vormarkierte und unmarkierte Daten kombinieren.

Anwendungen in der realen Welt

SSL ist in Bereichen, in denen die Etikettierung einen Engpass darstellt, sehr effektiv:

  1. Klassifizierung von Webseiten: Es ist machbar, eine kleine Anzahl von Websites (z. B. "Sport", "Nachrichten", "Technik") manuell zu kennzeichnen, aber unpraktisch, Milliarden von Websites zu kennzeichnen. SSL kann die riesige Anzahl von nicht beschrifteten Websites nutzen, um die Genauigkeit und Robustheit des Klassifizierers zu verbessern, indem es aus Textinhalten und Linkstrukturen lernt(Überblick über Web Content Mining).
  2. Spracherkennungssysteme: Die Transkription von Audiodaten erfordert erheblichen menschlichen Aufwand. SSL ermöglicht es Systemen, mit einer kleinen Menge transkribierter Audiodaten neben großen Mengen untranskribierter Audiodaten zu trainieren und so die Erkennung verschiedener Akzente und Sprechweisen zu verbessern(Sprachverarbeitungsforschung).
  3. Medizinische Bildanalyse: Die fachkundige Kommentierung medizinischer Scans (wie MRT- oder CT-Scans zur Tumorerkennung) ist kostspielig und erfordert Spezialwissen. SSL kann zahlreiche nicht beschriftete Scans nutzen, um die Leistung von Diagnosemodellen zu verbessern, die auf einer begrenzten Menge beschrifteter Bilder trainiert wurden, was zu besseren KI-Lösungen im Gesundheitswesen führen könnte.
  4. Objekterkennung in der Computer Vision (CV): Die Erstellung präziser Bounding Boxes für Objekte in Tausenden von Bildern ist arbeitsintensiv(Datensammlung und Beschriftungsanleitung). SSL-Techniken können reichlich unbeschriftete Bilder oder Videoframes neben einem kleineren beschrifteten Datensatz verwenden, um die Detektorleistung für Modelle wie Ultralytics YOLO zu verbessern.

Vorteile und Herausforderungen

Der Hauptvorteil von SSL ist die Fähigkeit, die Abhängigkeit von großen beschrifteten Datensätzen zu verringern und damit Zeit und Ressourcen zu sparen, die mit der Datenbeschriftung verbunden sind. Es führt oft zu einer besseren Modellgeneralisierung im Vergleich zu rein überwachten Modellen, die auf begrenzten Daten trainiert wurden, indem Informationen aus nicht beschrifteten Stichproben genutzt werden. Der Erfolg von SSL hängt jedoch stark davon ab, dass die zugrunde liegenden Annahmen über die Daten korrekt sind. Wenn diese Annahmen nicht zutreffen (z. B. wenn sich die Verteilung der unbeschrifteten Daten stark von der der beschrifteten Daten unterscheidet), können SSL-Methoden die Leistung sogar verschlechtern. Eine sorgfältige Auswahl und Implementierung von SSL-Techniken ist von entscheidender Bedeutung und erfordert oft Fachwissen über MLOps-Praktiken.

Tools und Schulungen

Viele moderne Deep Learning (DL) -Frameworks, darunter PyTorch(PyTorch official site) und TensorFlow(TensorFlow official site), bieten Funktionen oder können zur Implementierung von SSL-Algorithmen angepasst werden. Bibliotheken wie Scikit-learn bieten einige SSL-Methoden. Plattformen wie Ultralytics HUB rationalisieren den Prozess, indem sie die Verwaltung von Datensätzen(Ultralytics HUB Datasets documentation) erleichtern, die Mischungen aus beschrifteten und unbeschrifteten Daten enthalten können, und das Training(Ultralytics HUB Cloud Training) und den Einsatz(model deployment options guide) von Modellen vereinfachen, die für die Nutzung solcher Datenstrukturen konzipiert sind. Die Forschung im Bereich SSL entwickelt sich ständig weiter, und Beiträge werden häufig auf großen KI-Konferenzen wie NeurIPS und ICML präsentiert.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert