Entdecken Sie, wie Semi-Supervised Learning gelabelte und nicht gelabelte Daten kombiniert, um KI-Modelle zu verbessern, die Labeling-Kosten zu senken und die Genauigkeit zu erhöhen.
Semi-überwachtes Lernen (SSL) ist eine Technik des maschinellen Lernens (ML), die die Lücke zwischen überwachtem und unüberwachtem Lernen schließt. Es nutzt eine kleine Menge markierter Daten zusammen mit einer großen Menge unmarkierter Daten, um die Lerngenauigkeit zu verbessern. In vielen realen Szenarien ist die Beschaffung unmarkierter Daten kostengünstig, aber der Prozess der Datenmarkierung ist kostspielig und zeitaufwändig. SSL geht diese Herausforderung an, indem es den Modellen ermöglicht, aus dem riesigen Pool an unmarkierten Beispielen zu lernen und sich dabei von der Struktur und den Informationen leiten zu lassen, die der kleinere markierte Satz liefert. Dieser Ansatz ist besonders leistungsfähig beim Deep Learning (DL), wo Modelle enorme Datensätze benötigen, um eine hohe Leistung zu erzielen.
Der Kerngedanke von SSL besteht darin, anhand der gekennzeichneten Daten ein erstes Modell zu erstellen und dieses Modell dann zu verwenden, um Vorhersagen für die nicht gekennzeichneten Daten zu treffen. Die zuverlässigsten Vorhersagen des Modells werden dann als "Pseudo-Labels" behandelt und dem Trainingssatz hinzugefügt. Das Modell wird dann mit dieser Kombination aus ursprünglichen Kennzeichnungen und Pseudokennzeichnungen mit hoher Zuverlässigkeit erneut trainiert. Durch diesen iterativen Prozess lernt das Modell die zugrundeliegende Struktur des gesamten Datensatzes und nicht nur den kleinen markierten Teil.
Zu den gängigen SSL-Techniken gehören:
SSL ist in Bereichen, in denen die Etikettierung einen Engpass darstellt, äußerst effektiv. Zwei prominente Beispiele hierfür sind:
Es ist wichtig, SSL von verwandten Konzepten der Künstlichen Intelligenz (KI) zu unterscheiden:
Viele moderne Deep Learning (DL) -Frameworks, darunter PyTorch(PyTorch official site) und TensorFlow(TensorFlow official site), bieten Funktionen oder können angepasst werden, um SSL-Algorithmen zu implementieren. Bibliotheken wie Scikit-learn bieten einige SSL-Methoden. Plattformen wie Ultralytics HUB rationalisieren den Prozess, indem sie die Verwaltung von Datensätzen erleichtern, die eine Mischung aus beschrifteten und unbeschrifteten Daten enthalten können, und so das Training und den Einsatz von Modellen vereinfachen, die auf die Nutzung solcher Datenstrukturen ausgelegt sind. Die Forschung auf dem Gebiet der SSL entwickelt sich ständig weiter, und Beiträge werden häufig auf großen KI-Konferenzen wie NeurIPS und ICML präsentiert.