Glossar

Selbstüberwachtes Lernen

Entdecken Sie, wie selbstüberwachtes Lernen die Notwendigkeit manueller Kennzeichnung überflüssig macht. Erfahren Sie mehr über generative und kontrastive SSL-Methoden zur Verbesserung von Ultralytics .

Selbstüberwachtes Lernen (Self-Supervised Learning, SSL) ist ein Paradigma des maschinellen Lernens, bei dem ein System lernt, Daten zu verstehen, indem es seine eigenen Überwachungssignale aus den Daten selbst generiert, anstatt sich auf externe, von Menschen bereitgestellte Labels zu verlassen. Beim traditionellen überwachtem Lernenbenötigen Modelle riesige Mengen manuell annotierter Daten – wie beispielsweise mit „Katze” oder „Hund” beschriftete Bilder –, deren Erstellung kostspielig und zeitaufwendig sein kann. SSL umgeht diesen Engpass, indem es „Vorwandaufgaben” erstellt, bei denen das Modell versteckte oder fehlende Teile der Eingabedaten vorhersagen muss, wodurch es sich selbst effektiv die zugrunde liegende Struktur und die Merkmale beibringt, die für komplexe Aufgaben wie die Objekterkennung und Klassifizierung

Kernmechanismen des selbstüberwachten Lernens

Die Grundidee hinter SSL besteht darin, einen Teil der Daten zu maskieren oder zu verbergen und das neuronales Netzwerk (NN) dazu zu zwingen, diese zu rekonstruieren oder die Beziehung zwischen verschiedenen Ansichten derselben Daten vorherzusagen. Dieser Prozess erzeugt reichhaltige, universell einsetzbare Darstellungen, die später für bestimmte nachgelagerte Anwendungen feinabgestimmt werden können.

Es gibt zwei Hauptansätze innerhalb von SSL:

Generative Methoden: Das Modell lernt, Pixel oder Wörter zu generieren, um Lücken zu füllen. Ein klassisches Beispiel in der Natural Language Processing (NLP) ist die Vorhersage des nächsten Wortes in einem Satz. In der Bildverarbeitung sind Techniken wie Masked Autoencoders (MAE) verdecken zufällige Bildausschnitte und beauftragen das Modell mit der Rekonstruktion der fehlenden Pixel, wodurch es gezwungen wird, den visuellen Kontext zu „verstehen”.
Kontrastives Lernen: Diese Methode lehrt das Modell, zwischen ähnlichen und unähnlichen Datenpunkten zu unterscheiden. Durch die Anwendung von Techniken zur Datenvergrößerung Techniken – wie Zuschneiden, Farbveränderung oder Drehung – auf ein Bild anwendet, lernt das Modell, dass diese modifizierten Versionen dasselbe Objekt darstellen (positive Paare), während andere Bilder als unterschiedliche Objekte (negative Paare) behandelt werden. Beliebte Frameworks wie SimCLR stützen sich stark auf dieses Prinzip.

Anwendungsfälle in der Praxis

Selbstüberwachtes Lernen ist zu einem Eckpfeiler für die Entwicklung leistungsstarker Grundlagenmodelle in verschiedenen Bereichen. Seine Fähigkeit, riesige Mengen unbeschrifteter Daten zu nutzen, macht es hochgradig skalierbar.

Medizinische Bildgebung: Die Beschaffung von medizinischen Scans mit Expertenbeschriftungen ist schwierig und kostspielig. SSL ermöglicht es Modellen, anhand von Tausenden unbeschrifteten Röntgen- oder MRT-Scans vorab trainiert zu werden, um allgemeine anatomische Merkmale zu erlernen. Dieses vorab trainierte Modell kann dann mit einer kleinen Anzahl beschrifteter Beispiele feinabgestimmt werden, um eine hohe Genauigkeit bei der Tumorerkennung oder Krankheitsdiagnose zu erreichen.
Autonomes Fahren: Selbstfahrende Autos generieren täglich Terabytes an Videodaten. SSL ermöglicht es diesen Systemen, zeitliche Dynamiken und räumliches Verständnis aus rohem Videomaterial zu lernen, ohne dass jedes einzelne Bild annotiert werden muss. Dies trägt zur Verbesserung der Spurerkennung und Hindernisvermeidung, indem zukünftige Frames oder Objektbewegungen vorhergesagt werden.

Unterscheidung zwischen SSL und verwandten Begriffen

Es ist wichtig, SSL von unüberwachtem Lernenzu unterscheiden. Während beide Methoden unbeschriftete Daten verwenden, konzentriert sich unüberwachtes Lernen in der Regel darauf, versteckte Muster oder Gruppierungen (Clustering) ohne eine bestimmte Vorhersageaufgabe zu finden. SSL hingegen gestaltet den Lernprozess als überwachte Aufgabe, bei der die Beschriftungen automatisch aus der Datenstruktur selbst generiert werden. Darüber hinaus kombiniert das semi-überwachte Lernen eine kleine Menge beschrifteter Daten mit einer großen Menge unbeschrifteter Daten, während reines SSL seine eigenen Beschriftungen vollständig aus dem unbeschrifteten Datensatz erstellt, bevor eine Feinabstimmung erfolgt.

Verwendung vortrainierter Gewichte in Ultralytics

Im Ultralytics sind Modelle wie YOLO26 profitieren erheblich von fortschrittlichen Trainingsstrategien, die häufig ähnliche Prinzipien wie SSL während der Vor-Trainingsphase auf massiven Datensätzen wie ImageNet oder COCO. Dadurch wird sichergestellt, dass die Merkmalsextraktoren bereits robust sind, wenn Benutzer ein Modell für eine bestimmte Aufgabe einsetzen.

Benutzer können diese leistungsstarken vortrainierten Darstellungen nutzen, um Modelle anhand ihrer eigenen benutzerdefinierten Datensätze mithilfe der Ultralytics-Plattform Ultralytics .

Hier ist ein kurzes Beispiel dafür, wie man ein vortrainiertes YOLO26-Modell lädt und mit der Feinabstimmung auf einem neuen Datensatz beginnt, wobei die während des anfänglichen groß angelegten Trainings erlernten Funktionen genutzt werden:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (weights learned from large-scale data)
model = YOLO("yolo26n.pt")

# Fine-tune the model on a specific dataset (e.g., COCO8)
# This leverages the robust feature representations learned during pre-training
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

Die Zukunft von SSL

Als Forscher an großen Labors wie Meta AI und Google diese Techniken weiter verfeinern, erweitert SSL die Grenzen des Möglichen im Bereich der generativer KI und Computer Vision. Durch die Verringerung der Abhängigkeit von gekennzeichneten Daten demokratisiert SSL den Zugang zu leistungsstarker KI und ermöglicht es kleineren Teams, anspruchsvolle Modelle für Nischenanwendungen wie den den Schutz wildlebender Tiere oder industrielle Inspektionzu entwickeln.

Selbstüberwachtes Lernen

Trainieren Sie Ultralytics YOLO zur Rationalisierung von Arbeitsabläufen in verschiedenen Branchen

Flexible Enterprise-Lizenzlösung zur Förderung Ihrer Innovationen

Trainieren Sie AI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Kernmechanismen des selbstüberwachten Lernens

Anwendungsfälle in der Praxis

Unterscheidung zwischen SSL und verwandten Begriffen

Verwendung vortrainierter Gewichte in Ultralytics

Die Zukunft von SSL

Mehr in dieser Kategorie lesen

12 Anwendungsfälle für Luftbildaufnahmen, unterstützt durch Computer Vision

Was ist monokulare Tiefenschätzung? Ein Überblick

Ein Blick auf die Verwendung von Ultralytics YOLO für die KI-Bedrohungserkennung

Werden Sie Mitglied der Ultralytics