Erkundung von überwachtem vs. unüberwachtem Lernen in der Computer Vision
Erfahre die Unterschiede zwischen überwachtem und unüberwachtem Lernen im Bereich Computer Vision und wie du den richtigen Ansatz für deine Daten und Projektziele wählst.
Künstliche Intelligenz (KI) basiert auf dem Kernkonzept, Maschinen so zu lehren, dass sie lernen und schlussfolgern können, wie es menschlicher Intelligenz ähnelt. Ähnlich wie Menschen durch verschiedene Methoden lernen, wie durch direkte Anleitung oder durch Beobachtung von Mustern und Erfahrungen, sind KI- und Machine-Learning-Systeme darauf ausgelegt, denselben Ansätzen zu folgen.
Wenn es speziell um Machine-Learning-Algorithmen geht, werden Systeme darauf trainiert, aus Daten zu lernen, anstatt für jede Aufgabe explizit programmiert zu werden. Anstatt sich auf feste Regeln zu verlassen, identifizieren Machine-Learning-Modelle Muster in Daten und nutzen diese, um Vorhersagen oder Entscheidungen zu treffen.
Zum Beispiel ist Computer Vision ein Zweig der KI und des Machine Learnings, der sich darauf konzentriert, Systeme in die Lage zu versetzen, visuelle Informationen wie Bilder und Videos zu interpretieren und zu verstehen. Von der Erkennung von Objekten bis hin zur Identifizierung versteckter Muster in großen Datensätzen verlassen sich diese Systeme stark darauf, wie sie zum Lernen trainiert wurden.
Verschiedene KI-Lerntechniken werden eingesetzt, um diese Systeme zu trainieren, je nach Art der verfügbaren Daten und dem zu lösenden Problem.
Einige Computer-Vision-Modelle lernen aus beschrifteten Daten, bei denen jeder Input mit einer korrekten Antwort gepaart ist; das bedeutet, dass jedes Bild oder jeder Datenpunkt mit einem vordefinierten Label versehen ist, das dem Modell sagt, was es darstellt. Dies ermöglicht es dem Modell, die Beziehung zwischen dem Input und dem erwarteten Output zu erlernen, was seine Fähigkeit verbessert, genaue Vorhersagen für neue, ungesehene Daten zu treffen.
Andere Vision-Modelle lernen aus unbeschrifteten Daten, für die keine vordefinierten Antworten bereitgestellt werden, und konzentrieren sich stattdessen darauf, Muster und Beziehungen innerhalb der Daten selbst zu identifizieren. Diese Ansätze sind als überwachtes Lernen bzw. unüberwachtes Lernen bekannt und bilden das Fundament vieler hochmoderner Computer-Vision-Systeme.
In diesem Artikel erkunden wir überwachtes und unüberwachtes Lernen, wie sie in der Computer Vision eingesetzt werden und wie du den Ansatz wählst, der am besten zu deinem Vision-KI-Projekt passt. Fangen wir an!
Link to this sectionWie KI-Lernansätze die Computer Vision antreiben#
Du kannst dir künstliche Intelligenz wie einen Oberbegriff vorstellen, der eine Reihe von Technologien umfasst, die es Maschinen ermöglichen, Aufgaben auszuführen, die normalerweise menschliche Intelligenz erfordern. Innerhalb dieses Bereichs ist Machine Learning ein Schlüsselfeld, das es Systemen ermöglicht, aus Daten zu lernen, anstatt sich nur auf feste Regeln zu stützen.
Innerhalb des Machine Learnings bestimmen verschiedene Lerntechniken, wie ein Modell lernt und sich im Laufe der Zeit verbessert. Ansätze wie überwachtes Lernen (Lernen aus beschrifteten Daten mit korrekten Antworten), unüberwachtes Lernen (Identifizieren von Mustern in unbeschrifteten Daten), bestärkendes Lernen (Lernen durch Versuch und Irrtum unter Nutzung von Feedback oder Belohnungen) und teilüberwachtes Lernen (Kombination einer kleinen Menge beschrifteter Daten mit einer großen Menge unbeschrifteter Daten) definieren, wie Systeme Eingabedaten verarbeiten und Ausgabedaten generieren.

Abb. 1. Eine Übersicht über KI-Lernmethoden (Quelle)
Insbesondere Computer-Vision-Systeme werden unter Verwendung solcher Lernansätze erstellt, um visuelle Daten zu interpretieren und zu verstehen. Überwachtes Lernen ist die am häufigsten verwendete Methode, da sie es Modellen ermöglicht, aus klar beschrifteten Beispielen zu lernen und genaue, zuverlässige Ergebnisse zu erzielen.
Zum Beispiel kann ein Modell auf Bildern trainiert werden, die als „Katze“ und „Hund“ beschriftet sind, und Merkmale wie Form, Ohren und Gesichtsstruktur erlernen, sodass es neue Bilder mithilfe von Klassifizierungsalgorithmen korrekt klassifizieren kann. Unterdessen werden unüberwachtes und teilüberwachtes Lernen ebenfalls in der Computer Vision eingesetzt, oft um Muster in Daten zu erforschen oder die Leistung zu verbessern, wenn nur begrenzt beschriftete Daten verfügbar sind.
Link to this sectionEin Blick auf die Verwendung von überwachten Lernmodellen in der Computer Vision#
Du kannst Algorithmen für überwachtes Lernen mit einer Unterrichtssituation vergleichen, in der ein Lehrer Beispiele zusammen mit den richtigen Antworten liefert, damit die Schüler lernen können, was richtig und was falsch ist. Im Machine Learning lernen Modelle auf ähnliche Weise unter Verwendung von beschrifteten Daten, bei denen jeder Input mit einem bekannten Output gepaart ist.
Nehmen wir an, du arbeitest am Aufbau eines Computer-Vision-Systems, das die Analyse von Baseballspielen automatisiert. Du könntest ein Modell wie Ultralytics YOLO26 auf Bildern oder Videoframes trainieren, in denen Objekte wie der Ball, der Schläger und die Spieler beschriftet sind.
Jedes Objekt würde mit seinem Standort und seiner Kategorie markiert werden, was es dem Modell ermöglicht, zu lernen, wonach es suchen muss. Im Laufe der Zeit kann das Modell diese Objekte in neuem Videomaterial erkennen und lokalisieren, was Anwendungsfälle wie Ball-Tracking und Spielererkennung über Frames hinweg unterstützt.

Abb. 2. Ein Beispiel für Objekterkennung durch überwachtes Lernen (Quelle)
Über die Objekterkennung hinaus wird überwachtes Lernen in einer Reihe von Computer-Vision-Aufgaben wie Bildklassifizierung, Instanzsegmentierung und Pose-Schätzung eingesetzt, bei denen Genauigkeit und Konsistenz wichtig sind. Bei jeder dieser Aufgaben lernen Modelle aus beschrifteten Daten, um spezifische Muster zu identifizieren und zuverlässige Vorhersagen für neue Inputs zu treffen.
Diese Modelle werden typischerweise mittels Deep Learning erstellt, einer Art des Machine Learnings, die neuronale Netze verwendet, um Muster direkt aus Daten zu lernen. Neuronale Netze sind darauf ausgelegt, Informationen auf eine Weise zu verarbeiten, die lose davon inspiriert ist, wie das menschliche Gehirn arbeitet, was es Modellen ermöglicht, komplexe visuelle Merkmale aus großen Datensätzen zu erlernen.
Frühere Computer-Vision-Ansätze verließen sich oft auf manuell entworfene Merkmale in Kombination mit Algorithmen wie Support Vector Machines (SVMs sind Modelle, die Daten klassifizieren, indem sie die beste Grenze zwischen Kategorien finden) oder Entscheidungsbäumen (Modelle, die Entscheidungen treffen, indem sie Daten in Zweige aufteilen).
Im Gegensatz dazu verwenden Computer-Vision-Modelle heute Deep Learning, um diese Merkmale automatisch aus Daten zu lernen, was sie effektiver bei der Bewältigung groß angelegter und hochdetaillierter visueller Aufgaben macht.
Link to this sectionVerständnis der Notwendigkeit von unüberwachten Lernmodellen in der Vision-KI#
Obwohl überwachtes Lernen der Standardansatz in der Computer Vision ist, gibt es bestimmte Vision-Anwendungen, bei denen beschriftete Daten nicht verfügbar oder zu teuer und zeitaufwendig zu erstellen sind.
In diesen Fällen können Algorithmen für unüberwachtes Lernen eine nützliche Alternative sein. Nehmen wir an, du hast eine große Sammlung unbeschrifteter Fotos von einer Wildtierkamera.
Es gibt keine Labels, die angeben, was jedes Bild enthält, aber du möchtest die Daten dennoch organisieren oder verstehen. Ein unüberwachtes Modell kann diese Bilder analysieren und ähnliche gruppieren, indem es Tiere, die sich ähnlich sehen, in Cluster unterteilt, auch ohne ihre exakten Labels zu kennen.
Link to this sectionWie unüberwachtes Lernen in der Computer Vision funktioniert#
Wie funktioniert also unüberwachtes Machine Learning? Anstatt aus korrekten Antworten zu lernen, lernt das Modell, indem es eigenständig Muster und Strukturen innerhalb der Daten identifiziert. Es sucht nach Ähnlichkeiten und Unterschieden in den Daten, ohne sich auf beschriftete Beispiele zu verlassen.
Ein häufiger Anwendungsfall ist die Anomalieerkennung, bei der das Modell lernt, wie normale Daten aussehen, und dann alles identifiziert, was davon abweicht. Anomalie- und Ausreißererkennung ist eine der wirkungsvollsten industriellen Anwendungen. Beispiele hierfür sind das Erkennen defekter Artikel in einer Fertigungslinie, das Markieren ungewöhnlicher medizinischer Scans zur Überprüfung durch Radiologen oder das Erkennen verdächtiger Aktivitäten in Überwachungsaufnahmen. Da Defekte und Anomalien oft selten und vielfältig sind, ist das Beschriften jedes möglichen Falls unpraktisch, was unüberwachte Ansätze zu einer natürlichen Wahl macht.
Um dies zu unterstützen, werden Techniken wie Clustering und Dimensionsreduktion verwendet, meist auf Merkmalen, die aus den Bildern extrahiert wurden, anstatt auf den Rohbildern selbst. Clustering-Methoden wie k-Means-Clustering gruppieren ähnliche Bilder basierend auf gemeinsamen Mustern, während Techniken zur Dimensionsreduktion wie die Hauptkomponentenanalyse (PCA) die Daten vereinfachen, indem sie sich auf die wichtigsten Merkmale konzentrieren.
Dies macht es für das Modell einfacher, aussagekräftige Muster und Strukturen innerhalb großer und komplexer Datensätze zu identifizieren. Der Hauptvorteil des unüberwachten Lernens besteht darin, dass es gut mit unbeschrifteten Daten funktioniert und Muster aufdecken kann, die nicht sofort offensichtlich sind. Es ist jedoch schwieriger zu bewerten und bietet weniger Kontrolle über das Endergebnis im Vergleich zum überwachten Lernen.
Link to this sectionSelbstüberwachtes und teilüberwachtes Lernen in der Computer Vision#
Während du überwachtes und unüberwachtes Lernen erkundest, fragst du dich vielleicht, ob es einen Mittelweg zwischen beiden gibt. Interessanterweise überbrücken selbstüberwachtes und teilüberwachtes Lernen die Lücke zwischen überwachtem und unüberwachtem Lernen.
Diese Ansätze ermöglichen es Modellen, effektiver aus unbeschrifteten Daten zu lernen. Anstatt sich nur auf beschriftete Beispiele zu verlassen, erstellen sie entweder ihre eigenen Lernaufgaben aus den Daten oder kombinieren einen kleinen beschrifteten Datensatz mit einem größeren unbeschrifteten.
Beim selbstüberwachten Lernen lernt das Modell durch das Lösen von Aufgaben, die aus den Daten selbst erstellt wurden. Zum Beispiel könnte ihm ein Bild mit einem fehlenden Teil gegeben werden, und es lernt vorherzusagen, was diesen Bereich ausfüllen sollte, oder es lernt, verschiedene Ansichten desselben Objekts zu erkennen. Dies hilft dem Modell, nützliche Merkmale zu erlernen, ohne manuelle Labels zu benötigen.
Beim teilüberwachten Lernen hingegen wird eine kleine Menge beschrifteter Daten zusammen mit einem größeren Satz unbeschrifteter Daten verwendet, um die Leistung zu verbessern. In einigen Fällen kann das Modell Labels für die unbeschrifteten Daten generieren und diese verwenden, um weiter zu lernen.
Der Hauptvorteil dieser Ansätze besteht darin, dass sie den Bedarf an großen beschrifteten Datensätzen reduzieren, die oft teuer und zeitaufwendig zu erstellen sind. Sie können jedoch komplexer in Design und Bewertung sein im Vergleich zu vollständig überwachten Methoden.
Link to this sectionHauptunterschiede zwischen überwachtem und unüberwachtem Lernen#
Der Unterschied zwischen überwachtem und unüberwachtem Lernen liegt darin, wie ein Modell lernt und was es zu erreichen versucht. Während sich überwachtes Lernen auf beschriftete Daten und klare Anleitungen verlässt, um spezifische Aufgaben zu erlernen, arbeitet unüberwachtes Lernen ohne vordefinierte Antworten und konzentriert sich auf das Entdecken von Mustern und Strukturen innerhalb der Daten.
Zum Beispiel kann in einem Verkehrsüberwachungssystem ein Modell für überwachtes Lernen auf beschrifteten Bildern trainiert werden, um Fahrzeuge, Fußgänger oder Verkehrssignale zu erkennen. Im Gegensatz dazu könnte ein unüberwachtes Modell große Mengen an Videomaterial analysieren, um ähnliche Verkehrsmuster zu gruppieren oder ungewöhnliche Ereignisse zu identifizieren, wie unerwartete Staus oder abnormale Bewegungen, ohne explizit angewiesen zu werden, wonach es suchen soll.
Link to this sectionWann man überwachtes Lernen in der Computer Vision einsetzt#
Überwachtes Lernen ist eine großartige Option für Computer-Vision-Aufgaben, bei denen das Ziel klar definiert ist und das Modell Eingabedaten genau Outputs zuordnen muss. Es funktioniert besonders gut, wenn du über einen zuverlässigen beschrifteten Datensatz verfügst und konsistente, vorhersagbare Ergebnisse benötigst.

Abb. 3. Computer-Vision-Aufgaben, die durch überwachtes Lernen gesteuert werden (Quelle)
Es wird häufig für Probleme verwendet, bei denen das Modell zwischen bekannten Kategorien unterscheiden oder spezifische Ergebnisse vorhersagen muss. Anstatt Muster zu erforschen, liegt der Fokus darauf, präzise Beziehungen aus beschrifteten Daten zu erlernen, was es einfacher macht, das Modell zu einem gewünschten Ergebnis zu führen.
Ein weiterer Hauptvorteil ist die Kontrolle. Mit überwachtem Lernen ist es einfacher, die Leistung mithilfe klarer Metriken zu messen, das Modell feinabzustimmen und ein stabiles Verhalten während des Einsatzes sicherzustellen. Dies macht es perfekt für Systeme, die Beständigkeit und Zuverlässigkeit über die Zeit erfordern.
Dies geht jedoch mit einem Kompromiss einher. Das Modell hängt stark von der Qualität und dem Umfang der beschrifteten Daten ab, und das Sammeln und Annotieren solcher Daten kann zeitaufwendig sein.
Link to this sectionRealweltbeispiele für überwachte Computer Vision#
Vision-KI-Modelle wie Ultralytics YOLO-Modelle nutzen überwachtes Lernen, um Aufgaben wie Objekterkennung mit hoher Genauigkeit durchzuführen, insbesondere in Echtzeitanwendungen. Hier sind einige häufige Vision-Anwendungsfälle aus der Praxis, bei denen überwachtes Lernen einen Unterschied macht:
- Gesundheitswesen und medizinische Bildgebung: Ärzte können Computer-Vision-Systeme verwenden, die auf beschrifteten Scans wie Röntgenaufnahmen oder MRTs trainiert wurden, bei denen Klassifizierer eingesetzt werden, um Zustände wie Tumoren oder Brüche zu identifizieren, was schnellere und genauere Diagnosen unterstützt.
- Industrielle Qualitätsprüfung: In Fertigungsumgebungen können auf beschrifteten Daten trainierte Vision-Systeme Produkte überprüfen, indem sie eine Reihe von qualitätsbezogenen Merkmalen wie Form, Oberflächendefekte, Textur und Größe analysieren. Indem sie aus Beispielen sowohl akzeptabler als auch fehlerhafter Produkte lernen, können diese Systeme Fehler konsistent identifizieren und Produktionsstandards einhalten.
- Autonomes Fahren: Systeme für selbstfahrende Fahrzeuge verlassen sich auf Modelle, die auf beschrifteten Fahrdaten trainiert wurden, um Fahrspuren, Fahrzeuge, Fußgänger und Verkehrszeichen zu erkennen, was den Fahrzeugen hilft, sicher in Echtzeit zu navigieren.
- Einzelhandels- und Kassensysteme: Geschäfte nutzen Modelle, die auf beschrifteten Produktbildern trainiert wurden, um Artikel in Regalen oder an der Kasse zu identifizieren, was automatisierte Abrechnungen und eine effizientere Bestandsverwaltung ermöglicht. Diese Systeme können in Kombination mit zusätzlichen Daten auch Aufgaben wie Kundensegmentierung unterstützen und Unternehmen helfen, Einkaufsmuster besser zu verstehen.
- Landwirtschaft und Ernteüberwachung: Landwirte können Modelle verwenden, die auf beschrifteten Bildern trainiert wurden, um Pflanzen zu erkennen und zu klassifizieren, wie zum Beispiel das Identifizieren und Zählen von gesunden und beschädigten Kartoffeln, was die Qualitätskontrolle verbessert und Verluste reduziert.

Abb. 4. Verwendung von YOLO zur Erkennung und Zählung gesunder und defekter Kartoffeln
Link to this sectionWelche Arten von Problemen in der Computer Vision kann unüberwachtes Lernen lösen#
Unüberwachtes Lernen ist nützlich, wenn du nicht über genügend beschriftete Daten verfügst oder deine Daten keine klaren Antworten enthalten. In diesen Situationen ist das Ziel nicht, exakte Vorhersagen zu treffen, sondern Muster und Strukturen in den Daten zu verstehen.
Es wird oft verwendet, wenn ein unbeschrifteter Datensatz zum ersten Mal erkundet wird. Anstatt dem Modell zu sagen, wonach es suchen soll, erlaubst du ihm, Ähnlichkeiten zu identifizieren, verwandte Bilder zu gruppieren oder ungewöhnliche Muster eigenständig hervorzuheben.
In einer großen Bildersammlung kann ein unüberwachter Ansatz helfen, ähnliche Bilder zu organisieren oder Ausreißer zu markieren, die möglicherweise weitere Aufmerksamkeit erfordern. Dies macht es zu einem nützlichen Ausgangspunkt in Data-Science-Projekten.
Generative Modelle, einschließlich GANs, variabler Autoencoder und Diffusionsmodelle, lernen die zugrunde liegende Verteilung von Bildern, um völlig neue zu erstellen. Diese Modelle treiben Anwendungen wie Bildsynthese, Inpainting, Super-Resolution und Stilübertragung an und bilden das Rückgrat der heutigen generativen KI-Systeme.
Bei der unüberwachten Segmentierung gruppieren einige Methoden Pixel oder Regionen in kohärente Segmente, ohne sich auf beschriftete Masken zu verlassen, was nützlich ist, wenn Annotationen zu kostspielig sind oder wenn das Ziel darin besteht, Strukturen zu entdecken, anstatt vordefinierte Kategorien abzugleichen.
Unüberwachtes Lernen ist auch wirkungsvoll bei der Arbeit mit großen Datensätzen, bei denen das Beschriften zeitaufwendig oder nicht praktikabel ist. In solchen Fällen ermöglicht es dir, Erkenntnisse aus den Daten zu gewinnen, ohne dich auf beschriftete Trainingsdaten zu verlassen.
Es wird auch häufig in Bereichen wie generativer KI (Modelle, die neue Daten wie Bilder, Text oder Audio erstellen) und Repräsentationslernen (Modelle, die nützliche Merkmale oder Muster aus Rohdaten lernen) eingesetzt, wo Modelle allgemeine Merkmale aus großen Datenmengen erlernen. Zusammenfassend lässt sich sagen: Wenn dein Problem Erkundung, Musterentdeckung oder die Arbeit mit unbeschrifteten Daten beinhaltet, ist unüberwachtes Lernen ein flexibler und praktischer Ansatz, den es zu berücksichtigen gilt.
Link to this sectionRealweltbeispiele für unüberwachtes Lernen in der Computer Vision#
Hier sind einige Beispiele für Anwendungsfälle, in denen unüberwachtes Lernen in der Computer Vision angewendet wird:
- Anomalieerkennung in der Fertigung: Modelle können lernen, wie normale Produkte aussehen, und können Defekte oder Unregelmäßigkeiten markieren, ohne beschriftete Beispiele für jeden möglichen Defekt zu benötigen.
- Bildorganisation und Suche: Große Bildersammlungen, wie Fotobibliotheken oder E-Commerce-Kataloge, können automatisch basierend auf visueller Ähnlichkeit gruppiert werden, was es Data Scientists erleichtert, große Datensätze zu organisieren, zu erkunden und zu durchsuchen.
- Überwachung und Sicherheit: Systeme können Videomaterial analysieren, um ungewöhnliche Muster oder Verhaltensweisen zu identifizieren, wie unerwartete Bewegungen oder Veränderungen in Menschenmengen, ohne explizit auf beschriftete Ereignisse trainiert worden zu sein.
- Vorverarbeitung und Datenexploration: Unüberwachte Methoden werden oft verwendet, um Rohbilddaten vor dem Training überwachter Modelle zu erkunden und zu strukturieren, was hilft, die Datenqualität zu verbessern und den manuellen Aufwand zu reduzieren.
Link to this sectionPraktische Einschränkungen von überwachtem und unüberwachtem Lernen#
Trotz der Vorteile beider Lernansätze gibt es bestimmte Einschränkungen zu berücksichtigen. Hier sind einige praktische Faktoren, die du beim Erstellen von Computer-Vision-Modellen im Hinterkopf behalten solltest:
- Overfitting bei überwachten Modellen: Beim überwachten Lernen kann ein Modell die Trainingsdaten zu eng lernen, anstatt allgemeine Muster zu erfassen. Dies geschieht oft, wenn der Datensatz klein oder nicht vielfältig genug ist. Zum Beispiel kann ein Modell, das darauf trainiert wurde, Defekte in einer Art von Produkt zu erkennen, versagen, wenn es an neuen Daten getestet wird, die aus leicht unterschiedlichen Produkten oder Beleuchtungsbedingungen bestehen.
- Herausforderungen bei Clustering-Algorithmen: Beim unüberwachten Lernen kann ein Modell ähnliche Datenpunkte gruppieren. Dies kann jedoch fehlschlagen, wenn die Daten verrauscht, inkonsistent oder nicht klar strukturiert sind. Zum Beispiel könnten bei Bildgruppierungsaufgaben Bilder mit ähnlichen Farben, aber unterschiedlichen Objekten fälschlicherweise zusammen gruppiert werden.
- Wichtigkeit korrekter Vorverarbeitung: Vor dem Training müssen Daten bereinigt und vorbereitet werden. Dies erfolgt typischerweise mithilfe von Python-Bibliotheken, die Bildverarbeitung und Datentransformation handhaben. Dies ist besonders wichtig in der Computer Vision, wo Bilder in Größe, Qualität oder Beleuchtung variieren können. Ohne ordnungsgemäße Vorverarbeitung lernen Modelle möglicherweise aus Rauschen anstatt aus aussagekräftigen Mustern, was zu einer schlechten Leistung führt.
Link to this sectionWichtige Erkenntnisse#
In der Computer Vision spielen sowohl überwachtes als auch unüberwachtes Lernen wichtige Rollen. Der richtige Ansatz hängt von der Art deiner Daten ab, ob sie beschriftet oder unbeschriftet sind, sowie von dem Problem, das du zu lösen versuchst, und deinen Einsatzanforderungen.
Wenn dein Ziel hohe Genauigkeit und klar definierte Ergebnisse sind, ist überwachtes Machine Learning oft die bessere Wahl. Wenn du Daten erkundest oder ohne Labels arbeitest, kann unüberwachtes Lernen besser geeignet sein.
Möchtest du mehr über KI wissen? Schau dir unsere Community und unser GitHub-Repository an. Erkunde unsere Lösungsseiten, um mehr über KI in der Robotik und Computer Vision in der Landwirtschaft zu erfahren. Entdecke unsere Lizenzierungsoptionen und beginne noch heute mit der Entwicklung von Computer Vision!






