Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Anleitungen

Alles, was du über Computer-Vision-Aufgaben wissen musst

Lerne, wie Computer-Vision-Aufgaben wie Objektverfolgung, Instanzsegmentierung und Bildklassifizierung funktionieren und wie Ultralytics YOLO11 diese unterstützt.

ABAbirami Vina
4 min read
Computer-Vision-Aufgaben, die von Ultralytics YOLO11 unterstützt werden

Dank Kameras und Fortschritten in der Künstlichen Intelligenz (KI) sind Computer und Maschinen heute in der Lage, die Welt ähnlich zu sehen wie Menschen. Sie können zum Beispiel Personen erkennen, Objekte verfolgen und sogar den Kontext dessen verstehen, was in einem Video passiert.

Konkret ist Computer Vision der Bereich der KI, der es Maschinen ermöglicht, visuelle Informationen aus ihrer Umgebung zu verstehen und zu interpretieren. Computer Vision umfasst eine Vielzahl von Aufgaben, die jeweils darauf ausgelegt sind, spezifische Erkenntnisse aus Bildern oder Videos zu gewinnen. Zum Beispiel hilft die Objekt-Detektion dabei, verschiedene Elemente in einem Bild zu identifizieren und zu lokalisieren, während andere Aufgaben wie Tracking, Segmentierung und Pose-Estimation Maschinen helfen, Bewegungen, Formen und Positionen genauer zu verstehen.

Die für eine bestimmte Anwendung verwendete Computer-Vision-Aufgabe hängt von der Art der Erkenntnisse ab, die du benötigst. Computer-Vision-Modelle wie Ultralytics YOLO11 unterstützen verschiedene Computer-Vision-Aufgaben und sind damit eine zuverlässige Wahl für den Aufbau von Vision-KI-Systemen in der Praxis.

In diesem Leitfaden werfen wir einen genaueren Blick auf die Computer-Vision-Aufgaben, die von Modellen wie YOLO11 unterstützt werden. Wir untersuchen, wie jede Aufgabe funktioniert und wie sie in verschiedenen Branchen eingesetzt wird. Lass uns anfangen!

Link to this sectionWas sind Computer-Vision-Aufgaben?#

Computer-Vision-Aufgaben zielen darauf ab, die menschlichen Sehfähigkeiten auf unterschiedliche Weise zu replizieren. Diese Aufgaben können Maschinen dabei helfen, Objekte zu erkennen, ihre Bewegungen zu verfolgen, Posen zu schätzen und sogar einzelne Elemente in Bildern und Videos zu umreißen. Typischerweise werden Computer-Vision-Aufgaben durch Modelle ermöglicht, die visuelle Daten in kleinere Teile zerlegen, damit sie klarer interpretieren können, was geschieht.

Vision-KI-Modelle wie die Ultralytics YOLO-Modelle unterstützen mehrere Aufgaben, wie Detektion, Tracking und Segmentierung, in einem Framework. Dank dieser Vielseitigkeit sind YOLO11-Modelle leicht für eine Vielzahl von Anwendungsfällen zu übernehmen.

Von YOLO11 unterstützte Computer-Vision-Aufgaben

Abb. 1. Von YOLO11 unterstützte Computer-Vision-Aufgaben.

Ein gutes Beispiel hierfür ist die Sportanalytik. YOLO11 kann verwendet werden, um jeden Spieler auf dem Spielfeld mittels Objekt-Detektion zu erkennen, und ihn dann während des gesamten Spiels mit Objekt-Tracking zu verfolgen. Gleichzeitig können die Pose-Estimation-Funktionen von YOLO11 dabei helfen, Spielerbewegungen und -techniken zu analysieren, und die Instanz-Segmentierung kann jeden Spieler vom Hintergrund trennen, was die Analyse präziser macht.

Zusammen ergeben diese YOLO11-basierten Computer-Vision-Aufgaben ein vollständiges Bild dessen, was während des Spiels passiert, und geben Teams tiefere Einblicke in Spielerleistung, Taktik und Gesamtstrategie.

Link to this sectionEin Überblick über die von YOLO11 unterstützten Computer-Vision-Aufgaben#

Nachdem wir uns nun angesehen haben, was Computer-Vision-Aufgaben sind, wollen wir uns im Detail mit den einzelnen von YOLO11 unterstützten Aufgaben beschäftigen und dabei Beispiele aus der realen Welt verwenden.

Link to this sectionYOLO11-Unterstützung für Bildklassifizierung#

Wenn du ein Foto ansiehst, können die meisten Menschen leicht sagen, ob es einen Hund, einen Berg oder ein Verkehrsschild zeigt, weil wir alle gelernt haben, wie diese Dinge typischerweise aussehen. Bildklassifizierung hilft Maschinen dabei, dasselbe zu tun, indem sie ihnen beibringt, ein Bild basierend auf seinem Hauptobjekt zu klassifizieren und zu beschriften - sei es ein "Auto", eine "Banane" oder ein "Röntgenbild mit Fraktur". Dieses Label hilft Computer-Vision-Systemen, den visuellen Inhalt zu verstehen, damit sie entsprechend reagieren oder Entscheidungen treffen können.

Eine interessante Anwendung dieser Computer-Vision-Aufgabe ist das Wildtiermonitoring. Bildklassifizierung kann verwendet werden, um verschiedene Tierarten auf Fotos zu identifizieren, die in freier Wildbahn aufgenommen wurden. Durch die automatische Kennzeichnung von Bildern können Forscher Populationen verfolgen, Migrationsmuster überwachen und gefährdete Arten leichter identifizieren, um Naturschutzbemühungen zu unterstützen.

Verwendung von YOLO11 für die Bildklassifizierung

Abb. 2. Ein Beispiel für die Verwendung von YOLO11 zur Bildklassifizierung.

Link to this sectionDie Objekt-Detektions-Fähigkeiten von YOLO11#

Während die Bildklassifizierung hilfreich ist, um eine allgemeine Vorstellung davon zu bekommen, was ein Bild enthält, weist sie dem gesamten Bild nur ein Label zu. In Situationen, in denen detaillierte Informationen, wie die präzise Position und Identität mehrerer Objekte, erforderlich sind, wird Objekt-Detektion unerlässlich.

Objekt-Detektion ist der Prozess des Identifizierens und Lokalisierens einzelner Objekte in einem Bild, oft durch das Zeichnen von Bounding Boxes um sie herum. Ultralytics YOLO11 erzielt besonders gute Ergebnisse bei der Echtzeit-Objekt-Detektion, was es ideal für eine breite Palette von Anwendungen macht.

Nimm zum Beispiel Computer-Vision-Lösungen, die im Einzelhandel zur Bestückung von Regalen eingesetzt werden. Objekt-Detektion kann dabei helfen, Früchte, Gemüse und andere Artikel zu zählen und so eine genaue Bestandsaufnahme zu gewährleisten. Auf landwirtschaftlichen Feldern kann dieselbe Technologie die Fruchtreife überwachen, um Landwirten zu helfen, den besten Erntezeitpunkt zu bestimmen, und sogar zwischen reifen und unreifen Produkten unterscheiden.

Erkennung von Früchten mit Ultralytics YOLO11

Abb. 3. Früchte erkennen mit Ultralytics YOLO11.

Link to this sectionYOLO11 für Instanz-Segmentierung verwenden#

Objekt-Detektion verwendet Bounding Boxes, um Objekte in einem Bild zu identifizieren und zu lokalisieren, aber sie erfasst nicht deren exakte Formen. Hier kommt die Instanz-Segmentierung ins Spiel. Anstatt eine Box um ein Objekt zu zeichnen, zeichnet die Instanz-Segmentierung dessen präzisen Umriss nach.

Du kannst es dir so vorstellen: Anstatt nur anzuzeigen, dass "in diesem Bereich ein Apfel ist", zeichnet es sorgfältig die exakte Form des Apfels nach und füllt sie aus. Dieser detaillierte Prozess hilft KI-Systemen dabei, die Grenzen eines Objekts klar zu verstehen, insbesondere wenn Objekte nahe beieinander liegen.

Instanz-Segmentierung kann auf viele Anwendungen angewendet werden, von Infrastrukturinspektionen bis hin zu geologischen Untersuchungen. So können beispielsweise Daten aus geologischen Untersuchungen mit YOLO11 analysiert werden, um sowohl große als auch kleine Oberflächenrisse oder Anomalien zu segmentieren. Durch das Zeichnen präziser Grenzen um diese Anomalien können Ingenieure Probleme lokalisieren und angehen, bevor ein Projekt beginnt.

Rissegmentierung mit YOLO11

Abb. 4. YOLO11-fähige Riss-Segmentierung.

Link to this sectionObjekt-Tracking: Objekte über Frames hinweg mit YOLO11 verfolgen#

Bisher konzentrierten sich die von uns betrachteten Computer-Vision-Aufgaben auf das, was in einem einzelnen Bild zu sehen ist. Bei Videos benötigen wir jedoch Erkenntnisse, die über einen Frame hinausgehen. Die Aufgabe Objekt-Tracking kann dafür verwendet werden.

Die Objekt-Tracking-Fähigkeit von YOLO11 kann einem bestimmten Objekt, wie einer Person oder einem Auto, folgen, während es sich über eine Reihe von Videoframes bewegt. Selbst wenn sich der Kamerawinkel ändert oder andere Objekte auftauchen, verfolgt das System weiterhin dasselbe Ziel.

Dies ist entscheidend für Anwendungen, die eine Überwachung im Zeitverlauf erfordern, wie das Verfolgen von Autos im Verkehr. Tatsächlich kann YOLO11 Fahrzeuge präzise verfolgen und jedes Auto verfolgen, um deren Geschwindigkeit in Echtzeit zu schätzen. Dies macht Objekt-Tracking zu einer Schlüsselkomponente in Systemen wie der Verkehrsüberwachung.

YOLO11 Objekt-Tracking zur Geschwindigkeitsmessung

Abb. 5. Die Unterstützung von YOLO11 für Objekt-Tracking kann zur Geschwindigkeitsschätzung verwendet werden.

Link to this sectionErkennung von orientierten Bounding Boxes (OBB) mit YOLO11#

Objekte in der realen Welt sind nicht immer perfekt ausgerichtet – sie können geneigt, seitwärts oder in seltsamen Winkeln positioniert sein. Zum Beispiel erscheinen Schiffe und Gebäude auf Satellitenbildern oft gedreht.

Herkömmliche Objekt-Detektionsmethoden verwenden feste rechteckige Boxen, die sich nicht an die Ausrichtung eines Objekts anpassen, was es schwierig macht, diese gedrehten Formen präzise zu erfassen. Oriented Bounding Box (OBB) Detektion löst dieses Problem durch die Verwendung von Boxen, die sich drehen, um passgenau um ein Objekt herum zu liegen, und sich an dessen Winkel für eine präzisere Detektion anpassen.

In Bezug auf die Hafenüberwachung kann die Unterstützung von YOLO11 für OBB-Detektion dabei helfen, Schiffe unabhängig von ihrer Ausrichtung präzise zu identifizieren und zu verfolgen, wodurch sichergestellt wird, dass jedes Schiff, das in den Hafen ein- oder ausläuft, ordnungsgemäß überwacht wird. Diese präzise Detektion liefert Echtzeitinformationen über Schiffs-Positionen und -Bewegungen, was für das Management belebter Häfen und die Vermeidung von Kollisionen entscheidend ist.

Erkennung von Booten mittels OBB-Detektion und YOLO11

Abb. 6. Boote erkennen mit OBB-Detektion und YOLO11.

Link to this sectionPose-Estimation und YOLO11: Keypoints verfolgen#

Pose-Estimation ist eine Computer-Vision-Technik, die Keypoints wie Gelenke, Gliedmaßen oder andere Marker verfolgt, um zu verstehen, wie sich ein Objekt bewegt. Anstatt ein ganzes Objekt oder einen Körper als eine komplette Einheit zu behandeln, zerlegt diese Methode es in seine Schlüsselteile. Dies ermöglicht es, Bewegungen, Gesten und Interaktionen detailliert zu analysieren.

Eine häufige Anwendung dieser Technologie ist die menschliche Pose-Estimation. Durch die Verfolgung der Positionen verschiedener Körperteile in Echtzeit bietet sie ein klares Bild davon, wie sich eine Person bewegt. Diese Informationen können für eine Vielzahl von Zwecken verwendet werden, von Gestenerkennung und Aktivitätsüberwachung bis hin zur Leistungsanalyse im Sport.

Ebenso können Therapeuten in der physischen Rehabilitation die menschliche Pose-Estimation und YOLO11 verwenden, um die Bewegungen der Patienten während der Übungen zu überwachen. Dies hilft sicherzustellen, dass jede Bewegung korrekt ausgeführt wird, während der Fortschritt im Zeitverlauf verfolgt wird.

YOLO11 bei der Überwachung eines Trainings mittels Pose-Estimation

Abb. 7. YOLO11 kann ein Workout mittels Pose-Estimation überwachen.

Link to this sectionUntersuchung, wie YOLO11 verschiedene Computer-Vision-Aufgaben unterstützt#

Nachdem wir nun alle von YOLO11 unterstützten Computer-Vision-Aufgaben im Detail untersucht haben, lass uns durchgehen, wie YOLO11 sie unterstützt.

YOLO11 ist nicht nur ein Modell – es ist eine Suite spezialisierter Modellvarianten, die jeweils für eine bestimmte Computer-Vision-Aufgabe entwickelt wurden. Das macht YOLO11 zu einem vielseitigen Werkzeug, das an eine breite Palette von Anwendungen angepasst werden kann. Du kannst diese Modelle auch auf benutzerdefinierten Datensätzen feinabstimmen, um die einzigartigen Herausforderungen deiner Projekte anzugehen.

Hier sind die YOLO11-Modellvarianten, die für spezifische Vision-Aufgaben vor-trainiert sind:

  • YOLO11: Dieses Modell erkennt und beschriftet mehrere Objekte in Echtzeit, was es ideal für die visuelle Hochgeschwindigkeitserkennung macht.
  • YOLO11-seg: Diese Variante konzentriert sich auf Segmentierung durch die Verwendung detaillierter Masken, um Objekte von ihrem Hintergrund zu trennen.
  • YOLO11-obb: Dieses Modell wurde entwickelt, um gedrehte Objekte durch das Zeichnen von Bounding Boxes zu erkennen, die sich an der Ausrichtung jedes Objekts ausrichten.
  • YOLO11-cls: Diese Variante klassifiziert Bilder durch das Zuweisen eines einzelnen Kategorie-Labels basierend auf dem Gesamtinhalt.
  • YOLO11-pose: Dieses Modell schätzt Keypoints am Körper, um Haltung, Gliedmaßenpositionen und Bewegung zu verfolgen.

Jede Variante ist in verschiedenen Größen verfügbar, was es Benutzern ermöglicht, das richtige Gleichgewicht zwischen Geschwindigkeit und Genauigkeit für ihre spezifischen Bedürfnisse zu wählen.

Link to this sectionWichtige Erkenntnisse#

Computer-Vision-Aufgaben verändern die Art und Weise, wie Maschinen die Welt verstehen und mit ihr interagieren. Durch das Zerlegen von Bildern und Videos in Schlüsselelemente erleichtern diese Technologien es, Objekte, Bewegungen und Interaktionen detailliert zu analysieren.

Von der Verbesserung der Verkehrssicherheit und sportlicher Leistung bis hin zur Optimierung industrieller Prozesse können Modelle wie YOLO11 Echtzeit-Erkenntnisse liefern, die Innovationen vorantreiben. Da sich Vision-KI weiterentwickelt, wird sie wahrscheinlich eine immer wichtigere Rolle dabei spielen, wie wir visuelle Daten täglich interpretieren und nutzen.

Tritt unserer Community bei und besuche unser GitHub-Repository, um KI in Aktion zu sehen. Entdecke unsere Lizenzoptionen und erfahre mehr über KI in der Landwirtschaft und Computer Vision in der Fertigung auf unseren Lösungsseiten.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens