Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Ultralytics YOLO

Erkunde, wie die Anwendungen von Computer Vision funktionieren

Tauche mit uns tief in die Anwendungen von Computer Vision ein. Wir führen dich auch durch verschiedene Computer Vision-Aufgaben wie Objekterkennung und Segmentierung.

ABAbirami Vina
5 min read
Anwendungen von Computer Vision

Als wir die Geschichte der Computer-Vision-Modelle untersuchten, sahen wir, wie sich Computer Vision entwickelt hat und welchen Weg die fortschrittlichen Vision-Modelle, die wir heute haben, genommen haben. Moderne Modelle wie Ultralytics YOLOv8 unterstützen mehrere Computer-Vision-Aufgaben und werden in verschiedenen spannenden Anwendungen eingesetzt.

In diesem Artikel werfen wir einen Blick auf die Grundlagen von Computer Vision und Vision-Modellen. Wir gehen darauf ein, wie sie funktionieren und welche vielfältigen Einsatzmöglichkeiten sie in verschiedenen Branchen haben. Innovationen im Bereich Computer Vision sind überall und prägen unsere Welt im Stillen. Lass uns diese nacheinander aufdecken!

Link to this sectionWas ist Computer Vision?#

Künstliche Intelligenz (KI) ist ein Oberbegriff, der viele Technologien umfasst, die darauf abzielen, einen Teil der menschlichen Intelligenz nachzubilden. Ein solches Teilgebiet der KI ist Computer Vision. Computer Vision konzentriert sich darauf, Maschinen Augen zu geben, mit denen sie ihre Umgebung sehen, beobachten und verstehen können.

Genau wie beim menschlichen Sehen zielen Computer-Vision-Lösungen darauf ab, Objekte zu unterscheiden, Abstände zu berechnen und Bewegungen zu erkennen. Im Gegensatz zu Menschen, die über einen lebenslangen Erfahrungsschatz verfügen, der ihnen beim Sehen und Verstehen hilft, verlassen sich Computer jedoch auf riesige Datenmengen, hochauflösende Kameras und komplexe Algorithmen.

Vergleich von menschlichem Sehen und Computer Vision

Abb. 1. Vergleich zwischen menschlichem Sehen und Computer Vision.

Computer-Vision-Systeme können visuelle Daten wie Bilder und Videos mit unglaublicher Geschwindigkeit und Genauigkeit verarbeiten und analysieren. Die Fähigkeit, riesige Mengen visueller Informationen schnell und präzise zu analysieren, macht Computer Vision zu einem leistungsstarken Werkzeug in verschiedenen Branchen, das von Fertigung bis hin zum Gesundheitswesen reicht.

Link to this sectionVision-Modelle unterstützen verschiedene Computer-Vision-Aufgaben#

Computer-Vision-Modelle sind der Kern jeder Computer-Vision-Anwendung. Es handelt sich im Wesentlichen um Rechenalgorithmen, die auf Deep-Learning-Techniken basieren und darauf ausgelegt sind, Maschinen die Fähigkeit zu geben, visuelle Informationen zu interpretieren und zu verstehen. Vision-Modelle ermöglichen entscheidende Computer-Vision-Aufgaben, die von der Bildklassifizierung bis zur Objekterkennung reichen. Lass uns einige dieser Aufgaben und ihre Anwendungsfälle genauer betrachten.

Link to this sectionBildklassifizierung#

Bildklassifizierung beinhaltet das Kategorisieren und Beschriften von Bildern in vordefinierte Klassen oder Kategorien. Ein Vision-Modell wie YOLOv8 kann auf großen Datensätzen von beschrifteten Bildern trainiert werden. Während des Trainings lernt das Modell, Muster und Merkmale zu erkennen, die mit jeder Klasse verbunden sind. Sobald es trainiert ist, kann es die Kategorie neuer, ungesehener Bilder vorhersagen, indem es deren Merkmale analysiert und sie mit den erlernten Mustern vergleicht.

Ein Beispiel für Bildklassifizierung

Abb. 2. Ein Beispiel für Bildklassifizierung. (Quelle: towardsdatascience.com)

Es gibt verschiedene Arten der Bildklassifizierung. Wenn du dich beispielsweise mit medizinischen Bildern beschäftigst, kannst du die binäre Klassifizierung verwenden, um Bilder in zwei Gruppen zu unterteilen, wie z. B. gesund oder krank. Eine weitere Art ist die Multiklassen-Klassifizierung. Sie kann dabei helfen, Bilder in viele Gruppen einzuteilen, wie zum Beispiel das Klassifizieren verschiedener Tiere auf einem Bauernhof wie Schweine, Ziegen und Kühe. Oder sagen wir, du möchtest Tiere in Gruppen und Untergruppen einteilen, wie etwa Säugetiere und Vögel und diese dann weiter in Arten wie Löwen, Tiger, Adler und Spatzen; die hierarchische Klassifizierung wäre hier die beste Option.

Link to this sectionObjekterkennung#

Objekterkennung ist der Prozess des Identifizierens und Lokalisierens von Objekten in Bildern und Videoframes mithilfe von Computer Vision. Sie besteht aus zwei Aufgaben: Objektlokalisierung, bei der Begrenzungsrahmen um Objekte gezogen werden, und Objektklassifizierung, bei der die Kategorie jedes Objekts identifiziert wird. Basierend auf Begrenzungsrahmen-Annotationen kann ein Vision-Modell lernen, Muster und Merkmale zu erkennen, die für jede Objektkategorie spezifisch sind, und das Vorhandensein sowie den Standort dieser Objekte in neuen, ungesehenen Bildern vorherzusagen.

YOLOv8 Objekterkennung beim Erkennen von Spielern auf einem Fußballfeld

Abb. 3. YOLOv8 Objekterkennung, die verwendet wird, um Spieler auf einem Fußballfeld zu erkennen.

Die Objekterkennung hat viele Anwendungsfälle in verschiedenen Branchen, überall von Sport bis zur Meeresbiologie. Zum Beispiel verwendet Amazon’s Just Walk Out-Technologie im Einzelhandel Objekterkennung, um den Bezahlvorgang zu automatisieren, indem Artikel identifiziert werden, die Kunden mitnehmen. Eine Kombination aus Computer Vision und Sensordaten ermöglicht es Kunden, ihre Artikel zu greifen und zu gehen, ohne in einer Schlange warten zu müssen.

Hier ist ein genauerer Blick darauf, wie das funktioniert:

  • An der Decke montierte Kameras erfassen Kunden, die sich durch das Geschäft bewegen, und dieses Videomaterial wird in Echtzeit von Vision-Modellen verarbeitet.
  • Objekterkennung wird verwendet, um genau das Produkt zu erkennen, das ein Kunde auswählt und in seinen Korb legt, um dessen virtuellen Warenkorb entsprechend zu aktualisieren.
  • Gewichtssensoren in den Regalen verbessern die Genauigkeit, indem sie das Entfernen oder Hinzufügen von Artikeln erkennen.
  • Wenn der Kunde das Geschäft verlässt, können Objekterkennung und Gesichtserkennung-Technologie verwendet werden, um zu bestätigen, dass der Kunde das Geschäft verlassen hat, und seine Zahlungsdetails, wie eine Kreditkarte, können verwendet werden, um ihn automatisch zu belasten.

Link to this sectionSemantische und Instanz-Segmentierung#

Semantische Segmentierung und Instanz-Segmentierung sind Computer-Vision-Aufgaben, die dabei helfen, Bilder in aussagekräftige Segmente zu unterteilen. Die semantische Segmentierung klassifiziert Pixel basierend auf ihrer semantischen Bedeutung und behandelt alle Objekte innerhalb einer Kategorie als eine einzige Einheit mit derselben Bezeichnung. Sie eignet sich zum Kennzeichnen unzählbarer Objekte wie "der Himmel" oder "der Ozean" oder Ansammlungen wie "Blätter" oder "Gras".

Die Instanz-Segmentierung hingegen kann verschiedene Instanzen derselben Klasse unterscheiden, indem jedem erkannten Objekt eine eindeutige Bezeichnung zugewiesen wird. Du kannst die Instanz-Segmentierung verwenden, um zählbare Objekte zu segmentieren, bei denen die Anzahl und die Unabhängigkeit der Objekte wichtig sind. Dies ermöglicht eine präzisere Identifizierung und Differenzierung.

Ein Beispiel für semantische und Instanzsegmentierung

Abb. 4. Ein Beispiel für semantische und Instanz-Segmentierung.

Wir können den Kontrast zwischen semantischer Segmentierung und Instanz-Segmentierung deutlicher an einem Beispiel im Zusammenhang mit selbstfahrenden Autos verstehen. Die semantische Segmentierung eignet sich hervorragend für Aufgaben, die ein Verständnis der Inhalte einer Szene erfordern, und kann in autonomen Fahrzeugen eingesetzt werden, um Merkmale auf der Straße zu klassifizieren, wie z. B. Fußgängerüberwege und Verkehrsschilder. In der Zwischenzeit kann die Instanz-Segmentierung in autonomen Fahrzeugen verwendet werden, um zwischen einzelnen Fußgängern, Fahrzeugen und Hindernissen zu unterscheiden.

Link to this sectionPose-Schätzung#

Pose-Schätzung ist eine Computer-Vision-Aufgabe, die sich auf das Erkennen und Verfolgen von Schlüsselpunkten der Posen eines Objekts in Bildern oder Videos konzentriert. Sie wird am häufigsten für die menschliche Pose-Schätzung verwendet, wobei die Schlüsselpunkte Bereiche wie Schultern und Knie umfassen. Die Schätzung der menschlichen Pose hilft uns, Aktionen und Bewegungen zu verstehen und zu erkennen, die für verschiedene Anwendungen entscheidend sind.

Ein Beispiel für Pose Estimation mit YOLOv8

Abb. 5. Ein Beispiel für Pose-Schätzung mit YOLOv8.

Pose-Schätzung kann im Sport verwendet werden, um die Bewegungsabläufe von Athleten zu analysieren. Die NBA nutzt Pose-Schätzung, um Spielerbewegungen und Positionen während des Spiels zu untersuchen. Durch die Verfolgung von Schlüsselpunkten wie Schultern, Ellbogen, Knien und Knöcheln liefert die Pose-Schätzung detaillierte Einblicke in die Bewegungen der Spieler. Diese Erkenntnisse helfen Trainern, bessere Strategien zu entwickeln, Trainingsprogramme zu optimieren und Anpassungen in Echtzeit während der Spiele vorzunehmen. Außerdem können die Daten helfen, die Ermüdung der Spieler und das Verletzungsrisiko zu überwachen, um die allgemeine Gesundheit und Leistung der Spieler zu verbessern.

Link to this sectionObjekterkennung mit orientierten Begrenzungsrahmen#

Objekterkennung mit orientierten Begrenzungsrahmen (OBB) verwendet gedrehte Rechtecke, um Objekte in einem Bild präzise zu identifizieren und zu lokalisieren. Im Gegensatz zu Standard-Begrenzungsrahmen, die an den Bildachsen ausgerichtet sind, drehen sich OBBs, um der Ausrichtung des Objekts zu entsprechen. Dies macht sie besonders nützlich für Objekte, die nicht perfekt horizontal oder vertikal sind. Sie eignen sich hervorragend, um gedrehte Objekte präzise zu lokalisieren und zu isolieren, um Überschneidungen in überfüllten Umgebungen zu vermeiden.

Erkennung von orientierten Bounding Boxes auf einem Luftbild von Booten mit YOLOv8

Abb. 6. Ein Beispiel für die Erkennung von orientierten Begrenzungsrahmen auf einem Luftbild von Booten mit YOLOv8.

In der maritimen Überwachung ist das Identifizieren und Verfolgen von Schiffen der Schlüssel für Sicherheit und Ressourcenmanagement. Die OBB-Erkennung kann zur präzisen Lokalisierung von Schiffen verwendet werden, selbst wenn sie dicht gedrängt oder in verschiedenen Winkeln ausgerichtet sind. Dies hilft dabei, Schifffahrtswege zu überwachen, den Seeverkehr zu verwalten und Hafenabläufe zu optimieren. Es kann auch bei der Katastrophenhilfe helfen, indem Schäden an Schiffen und Infrastruktur nach Ereignissen wie Hurrikanen oder Ölverschmutzungen schnell identifiziert und bewertet werden.

Link to this sectionObjektverfolgung#

Bisher haben wir Computer-Vision-Aufgaben besprochen, die sich mit Bildern befassen. Objektverfolgung ist eine Computer-Vision-Aufgabe, die ein Objekt über die Frames eines Videos hinweg verfolgen kann. Sie beginnt damit, das Objekt im ersten Frame mithilfe von Erkennungsalgorithmen zu identifizieren, und folgt dann kontinuierlich seiner Position, während es sich durch das Video bewegt. Objektverfolgung beinhaltet Techniken wie Objekterkennung, Merkmalsextraktion und Bewegungsvorhersage, um die Verfolgung präzise zu halten.

Verwendung von YOLOv8 zum Tracken von Fischen

Abb. 7. Verwendung von YOLOv8 zur Verfolgung von Fischen.

Vision-Modelle wie YOLOv8 können verwendet werden, um Fische in der Meeresbiologie zu verfolgen. Mithilfe von Unterwasserkameras können Forscher die Bewegungen und das Verhalten von Fischen in ihren natürlichen Lebensräumen überwachen. Der Prozess beginnt damit, einzelne Fische in den ersten Frames zu erkennen und dann ihre Positionen während des gesamten Videos zu verfolgen. Das Verfolgen von Fischen hilft Wissenschaftlern, Migrationsmuster, soziales Verhalten und Interaktionen mit der Umwelt zu verstehen. Dies unterstützt auch nachhaltige Fischereipraktiken, indem es Erkenntnisse über die Verteilung und Häufigkeit von Fischen liefert.

Link to this sectionEin abschließender Blick auf Computer Vision#

Computer Vision verändert aktiv die Art und Weise, wie wir Technologie nutzen und mit der Welt interagieren. Durch den Einsatz von Deep-Learning-Modellen und komplexen Algorithmen zum Verständnis von Bildern und Videos hilft Computer Vision Branchen dabei, viele Prozesse zu rationalisieren. Computer-Vision-Aufgaben wie Objekterkennung und Objektverfolgung machen es möglich, Lösungen zu schaffen, die man sich vorher nicht vorstellen konnte. Da sich die Computer-Vision-Technologie ständig verbessert, hält die Zukunft noch viele weitere innovative Anwendungen bereit!

Lass uns gemeinsam lernen und wachsen! Erkunde unser GitHub-Repository, um unsere Beiträge zur KI zu sehen. Schau dir an, wie wir Branchen wie selbstfahrende Autos und Landwirtschaft mit KI neu definieren. 🚀

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens