Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024
Glossar

Computer Vision (CV)

Entfesseln Sie das Potenzial der KI mit Computer Vision! Entdecken Sie ihre Rolle bei Objekterkennung, Gesundheitswesen, selbstfahrenden Autos und mehr. Erfahren Sie jetzt mehr!

Computer Vision (CV) ist ein Bereich der künstlichen Intelligenz (KI), der Computer trainiert, die visuelle Welt zu interpretieren und zu verstehen. Durch die Verwendung digitaler Bilder von Kameras, Videos und Deep-Learning-Modellen können Maschinen Objekte präzise identifizieren und klassifizieren und dann auf das reagieren, was sie "sehen". Ziel ist es, Computern zu ermöglichen, die menschliche Sichtweise zu replizieren. Diese Aufgabe umfasst die Verarbeitung und Analyse großer Mengen visueller Daten, um diese zu verstehen. Als Fachgebiet ist es dank der Fortschritte im Deep Learning und der Verfügbarkeit großer Datensätze rasant gewachsen.

Wie Computer Vision funktioniert

Computer Vision funktioniert, indem Algorithmen für maschinelles Lernen (ML) auf visuelle Daten angewendet werden. Anstatt explizit für die Erkennung eines Objekts programmiert zu werden, lernt ein CV-Modell, Muster aus Tausenden oder Millionen von beschrifteten Bildern zu identifizieren. Um beispielsweise ein Modell für die Erkennung von Katzen zu trainieren, würde es mit unzähligen Bildern von Katzen gefüttert, bis es lernt, die Merkmale einer Katze selbstständig zu unterscheiden.

Moderne Computer Vision stützt sich stark auf Deep-Learning-Modelle, insbesondere Convolutional Neural Networks (CNNs). Ein CNN ist eine Art von Neural Network, das bei der Verarbeitung von Bilddaten sehr effektiv ist. Es funktioniert, indem es Filter (oder Kernel) auf ein Bild anwendet, um Feature Maps zu erstellen, die wichtige Eigenschaften wie Kanten, Texturen und Formen hervorheben. Diese Netzwerke treiben viele gängige Computer-Vision-Aufgaben an und ermöglichen es Maschinen, visuelle Informationen mit zunehmender Genauigkeit zu analysieren.

Computer Vision vs. Bildverarbeitung

Obwohl sie eng miteinander verwandt sind, sind Computer Vision und Bildverarbeitung nicht dasselbe. Bildverarbeitung ist eine Teilmenge von CV, die sich auf die Manipulation digitaler Bilder konzentriert, um diese zu verbessern oder nützliche Informationen zu extrahieren. Sie umfasst Operationen wie das Schärfen, Weichzeichnen oder Filtern eines Bildes. Im Gegensatz dazu geht Computer Vision einen Schritt weiter, indem es darauf abzielt, den Inhalt des Bildes zu interpretieren und zu verstehen. Beispielsweise könnte die Bildverarbeitung verwendet werden, um die Qualität eines Fotos zu verbessern, während Computer Vision verwendet würde, um die Personen, Objekte und die Szene innerhalb dieses Fotos zu identifizieren. In dieser detaillierten Übersicht über die digitale Bildverarbeitung erfahren Sie mehr über den Unterschied.

Wesentliche Aufgaben im Bereich Computer Vision

Computer Vision umfasst mehrere Schlüsselaufgaben, die es Maschinen ermöglichen, visuelle Daten zu analysieren und zu interpretieren:

  • Objekterkennung: Dies beinhaltet die Identifizierung und Lokalisierung von Objekten innerhalb eines Bildes oder Videos. Ein Modell wie Ultralytics YOLO zeichnet eine Bounding Box um jedes erkannte Objekt und weist ihm eine Klassenbezeichnung zu.
  • Bildklassifizierung: Diese Aufgabe beinhaltet die Zuweisung einer einzelnen Bezeichnung zu einem gesamten Bild aus einem vordefinierten Satz von Kategorien. Zum Beispiel die Klassifizierung eines Bildes als "Katze" oder "Hund".
  • Bildsegmentierung: Im Gegensatz zur Objekterkennung klassifiziert die Segmentierung jedes Pixel in einem Bild. Sie bietet ein viel detaillierteres Verständnis des Bildinhalts. Zu den Teilaufgaben gehören Instanzsegmentierung und semantische Segmentierung.
  • Pose Estimation: Dies wird verwendet, um die Position und Orientierung einer Person oder eines Objekts im Raum zu bestimmen. Es wird häufig in der Robotik, Augmented Reality und der Analyse menschlicher Aktivitäten eingesetzt.
  • Objektverfolgung: Diese Aufgabe beinhaltet die Verfolgung eines oder mehrerer Objekte im Zeitverlauf in einer Videosequenz. Sie ist entscheidend für Anwendungen wie Überwachung und autonome Navigation.

Anwendungsfälle in der Praxis

Computer-Vision-Anwendungen sind in verschiedenen Sektoren zunehmend verbreitet:

Tools und Frameworks

Die Entwicklung und Bereitstellung von Computer-Vision-Modellen wird durch verschiedene Tools und Frameworks erleichtert. Bibliotheken wie PyTorch (besuchen Sie die offizielle PyTorch-Website) und TensorFlow (besuchen Sie die offizielle TensorFlow-Website) sind grundlegend für die Erstellung von Modellen. Open-Source-Bibliotheken wie OpenCV bieten eine umfangreiche Sammlung von Funktionen für Echtzeit-Computer Vision.

Plattformen wie Ultralytics HUB rationalisieren den gesamten Lebenszyklus eines CV-Projekts, von der Verwaltung von Datensätzen und dem Trainieren von benutzerdefinierten Modellen bis hin zur Bereitstellung. Die Verwendung standardisierter Formate wie ONNX trägt ebenfalls zur Sicherstellung der Interoperabilität zwischen verschiedenen Frameworks bei. Mit zunehmender Reife dieser Technologien werden sie weiterhin Innovationen in allen Branchen vorantreiben.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert