Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Computer Vision (CV)

Entfesseln Sie das Potenzial der KI mit Computer Vision! Entdecken Sie ihre Rolle bei Objekterkennung, Gesundheitswesen, selbstfahrenden Autos und mehr. Erfahren Sie jetzt mehr!

Computer Vision (CV) ist ein hochentwickeltes Gebiet der Künstlichen Intelligenz (KI), das es Computern und Systemen ermöglicht, aus digitalen Bildern, Videos und anderen visuellen Eingaben aussagekräftige Informationen abzuleiten. Während das menschliche Sehvermögen die angeborene Fähigkeit besitzt, die Umgebung sofort wahrzunehmen und zu verstehen, müssen Computer trainiert werden, um Muster zu erkennen und Pixel zu interpretieren. Durch den Einsatz von Algorithmen des maschinellen Lernens (ML) und insbesondere des Deep Learning (DL) können CV-Systeme visuelle Daten aufnehmen, verarbeiten und auf der Grundlage dieser Informationen Empfehlungen aussprechen oder Maßnahmen ergreifen.

Wie Computer Vision funktioniert

Im Kern sieht ein Computer ein Bild als eine Reihe von Zahlenwerten, die Pixel darstellen. Die moderne CV stützt sich stark auf Convolutional Neural Networks (CNNs), die so konzipiert sind, dass sie das Verbindungsmuster von Neuronen im menschlichen Gehirn nachahmen. Diese Netzwerke lernen, eine Hierarchie von Merkmalen zu identifizieren – von einfachen Kanten und Texturen bis hin zu komplexen Formen und Objekten – durch einen Prozess, der als Feature-Extraktion bezeichnet wird.

Um effektiv zu funktionieren, benötigen diese Modelle riesige Mengen an Trainingsdaten. Um beispielsweise ein Auto zu erkennen, muss ein Modell Tausende von beschrifteten Bildern von Autos in verschiedenen Zuständen verarbeiten. Tools wie die Ultralytics optimieren diesen Arbeitsablauf und ermöglichen es Benutzern, Datensätze zu annotieren, Modelle in der Cloud zu trainieren und sie effizient einzusetzen.

Kernaufgaben der Computer Vision

Computersicht ist keine einzelne Funktion, sondern eine Sammlung unterschiedlicher Aufgaben, von denen jede ein bestimmtes Problem löst:

  • Bildklassifizierung: Bei dieser Aufgabe wird einem gesamten Bild eine Klassenbezeichnung zugewiesen, um die Frage „Was ist auf diesem Bild zu sehen?“ zu beantworten (z. B. Unterscheidung zwischen einer Katze und einem Hund).
  • Objekterkennung: In einem weiteren Schritt identifiziert die Erkennung bestimmte Objekte innerhalb eines Bildes und zeichnet einen Rahmen um sie herum. Dies ist entscheidend für das Zählen von Elementen oder das Auffinden bestimmter Merkmale.
  • Instanzsegmentierung: Diese bietet eine präzise Maske auf Pixelebene für jedes erkannte Objekt und trennt einzelne Instanzen derselben Klasse voneinander. Sie ist unverzichtbar für Anwendungen, die eine hohe Präzision erfordern, wie beispielsweise die Analyse medizinischer Bilder.
  • Posen-Schätzung: Dabei werden bestimmte Schlüsselpunkte auf einem Objekt, wie beispielsweise die Gelenke eines menschlichen Körpers, erkannt, um track und Körperhaltungen track .

Anwendungsfälle in der Praxis

Der Nutzen der Computervision erstreckt sich über nahezu alle Branchen und automatisiert Aufgaben, die zuvor menschliche Augen erforderten.

  • Fertigung und Qualitätskontrolle: In der Industrie wird CV oft als Maschinelles Sehen bezeichnet. Es wird zur Automatisierung der Qualitätskontrolle eingesetzt, um winzige Fehler in Produkten auf einem Fließband schneller und genauer zu erkennen als menschliche Prüfer. So ermöglicht beispielsweise KI in der Fertigung die Echtzeitüberwachung von Anlagen, um Ausfälle zu verhindern.
  • Autonomer Verkehr: Selbstfahrende Autos sind für eine sichere Navigation vollständig auf Computer Vision angewiesen. Durch die Verarbeitung von Daten aus Kameras und LiDAR-Sensoren führen diese Fahrzeuge eine 3D-Objekterkennung durch, um Fußgänger, andere Fahrzeuge und Verkehrszeichen in Echtzeit zu identifizieren. Dies ist eine entscheidende Komponente, um ein hohes Maß an Fahrzeugautomatisierung zu erreichen.
  • Gesundheitswesen und Diagnostik: Radiologen nutzen CV, um Anomalien in Röntgenbildern, MRT- und CT-Aufnahmen zu erkennen. KI im Gesundheitswesen hilft bei der Früherkennung von Krankheiten, beispielsweise bei der Identifizierung von Tumoren, indem sie Bereiche hervorhebt, die mit bloßem Auge möglicherweise übersehen werden könnten .

Computer Vision vs. Bildverarbeitung

Es ist wichtig, CV von der Bildverarbeitung zu unterscheiden, obwohl sie oft zusammenarbeiten.

  • Bildverarbeitung umfasst die Bearbeitung eines Bildes, um es zu verbessern oder Informationen zu extrahieren (z. B. Anpassung von Helligkeit und Kontrast oder Anwendung von Filtern wie denen in Adobe Photoshop). Das Ergebnis ist in der Regel ein weiteres Bild.
  • Computer Vision nimmt ein Bild als Eingabe und gibt Informationen oder eine Interpretation aus (z. B. „In diesem Raum befinden sich drei Personen“). CV verwendet Bildverarbeitungstechniken, um Bilder für die Analyse durch neuronale Netze vorzubereiten.

Implementierung von Computer Vision mit Python

Moderne Bibliotheken haben die Implementierung leistungsfähiger CV-Modelle zugänglich gemacht. Das folgende Beispiel zeigt, wie man die modernsten YOLO26 Modell zur detect in einem Bild unter Verwendung der ultralytics Paket.

from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Run inference on a standard example image
# The model identifies objects and their locations
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting image with bounding boxes
results[0].show()

Dieses einfache Skript nutzt ein vortrainiertes Modell, um komplexe Inferenzaufgaben auszuführen, und demonstriert damit die Zugänglichkeit moderner KI-Tools. Für Entwickler, die über statische Bilder hinausgehen möchten, bietet CV auch Video Understanding und Echtzeit-Tracking-Systeme für den Einsatz in den Bereichen Sicherheit und Sportanalyse. Durch die Integration mit Bibliotheken wie OpenCVkönnen Entwickler umfassende Anwendungen erstellen, die die visuelle Welt erfassen, verarbeiten und analysieren.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten