Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Computer Vision (CV)

Entfesseln Sie das Potenzial der KI mit Computer Vision! Entdecken Sie ihre Rolle bei Objekterkennung, Gesundheitswesen, selbstfahrenden Autos und mehr. Erfahren Sie jetzt mehr!

Computer Vision (CV) ist ein transformativer Bereich der Künstliche Intelligenz (KI), die die Computer befähigt, die visuelle Welt wahrzunehmen, zu interpretieren und zu verstehen. Durch die Verarbeitung von digitalen Bildern, Videos und können Maschinen aussagekräftige Informationen extrahieren und auf dieser Grundlage Maßnahmen ergreifen oder Empfehlungen aussprechen. Analyse. Während sich das menschliche Sehen auf das Auge und das Gehirn stützt, um die Umgebung sofort zu kontextualisieren, verwendet das Computersehen fortschrittliche Software und Algorithmen für maschinelles Lernen (ML), um diese Fähigkeit um diese Fähigkeit nachzubilden, so dass Systeme Aufgaben automatisieren können, für die bisher das menschliche Sehvermögen erforderlich war.

Wie Computer Vision funktioniert

Im Kern stützt sich die Computer Vision auf Mustererkennungstechniken, um visuelle Daten zu verstehen Daten. In frühen Versuchen wurden Regeln zur Definition von Objekten manuell kodiert, doch die moderne CV wird durch Deep Learning (DL) und große Mengen von Trainingsdaten Daten. Die heute am häufigsten verwendete Architektur ist das Convolutional Neural Network (CNN), das Bilder Pixel für Pixel verarbeitet. Diese Netze erkennen in den ersten Schichten Merkmale auf niedriger Ebene wie Kanten und Texturen und Schichten und kombinieren sie, um in tieferen Schichten komplexe Konzepte - wie Gesichter oder Fahrzeuge - zu erkennen. Dieser Prozess Dieser Prozess erfordert umfangreiche markierte Datensätze, um dem Modell beizubringen, wie es zwischen verschiedenen Kategorien zu unterscheiden.

Kernaufgaben der Computer Vision

Computer Vision ist keine einzelne Aktion, sondern eine Sammlung spezifischer Aufgaben, die verschiedene Probleme lösen:

  • Objekt-Erkennung: Diese Aufgabe umfasst die Identifizierung und Lokalisierung von Objekten in einem Bild oder Videostrom. Sie zeichnet Bounding Boxes um die erkannten Objekte und ordnet ihnen eine Klassenbezeichnung zu, z. B. "Person" oder "Fahrrad".
  • Bildklassifizierung: Das System analysiert ein ganzes Bild und ordnet ihm ein einziges Etikett zu, das auf seinem dominanten Inhalt basiert. Zum Beispiel, Klassifizierung eines Fotos als "Querformat" oder "Hochformat".
  • Instanz-Segmentierung: Tiefer gehend als die Erkennung, die den genauen, pixelgenauen Umriss jedes Objekts identifiziert und einzelne Instanzen der gleichen Klasse derselben Klasse vom Hintergrund.
  • Schätzung der Pose: Diese Technik erkennt bestimmte Schlüsselpunkte auf einer Figur, z. B. die Gelenke eines menschlichen Körpers, um Bewegungen und Körperhaltung in Echtzeit track .

Computer Vision vs. Bildverarbeitung

Häufig wird Computer Vision mit digitaler Bildverarbeitung verwechselt. digitaler Bildverarbeitung zu verwechseln, aber sie dienen unterschiedlichen Zwecken. Die Bildverarbeitung konzentriert sich auf die Manipulation eines Eingangsbildes, um seine Qualität zu verbessern oder Informationen zu extrahieren, ohne es unbedingt zu "verstehen". Übliche Beispiele sind die Anpassung der Helligkeit, die Anwendung von Filtern oder die Rauschunterdrückung. Im Gegensatz dazu, CV hingegen konzentriert sich auf das Verstehen von Bildern, wobei das Ziel darin besteht, die menschliche Kognition zu emulieren, um zu interpretieren, was das Bild darstellt.

Anwendungsfälle in der Praxis

Der Nutzen der Computervision erstreckt sich über praktisch alle Branchen und erhöht die Effizienz und Sicherheit:

Implementierung von Computer Vision mit YOLO11

Entwickler können leistungsstarke Computer-Vision-Aufgaben mithilfe der ultralytics Python . Das folgende Beispiel unten zeigt, wie man das Modell YOLO11-die neueste die neueste stabile Version, die für alle Standardanwendungsfälle empfohlen wird, um Objekte in einem Bild detect .

from ultralytics import YOLO

# Load the pretrained YOLO11 model (nano version for speed)
model = YOLO("yolo11n.pt")

# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results to see bounding boxes and labels
results[0].show()

Wichtige Tools und Bibliotheken

Das CV-Ökosystem wird durch robuste Open-Source-Bibliotheken unterstützt. OpenCV ist eine grundlegende Bibliothek, die Tausende von Algorithmen für Echtzeit-Computersehen. Für den Aufbau und das Training von Deep-Learning-Modellen werden Frameworks wie PyTorch und TensorFlow sind Industrie Standards. Ultralytics baut auf diesen Grundlagen auf, um hochmoderne Modelle bereitzustellen, die einfach zu implementieren sind. Mit Blick auf die Zukunft bietet die Ultralytics eine umfassende Umgebung für die Verwaltung des gesamten Vision AI-Lebenszyklus, von der Datenverwaltung bis zur Bereitstellung.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten