Glossar

Computer Vision (CV)

Entfesseln Sie das Potenzial der KI mit Computer Vision! Entdecken Sie ihre Rolle bei Objekterkennung, Gesundheitswesen, selbstfahrenden Autos und mehr. Erfahren Sie jetzt mehr!

Computer Vision (CV) ist ein transformativer Bereich der Künstliche Intelligenz (KI), die die Computer befähigt, die visuelle Welt wahrzunehmen, zu interpretieren und zu verstehen. Durch die Verarbeitung von digitalen Bildern, Videos und können Maschinen aussagekräftige Informationen extrahieren und auf dieser Grundlage Maßnahmen ergreifen oder Empfehlungen aussprechen. Analyse. Während sich das menschliche Sehen auf das Auge und das Gehirn stützt, um die Umgebung sofort zu kontextualisieren, verwendet das Computersehen fortschrittliche Software und Algorithmen für maschinelles Lernen (ML), um diese Fähigkeit um diese Fähigkeit nachzubilden, so dass Systeme Aufgaben automatisieren können, für die bisher das menschliche Sehvermögen erforderlich war.

Wie Computer Vision funktioniert

Im Kern stützt sich die Computer Vision auf Mustererkennungstechniken, um visuelle Daten zu verstehen Daten. In frühen Versuchen wurden Regeln zur Definition von Objekten manuell kodiert, doch die moderne CV wird durch Deep Learning (DL) und große Mengen von Trainingsdaten Daten. Die heute am häufigsten verwendete Architektur ist das Convolutional Neural Network (CNN), das Bilder Pixel für Pixel verarbeitet. Diese Netze erkennen in den ersten Schichten Merkmale auf niedriger Ebene wie Kanten und Texturen und Schichten und kombinieren sie, um in tieferen Schichten komplexe Konzepte - wie Gesichter oder Fahrzeuge - zu erkennen. Dieser Prozess Dieser Prozess erfordert umfangreiche markierte Datensätze, um dem Modell beizubringen, wie es zwischen verschiedenen Kategorien zu unterscheiden.

Kernaufgaben der Computer Vision

Computer Vision ist keine einzelne Aktion, sondern eine Sammlung spezifischer Aufgaben, die verschiedene Probleme lösen:

Objekt-Erkennung: Diese Aufgabe umfasst die Identifizierung und Lokalisierung von Objekten in einem Bild oder Videostrom. Sie zeichnet Bounding Boxes um die erkannten Objekte und ordnet ihnen eine Klassenbezeichnung zu, z. B. "Person" oder "Fahrrad".
Bildklassifizierung: Das System analysiert ein ganzes Bild und ordnet ihm ein einziges Etikett zu, das auf seinem dominanten Inhalt basiert. Zum Beispiel, Klassifizierung eines Fotos als "Querformat" oder "Hochformat".
Instanz-Segmentierung: Tiefer gehend als die Erkennung, die den genauen, pixelgenauen Umriss jedes Objekts identifiziert und einzelne Instanzen der gleichen Klasse derselben Klasse vom Hintergrund.
Schätzung der Pose: Diese Technik erkennt bestimmte Schlüsselpunkte auf einer Figur, z. B. die Gelenke eines menschlichen Körpers, um Bewegungen und Körperhaltung in Echtzeit track .

Computer Vision vs. Bildverarbeitung

Häufig wird Computer Vision mit digitaler Bildverarbeitung verwechselt. digitaler Bildverarbeitung zu verwechseln, aber sie dienen unterschiedlichen Zwecken. Die Bildverarbeitung konzentriert sich auf die Manipulation eines Eingangsbildes, um seine Qualität zu verbessern oder Informationen zu extrahieren, ohne es unbedingt zu "verstehen". Übliche Beispiele sind die Anpassung der Helligkeit, die Anwendung von Filtern oder die Rauschunterdrückung. Im Gegensatz dazu, CV hingegen konzentriert sich auf das Verstehen von Bildern, wobei das Ziel darin besteht, die menschliche Kognition zu emulieren, um zu interpretieren, was das Bild darstellt.

Anwendungsfälle in der Praxis

Der Nutzen der Computervision erstreckt sich über praktisch alle Branchen und erhöht die Effizienz und Sicherheit:

Diagnostik im Gesundheitswesen: Mediziner verwenden CV zur Analyse von Röntgenaufnahmen, MRTs und CT-Scans. Algorithmen können Anomalien detect wie Tumore in der medizinischen Bildgebung Anomalien wie Tumore in der medizinischen Bildgebung mit hoher Präzision erkennen und den Ärzten oft bei der Frühdiagnose helfen.
Intelligente Landwirtschaft: Landwirte nutzen Drohnenbilder und CV-Modelle, um die Gesundheit der Pflanzen zu überwachen, Schädlinge detect und die Ernte zu automatisieren. Systeme wie Echtzeit-Pflanzenüberwachung helfen, den Ertrag zu optimieren und die Ressourcenverschwendung zu reduzieren.
Autonome Fahrzeuge: Selbstfahrende Autos verlassen sich bei der Straßennavigation stark auf CV. Sie verarbeiten Eingaben von mehreren Kameras, um Verkehrszeichenerkennung, Fußgängerverfolgung und Spurhaltung.
Qualitätskontrolle in der Fertigung: Automatisierte Inspektionssysteme an Montagelinien identifizieren Produktfehler schneller und genauer als menschliche Inspektoren und gewährleisten eine Qualitätskontrolle.

Implementierung von Computer Vision mit YOLO11

Entwickler können leistungsstarke Computer-Vision-Aufgaben mithilfe der ultralytics Python . Das folgende Beispiel unten zeigt, wie man das Modell YOLO11-die neueste die neueste stabile Version, die für alle Standardanwendungsfälle empfohlen wird, um Objekte in einem Bild detect .

from ultralytics import YOLO

# Load the pretrained YOLO11 model (nano version for speed)
model = YOLO("yolo11n.pt")

# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results to see bounding boxes and labels
results[0].show()

Wichtige Tools und Bibliotheken

Das CV-Ökosystem wird durch robuste Open-Source-Bibliotheken unterstützt. OpenCV ist eine grundlegende Bibliothek, die Tausende von Algorithmen für Echtzeit-Computersehen. Für den Aufbau und das Training von Deep-Learning-Modellen werden Frameworks wie PyTorch und TensorFlow sind Industrie Standards. Ultralytics baut auf diesen Grundlagen auf, um hochmoderne Modelle bereitzustellen, die einfach zu implementieren sind. Mit Blick auf die Zukunft bietet die Ultralytics eine umfassende Umgebung für die Verwaltung des gesamten Vision AI-Lebenszyklus, von der Datenverwaltung bis zur Bereitstellung.

Computer Vision (CV)

Trainieren Sie Ultralytics YOLO zur Rationalisierung von Arbeitsabläufen in verschiedenen Branchen

Flexible Enterprise-Lizenzlösung zur Förderung Ihrer Innovationen

Trainieren Sie AI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Wie Computer Vision funktioniert

Kernaufgaben der Computer Vision

Computer Vision vs. Bildverarbeitung

Anwendungsfälle in der Praxis

Implementierung von Computer Vision mit YOLO11

Wichtige Tools und Bibliotheken

Mehr in dieser Kategorie lesen

Verstehen, warum Annotationen durch Menschen entscheidend sind

Was ist Datensatzdestillation? Ein kurzer Überblick

Die Oakley Meta AI-Brille definiert mit Vision AI die Welt der Brillen neu.

Werden Sie Mitglied der Ultralytics