Glossar

Maschinelles Sehen

Was ist Machine Vision? Erfahren Sie, wie diese KI-Disziplin industrielle Automatisierung, Qualitätskontrolle und Robotik ermöglicht. Entdecken Sie die wichtigsten Unterschiede zu Computer Vision.

Maschinelles Sehen ist ein Technologiebereich, der es Maschinen ermöglicht, die visuelle Welt automatisch zu "sehen" und zu interpretieren. Dabei werden Kameras, Beleuchtung und Software kombiniert, um Bilder zu erfassen und zu analysieren, so dass die Systeme auf der Grundlage dieser visuellen Informationen Entscheidungen treffen oder Aufgaben ausführen können. Das Hauptziel der maschinellen Bildverarbeitung, die vor allem in industriellen und automatisierten Umgebungen eingesetzt wird, besteht darin, bestimmte, sich häufig wiederholende Prüf- und Führungsaufgaben schneller, genauer und konsistenter als menschliche Bediener auszuführen. Sie ist eine Schlüsselkomponente für die Automatisierung in Bereichen wie Fertigung, Logistik und Robotik.

Wie Machine Vision funktioniert

Ein typisches Bildverarbeitungssystem besteht aus mehreren Hardware- und Softwarekomponenten. Der Prozess beginnt mit Hochgeschwindigkeitskameras und spezieller Beleuchtung, um klare, konsistente Bilder eines Objekts oder einer Szene zu erfassen. Dieser Schritt, der als Bilderfassung bezeichnet wird, ist für eine zuverlässige Leistung entscheidend. Das erfasste Bild wird dann von einer Software verarbeitet, die Algorithmen zur Analyse der visuellen Daten verwendet. Traditionell stützten sich diese Systeme auf regelbasierte Bildverarbeitungstechniken. Moderne Bildverarbeitungssysteme setzen jedoch zunehmend maschinelles Lernen (ML) und Deep Learning (DL) ein, um komplexere und variablere Aufgaben zu bewältigen. Im letzten Schritt trifft das System eine Entscheidung, z. B. ob ein Teil angenommen oder abgelehnt wird, oder es steuert einen Roboterarm. Der gesamte Arbeitsablauf wird häufig in Echtzeit auf Verarbeitungshardware ausgeführt, die von Industrie-PCs bis zu Edge-Geräten reicht.

Maschinelles Sehen vs. Computer Vision

Die Begriffe maschinelles Sehen und Computer Vision (CV) werden zwar oft synonym verwendet, haben aber unterschiedliche Schwerpunkte. Computer Vision ist ein breiteres wissenschaftliches Gebiet, das sich damit befasst, wie Computer dazu gebracht werden können, aus digitalen Bildern oder Videos ein hohes Maß an Verständnis zu gewinnen. Es umfasst ein breites Spektrum von Anwendungen, von der Gesichtserkennung bis zu autonomen Fahrzeugen.

Die maschinelle Bildverarbeitung hingegen wird im Allgemeinen als technische Disziplin und als Teilbereich der Computer Vision betrachtet, der sich auf praktische Anwendungen konzentriert, insbesondere in der industriellen Automatisierung. Ihre Anwendungen sind in der Regel aufgabenspezifisch und werden in stark kontrollierten Umgebungen durchgeführt. Während es bei der Computer Vision darum geht, ein Bild im allgemeinen Sinne zu verstehen, geht es bei der Machine Vision darum, spezifische Informationen aus einem Bild zu extrahieren, um eine Aufgabe zu erfüllen. Weitere Einzelheiten zu den Unterschieden finden Sie in diesem Vergleich zwischen Computer Vision und Bildverarbeitung.

Anwendungen in der realen Welt

Die industrielle Bildverarbeitung ist ein Eckpfeiler der modernen industriellen Automatisierung. Ihre Fähigkeit, visuelle Aufgaben mit hoher Geschwindigkeit und Präzision auszuführen, macht sie in vielen Sektoren von unschätzbarem Wert.

  • Qualitätskontrolle in der Fertigung: Eine der häufigsten Anwendungen der maschinellen Bildverarbeitung ist die automatische Qualitätskontrolle. In einer Abfüllanlage kann ein Bildverarbeitungssystem beispielsweise Tausende von Flaschen pro Minute auf Risse prüfen, sicherstellen, dass der Füllstand korrekt ist, und überprüfen, ob die Verschlüsse richtig verschlossen sind. Systeme mit Modellen wie Ultralytics YOLO11 können eine komplexe Objekterkennung durchführen, um selbst kleinste Fehler zu erkennen. Dadurch wird nicht nur die Produktqualität verbessert, sondern auch Abfall und Betriebskosten werden reduziert. Die Association for Advancing Automation (A3) bietet umfangreiche Ressourcen zu diesem Thema.
  • Führung für die Robotik: Bildverarbeitungssysteme sind die "Augen" von Robotern und ermöglichen es ihnen, komplexe Aufgaben mit Präzision auszuführen. In einem KI-gesteuerten Logistiklager leitet die maschinelle Bildverarbeitung die Roboter bei der Identifizierung, Entnahme und Platzierung von Artikeln zum Sortieren und Verpacken. Dazu gehört die Verfolgung von Objekten und die Schätzung ihrer Lage, um die Position und Ausrichtung des Objekts zu verstehen. Solche Systeme sind für die Hochgeschwindigkeitsabläufe, die in E-Commerce-Fulfillment-Zentren erforderlich sind, von entscheidender Bedeutung und sind ein wichtiger Bestandteil der Robotik und Automatisierung.

Die Rolle des Deep Learning

Die Integration von Deep Learning hat das maschinelle Sehen revolutioniert. Während herkömmliche Systeme durch regelbasierte Algorithmen eingeschränkt waren, können Deep-Learning-Modelle, insbesondere Convolutional Neural Networks (CNNs), aus großen Datenmengen lernen. Dadurch können sie Defekte und Merkmale mit einem Grad an Nuanciertheit und Flexibilität erkennen, der zuvor unmöglich war. Modelle wie YOLOv8 und YOLO11 können auf benutzerdefinierten Datensätzen trainiert werden, um eine Vielzahl von Objekten und Anomalien zu erkennen, was sie ideal für Aufgaben wie die Segmentierung von Instanzen in Produktionslinien macht. Plattformen wie Ultralytics HUB rationalisieren den Prozess der Schulung und des Einsatzes dieser fortschrittlichen Modelle. Frameworks wie PyTorch und TensorFlow bilden die Grundlage für den Aufbau dieser anspruchsvollen Systeme und ermöglichen robustere und intelligentere Bildverarbeitungslösungen.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert