Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Maschinelles Sehen

Was ist Machine Vision? Erfahren Sie, wie diese KI-Disziplin industrielle Automatisierung, Qualitätskontrolle und Robotik ermöglicht. Entdecken Sie die wichtigsten Unterschiede zur Computer Vision.

Maschinelles Sehen ist ein Technologiebereich, der es Maschinen ermöglicht, die visuelle Welt automatisch zu "sehen" und zu interpretieren. Es kombiniert Kameras, Beleuchtung und Software, um Bilder zu erfassen und zu analysieren, sodass Systeme Entscheidungen treffen oder Aufgaben auf der Grundlage dieser visuellen Informationen ausführen können. Hauptsächlich in industriellen und automatisierten Umgebungen eingesetzt, ist das Hauptziel des maschinellen Sehens die Durchführung spezifischer, oft sich wiederholender Inspektions- und Steuerungsaufgaben mit höherer Geschwindigkeit, Genauigkeit und Konsistenz als menschliche Bediener. Es ist eine Schlüsselkomponente für die Automatisierung in Sektoren wie Fertigung, Logistik und Robotik.

Wie Machine Vision funktioniert

Ein typisches Machine-Vision-System integriert mehrere Hardware- und Softwarekomponenten, um zu funktionieren. Der Prozess beginnt mit Hochgeschwindigkeitskameras und spezieller Beleuchtung, die entwickelt wurden, um klare, konsistente Bilder eines Objekts oder einer Szene aufzunehmen. Dieser Schritt, bekannt als Bilderfassung, ist entscheidend für eine zuverlässige Leistung. Das aufgenommene Bild wird dann von Software verarbeitet, die Algorithmen verwendet, um die visuellen Daten zu analysieren. Traditionell stützten sich diese Systeme auf regelbasierte Bildverarbeitungstechniken. Moderne Machine-Vision-Systeme integrieren jedoch zunehmend maschinelles Lernen (ML) und Deep Learning (DL), um komplexere und variable Aufgaben zu bewältigen. Der letzte Schritt beinhaltet, dass das System eine Entscheidung trifft—z. B. das Bestehen oder Nichtbestehen eines Teils—oder einen Roboterarm führt. Der gesamte Workflow wird oft in Echtzeit auf Verarbeitungshardware ausgeführt, die von industriellen PCs bis hin zu Edge-Geräten reicht.

Maschinelles Sehen vs. Computer Vision

Obwohl die Begriffe Machine Vision und Computer Vision (CV) oft synonym verwendet werden, haben sie unterschiedliche Schwerpunkte. Computer Vision ist ein breiteres wissenschaftliches Feld, das sich damit beschäftigt, wie Computer ein hochgradiges Verständnis von digitalen Bildern oder Videos erlangen können. Es umfasst ein breites Spektrum von Anwendungen, von der Gesichtserkennung bis hin zu autonomen Fahrzeugen.

Maschinelles Sehen hingegen wird im Allgemeinen als eine Ingenieurdisziplin und eine Teilmenge von Computer Vision betrachtet, die sich auf praktische Anwendungen konzentriert, insbesondere in der industriellen Automatisierung. Seine Anwendungen sind typischerweise aufgabenspezifisch und werden in stark kontrollierten Umgebungen durchgeführt. Während es bei Computer Vision darum geht, ein Bild im Allgemeinen zu verstehen, geht es bei maschinellem Sehen darum, spezifische Informationen aus einem Bild zu extrahieren, um eine Aufgabe auszuführen. Weitere Einzelheiten zu den Unterschieden finden Sie in diesem Vergleich zwischen Computer Vision und Bildverarbeitung.

Anwendungsfälle in der Praxis

Maschinelles Sehen ist ein Eckpfeiler der modernen industriellen Automatisierung. Seine Fähigkeit, visuelle Aufgaben mit hoher Geschwindigkeit und Präzision auszuführen, macht es in vielen Sektoren unschätzbar wertvoll.

  • Qualitätskontrolle in der Fertigung: Eine der häufigsten Anwendungen von Machine Vision ist die automatisierte Qualitätsprüfung. Beispielsweise kann ein Machine-Vision-System in einer Abfüllanlage Tausende von Flaschen pro Minute prüfen, um Risse zu erkennen, sicherzustellen, dass die Füllstände korrekt sind, und zu überprüfen, ob die Verschlüsse richtig versiegelt sind. Systeme, die von Modellen wie Ultralytics YOLO11 angetrieben werden, können komplexe Objekterkennung durchführen, um selbst kleinste Defekte zu identifizieren. Dies verbessert nicht nur die Produktqualität, sondern reduziert auch Abfall und Betriebskosten. Die Association for Advancing Automation (A3) bietet umfangreiche Ressourcen zu diesem Thema.
  • Anleitung für die Robotik: Machine-Vision-Systeme stellen die "Augen" für Roboter bereit und ermöglichen es ihnen, komplexe Aufgaben präzise auszuführen. In einem KI-gesteuerten Logistiklager leitet Machine Vision Roboter an, um Artikel zum Sortieren und Verpacken zu identifizieren, aufzunehmen und zu platzieren. Dies beinhaltet Objektverfolgung und Pose-Schätzung, um die Position und Ausrichtung des Objekts zu verstehen. Solche Systeme sind entscheidend für die Hochgeschwindigkeitsabläufe, die von E-Commerce-Fulfillment-Zentren gefordert werden, und sind ein wichtiger Bestandteil der Robotik und Automatisierung.

Die Rolle von Deep Learning

Die Integration von Deep Learning hat das maschinelle Sehen revolutioniert. Während traditionelle Systeme durch regelbasierte Algorithmen eingeschränkt waren, können Deep-Learning-Modelle, insbesondere Convolutional Neural Networks (CNNs), aus riesigen Datenmengen lernen. Dies ermöglicht es ihnen, Defekte und Merkmale mit einer Detailgenauigkeit und Flexibilität zu erkennen, die zuvor unmöglich war. Modelle wie YOLOv8 und YOLO11 können auf benutzerdefinierten Datensätzen trainiert werden, um eine Vielzahl von Objekten und Anomalien zu erkennen, was sie ideal für Aufgaben wie die Instanzsegmentierung in Produktionslinien macht. Plattformen wie Ultralytics HUB optimieren den Prozess des Trainings und der Bereitstellung dieser fortschrittlichen Modelle. Frameworks wie PyTorch und TensorFlow bilden die Grundlage für den Aufbau dieser hochentwickelten Systeme und ermöglichen robustere und intelligentere Lösungen für maschinelles Sehen.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert