Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Maschinelles Sehen

Was ist Machine Vision? Erfahren Sie, wie diese KI-Disziplin industrielle Automatisierung, Qualitätskontrolle und Robotik ermöglicht. Entdecken Sie die wichtigsten Unterschiede zur Computer Vision.

Maschinelles Sehen ist die technische Disziplin und Technologie, die eine automatische Inspektion, Prozesssteuerung und Roboterführung durch die Analyse von Bildern ermöglicht. Sie fungiert als die "Augen" der industriellen Automatisierung und kombiniert optische Hardware mit hochentwickelter Software, um visuelle Eingaben zu interpretieren und physische Aktionen auszulösen. Während sie sich stark auf die auf den theoretischen Grundlagen der Computer Vision (CV) beruht, unterscheidet sich das maschinelle Sehen den Schwerpunkt auf den praktischen, realen Einsatz in strukturierten Umgebungen. Diese Technologie ist ein Eckpfeiler der Industrie 4.0, die es intelligenten Fabriken ermöglicht mit höherer Geschwindigkeit, Präzision und Konsistenz zu arbeiten, als es menschliche Bediener tun können.

Kernkomponenten und Funktionalität

Ein typisches Bildverarbeitungssystem umfasst mehrere wichtige Komponenten, um eine bestimmte Aufgabe zuverlässig zu erfüllen. Der Prozess beginnt mit der Bilderfassung, bei der hochwertige Industriekameras und Spezialobjektive visuelle Daten erfassen Daten erfassen. Entscheidend für diese Systeme ist der Einsatz von technischen Beleuchtungstechniken um relevante Merkmale wie Oberflächentexturen oder Kanten hervorzuheben und gleichzeitig Rauschen zu unterdrücken.

Sobald ein Bild aufgenommen wurde, wird es von einer Recheneinheit - häufig ein Edge-Computing-Gerät oder eine intelligente Kamera, die fortschrittliche Algorithmen. In der Vergangenheit handelte es sich dabei um regelbasierte Systeme (z. B. Zählen von Pixeln), aber moderne Anwendungen verlassen sich zunehmend auf Künstliche Intelligenz (KI) und Deep Learning (DL). Modelle wie Ultralytics YOLO11 analysieren das Bildmaterial, um Muster zu erkennen, Defekte detect oder Dimensionen zu messen. Das System trifft dann eine Entscheidung - beispielsweise die Annahme eines Produkts oder die Steuerung eines Roboterarm - und kommuniziert dies an eine Speicherprogrammierbare Steuerung (SPS).

Maschinelles Sehen vs. Computer Vision

Obwohl die Begriffe oft synonym verwendet werden, ist es wichtig, die maschinelle Bildverarbeitung von dem weiter gefassten Gebiet der der Computer Vision zu unterscheiden. Computer Vision ist ein wissenschaftliches Gebiet, das sich darauf konzentriert, Computer in die Lage zu versetzen, Bilder im Allgemeinen zu "verstehen". Bilder im Allgemeinen zu "verstehen", wobei es oft um unstrukturierte Daten wie Fotos aus sozialen Medien oder Überwachungsmaterial geht. Es umfasst Aufgaben, die von der Bildklassifizierung bis hin zu generativer KI.

Im Gegensatz dazu ist die industrielle Bildverarbeitung die Anwendung dieser Technologien zur Lösung industrieller Probleme. Bildverarbeitungssysteme arbeiten in der Regel in kontrollierten Umgebungen mit gleichbleibender Beleuchtung und Kamerapositionierung, um hohe Zuverlässigkeit zu gewährleisten. Während zum Beispiel ein Computer Bildverarbeitungsmodell einen Hund in einem Park erkennen kann, ist ein maschinelles Bildverarbeitungssystem darauf ausgelegt, detect mikroskopisch kleinen Kratzer auf einem Kolbenring, der sich mit hoher Geschwindigkeit auf einem Förderband bewegt.

Anwendungsfälle in der Praxis

Die maschinelle Bildverarbeitung steigert die Effizienz in zahlreichen Sektoren durch die Automatisierung von visuellen Aufgaben.

  • Automatisierte Qualitätskontrolle: In der Fertigungssektor übernehmen Bildverarbeitungssysteme durchführen. Automatische Optische Inspektion (AOI) zur Fehler detect , die für das menschliche Auge unsichtbar sind. Unter Verwendung von Objekterkennungsmodelle können diese Systeme Fehler wie Risse, Dellen oder fehlende Komponenten an Montagelinien sofort erkennen und sicherstellen, dass nur hochwertige Produkte auf den Markt gelangen.
  • Bildverarbeitungsgestützte Robotik: Maschinelles Sehen ist für die moderne Robotik. Sie ermöglicht es Robotern, Objekte zu lokalisieren und aus Objekte aus einem Behälter zu entnehmen (Bin Picking) oder Teile für die Montage präzise zu positionieren. Durch die Integration von Posenschätzung können Roboter die Ausrichtung Orientierung eines Objekts im 3D-Raum erkennen, was eine dynamische Interaktion mit der Umgebung ermöglicht, anstatt vorprogrammierten Pfaden zu folgen.

Implementierung von Machine Vision mit YOLO11

In der modernen maschinellen Bildverarbeitung werden häufig hochmoderne neuronale Netze eingesetzt, um eine robuste Leistung zu erzielen. Das folgende Beispiel zeigt, wie man die ultralytics Python zum Laden eines Modell YOLO11 und Inferenz durchführen, ein üblicher Schritt bei der Überprüfung von Teilen in einer Produktionslinie.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model (or a custom-trained industrial model)
model = YOLO("yolo11n.pt")

# Run inference on an image of a manufactured component
# This step identifies objects and checks for defects based on training
results = model("production_part.jpg")

# Display the results to visualize detections and confidence scores
results[0].show()

Dieser einfache Arbeitsablauf bildet die Grundlage für komplexe Systeme, bei denen Echtzeit-Inferenz das unmittelbare Schicksal Schicksal von Produkten in einer sich schnell bewegenden Linie bestimmt und Inferenzlatenz minimiert wird, um mit der Produktions Geschwindigkeiten.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten