Wie berechnet man Entfernungen mit Hilfe von Computer-Vision-Modellen?

Abirami Vina

4 Minuten lesen

3. April 2025

Erfahren Sie, wie die Entfernungsberechnung in Computer-Vision-Anwendungen mit Ultralytics YOLO11 dabei hilft, die Nähe von Objekten in Echtzeit zu messen.

Wenn Sie die Straße überqueren und ein Auto auf sich zukommen sehen, können Sie sofort einschätzen, wie weit es entfernt ist. Diese schnelle, fast instinktive Einschätzung verdanken Sie einem räumlichen Verständnis Ihrer Umgebung. Auf der Grundlage dieses Gefühls können Sie entscheiden, ob Sie schneller werden, anhalten oder weitergehen sollen. 

In ähnlicher Weise ist Computer Vision ein Zweig der künstlichen Intelligenz (AI), der es Maschinen ermöglicht, ein Verständnis für ihre Umgebung zu entwickeln, indem sie visuelle Daten interpretieren. So wie Sie die Nähe eines Autos einschätzen können, um schnelle Entscheidungen zu treffen, können Computer-Vision-Modelle Bilder und Videos analysieren und Maschinen dabei helfen, die Welt um sie herum wahrzunehmen und darauf zu reagieren.

Ultralytics YOLO11 zum Beispiel ist ein Computer-Vision-Modell, das Objekte in Bildern und Videos in Echtzeit erkennen und verfolgen kann. Einfach ausgedrückt, betrachtet YOLO11 das gesamte Bild auf einmal und nicht nur einzelne Teile, was es schneller und effizienter macht. Es kann auch Computer-Vision-Aufgaben wie Instanzsegmentierung, Posenschätzung und Bildklassifizierung bewältigen.

Insbesondere können die Fähigkeiten von YOLO11 genutzt werden, um zu berechnen, wie weit Objekte voneinander entfernt sind, was in vielen Bereichen wie der Fertigung, dem Einzelhandel und der Verwaltung von Menschenmengen nützlich ist und zur Verbesserung der Sicherheit und Effizienz beiträgt.

In diesem Artikel erfahren Sie, wie YOLO11 für die Entfernungsberechnung in Computer-Vision-Anwendungen verwendet werden kann, warum es wichtig ist und welche Auswirkungen es in verschiedenen Branchen hat.

__wf_reserved_inherit
Abb. 1. Ein Beispiel für die Verwendung von YOLO zur Berechnung der Landestrecke eines Flugzeugs.

Ein Überblick über die Entfernungsberechnung in der Computer Vision

Bei der Abstandsberechnung in der Computer Vision geht es um die Erkennung, Lokalisierung und Messung der Pixel zwischen zwei Objekten in einem Bild. Pixel sind die einzelnen Einheiten, aus denen ein digitales Bild besteht und die jeweils einen einzelnen Punkt mit einem bestimmten Farb- oder Intensitätswert darstellen. 

Um Pixelmessungen in reale Entfernungen umzuwandeln, ist die Kalibrierung der Schlüssel. Man kann sich das so vorstellen, dass man mit einem Lineal etwas misst und diese Messung dann verwendet, um die Größe anderer Objekte zu verstehen. Durch die Bezugnahme auf Objekte mit bekannten Größen wird durch die Kalibrierung eine Verbindung zwischen den Pixeln und den tatsächlichen physischen Entfernungen hergestellt.

Schauen wir uns ein Beispiel an, um zu sehen, wie das funktioniert. Im folgenden Bild ist die Münze das Referenzobjekt, und ihre Größe (0,9 x 1,0 Zoll) ist bekannt. Wenn wir die Pixelmaße der anderen Objekte mit der Größe der Münze vergleichen, können wir ihre reale Größe berechnen.

__wf_reserved_inherit
Abbildung 2. Eine Münze kann als Referenz verwendet werden, um die Größe anderer Objekte in der realen Welt zu messen.

Die Entfernungsberechnung erfolgt jedoch in einer zweidimensionalen (2D) Ebene, d. h. es werden nur die horizontalen und vertikalen Abstände zwischen Objekten gemessen. Dies unterscheidet sich von der Tiefenschätzung, die den Abstand von Objekten im dreidimensionalen Raum misst, einschließlich ihres Abstands zur Kamera.

Während Tiefenkameras die tatsächliche Tiefe messen und detailliertere räumliche Informationen liefern können, reicht in vielen Fällen eine einfache kalibrierte Entfernung aus. Wenn man beispielsweise weiß, wie weit Objekte in einer 2D-Ebene voneinander entfernt sind, eignet sich das gut für Aufgaben wie die Verfolgung von Objekten oder die Verwaltung von Warteschlangen, sodass eine Tiefenschätzung in diesen Situationen nicht erforderlich ist.

Verstehen, wie die Entfernungsberechnung mit YOLO11 funktioniert

Als Nächstes wollen wir uns ansehen, wie man den Abstand zwischen zwei Objekten mit Hilfe von YOLO11s Unterstützung für Objekterkennung und -verfolgung berechnen kann. Hier ist eine Aufschlüsselung:

  • Erkennen und Verfolgen von Objekten: YOLO11 kann zur Erkennung von Objekten verwendet werden, indem es sie in einem Bild erkennt und ihre Bewegung über Bilder in einem Video verfolgt. Jedem Objekt wird eine eindeutige Track-ID zugewiesen, so dass das System seine Position und Bewegung im gesamten Video verfolgen kann.
  • Begrenzungsrahmen: Basierend auf den Objekterkennungsergebnissen von YOLO11 werden Begrenzungsrahmen um die erkannten Objekte gezeichnet, die deren Position im Bild definieren.
  • Auswählen von Objekten: Zwei Objekte können zum Fokussieren ausgewählt werden, und YOLO11 aktualisiert die Bounding Boxen, während sich die Objekte in Echtzeit bewegen.
  • Berechnung der Zentroide: Die Zentroide (die Mittelpunkte der Begrenzungsrahmen der beiden Objekte) werden anhand der Koordinaten der Ecken der Begrenzungsrahmen berechnet, die die Positionen der Objekte darstellen.
  • Berechnung des Abstands: Die Zentroide der beiden Objekte können dann zur Berechnung des euklidischen Abstands zwischen ihnen verwendet werden. Der euklidische Abstand ist der geradlinige Abstand zwischen zwei Punkten in einer 2D-Ebene, der anhand der Differenzen in horizontaler und vertikaler Richtung berechnet wird. Daraus ergibt sich der Abstand zwischen den beiden Objekten in Pixeln.

Es ist wichtig zu beachten, dass die mit dieser Methode berechneten Entfernungen nur Schätzungen sind, da sie auf 2D-Pixelmessungen basieren.

__wf_reserved_inherit
Abb. 3. Verwendung von Ultralytics YOLO zur Erkennung einer Person und zur Berechnung der Entfernung. 

Die Auswirkungen der YOLO-Entfernungsschätzung

Wenn man bedenkt, dass die Berechnung von Entfernungen mit YOLO11 eine Schätzung ist, fragt man sich vielleicht: Wo kann dies verwendet werden, und wie kann es einen Unterschied machen? 

Da für diese Entfernungsschätzungen Kalibrierungen verwendet werden, sind sie genau genug, um in vielen praktischen Situationen zu helfen. Die Entfernungsschätzung von YOLO11 ist besonders nützlich in dynamischen Umgebungen, wie z. B. in Lagerhallen, wo Objekte ständig in Bewegung sind und Anpassungen in Echtzeit erforderlich sind, um einen reibungslosen Ablauf zu gewährleisten.

Ein interessantes Beispiel ist die Verwendung von YOLO11 zur Verfolgung von Paketen auf einem Förderband und zur Schätzung des Abstands zwischen ihnen in Echtzeit. So können die Lagerverwalter sicherstellen, dass die Pakete richtig verteilt sind, um Kollisionen zu vermeiden und einen reibungslosen Ablauf zu gewährleisten. 

In solchen Fällen ist eine genaue Entfernung nicht immer erforderlich. In der Regel wird ein Bereich oder Schwellenwert für den optimalen Abstand festgelegt, so dass eine Schätzung für diese Art von Anwendungen gut funktioniert.

__wf_reserved_inherit
Abb. 4. Erkennung von Paketen mit YOLO11 und Berechnung des Abstands zwischen ihnen.

Abstandsberechnung in Computer Vision Anwendungen

Verschiedene Bildverarbeitungsanwendungen können von der Berechnung der Entfernung zwischen Objekten mit YOLO11 profitieren. In der Einzelhandelsanalytik hilft es zum Beispiel, die Verwaltung von Warteschlangen zu verbessern, indem es die Positionen der Kunden in Echtzeit verfolgt. Auf diese Weise können Unternehmen ihre Ressourcen besser zuordnen, Wartezeiten verkürzen und ein reibungsloseres Einkaufserlebnis schaffen. Durch die dynamische Anpassung des Personalbestands und die Steuerung der Kundenströme können Geschäfte eine Überfüllung verhindern und die Raumausnutzung optimieren.

Auch im Verkehrsmanagement hilft die Abstandsschätzung bei der Überwachung von Fahrzeugabständen und der Analyse von Verkehrsmustern. Auf diese Weise können gefährliche Verhaltensweisen, wie z. B. dichtes Auffahren, erkannt und Verkehrssignale so angepasst werden, dass der Verkehr reibungslos fließt. Sie kann dazu beitragen, die Straßen sicherer zu machen, indem sie potenzielle Probleme identifiziert und das gesamte Verkehrsmanagement in Echtzeit verbessert.

__wf_reserved_inherit
Abb. 5. Die bildverarbeitungsgestützte Abstandsberechnung kann zur Verkehrsüberwachung eingesetzt werden.

Ein weiterer einzigartiger Einsatz dieser Technologie erfolgte während der COVID-19-Pandemie, als sie dazu beitrug, die soziale Distanzierung zu fördern. Sie sorgte dafür, dass die Menschen an öffentlichen Plätzen, in Geschäften und Krankenhäusern einen Sicherheitsabstand einhielten, um das Risiko der Verbreitung des Virus zu verringern. 

Durch die Verfolgung von Entfernungen in Echtzeit können Warnungen verschickt werden, wenn sich Personen zu nahe kommen, wodurch es für Unternehmen und Gesundheitsdienstleister einfacher wird, schnell zu reagieren und eine sicherere Umgebung für alle zu schaffen.

Vor- und Nachteile der Entfernungsberechnung in der Computer Vision

Nachdem wir nun einige Anwendungen der Entfernungsberechnung mit Hilfe von Computer Vision erörtert haben, wollen wir uns nun die damit verbundenen Vorteile näher ansehen:

  • Automatisierung: Vision AI kann Entfernungsberechnungen automatisieren, die andernfalls eine manuelle Verfolgung erfordern würden, was menschliche Fehler und Arbeitskosten reduziert und die Produktivität erhöht.
  • Optimierung der Ressourcen: Durch die Kenntnis der ungefähren Abstände und der Nähe von Objekten können Ressourcen (wie Personal oder Maschinen) optimiert werden, was zu weniger Verschwendung und besseren Arbeitsabläufen führt.
  • Minimale Komplexität der Einrichtung: Einmal eingerichtet, sind bildverarbeitungsgestützte Entfernungsberechnungssysteme relativ wartungsarm und erfordern im Vergleich zu anderen Systemen, die auf manuelle Eingaben oder komplexe Maschinen angewiesen sind, weniger menschliche Eingriffe.

Trotz dieser Vorteile gibt es auch einige Einschränkungen, die bei der Implementierung solcher Systeme zu beachten sind. Hier ein kurzer Überblick über die wichtigsten Faktoren, die bei der Entfernungsberechnung mit Computer Vision zu beachten sind:

  • Empfindlichkeit gegenüber Umgebungsfaktoren: Die Genauigkeit der Entfernungsberechnung kann durch Lichtverhältnisse, Schatten, Reflexionen oder Hindernisse beeinträchtigt werden, was zu möglichen Fehlern oder Unstimmigkeiten führen kann.
  • Belange des Datenschutzes: Der Einsatz von Computer Vision zur Verfolgung von Objekten oder Personen kann Fragen des Datenschutzes aufwerfen, insbesondere in öffentlichen Räumen oder sensiblen Umgebungen, in denen persönliche Daten betroffen sein könnten.
  • Komplexität in Szenarien mit mehreren Objekten: In Umgebungen mit zahlreichen sich bewegenden Objekten kann die genaue Berechnung der Entfernungen zwischen mehreren Objekten gleichzeitig zu Verwirrung führen, insbesondere wenn sie nahe beieinander liegen oder sich überschneiden.

Die wichtigsten Erkenntnisse

Die Berechnung der Entfernung zwischen Objekten mit YOLO11 ist eine zuverlässige Lösung, die die Entscheidungsfindung unterstützen kann. Sie ist besonders nützlich in dynamischen Umgebungen wie Lagerhallen, Einzelhandel und Verkehrsmanagement, wo die Verfolgung der Objektnähe die Effizienz und Sicherheit verbessern kann. 

YOLO11 ermöglicht es, Aufgaben zu automatisieren, die normalerweise manuellen Aufwand erfordern würden. Es gibt zwar einige Herausforderungen, wie die Empfindlichkeit gegenüber Umweltfaktoren und Bedenken hinsichtlich des Datenschutzes, aber die Vorteile, wie Automatisierung, Skalierbarkeit und einfache Integration, machen diese Technologie so wirkungsvoll. Da sich die Computer Vision weiter verbessert, insbesondere in Bereichen wie der Entfernungsberechnung, ist es wahrscheinlich, dass wir einen echten Wandel in der Art und Weise erleben werden, wie Maschinen mit ihrer Umgebung interagieren und sie verstehen.

Werden Sie Teil unserer Gemeinschaft! Erkunden Sie unser GitHub-Repository, um mehr über Vision AI zu erfahren. Wenn Sie an der Nutzung von Computer Vision interessiert sind, informieren Sie sich über unsere Lizenzierungsoptionen. Erfahren Sie auf unseren Lösungsseiten, wie Computer Vision im Gesundheitswesen die Effizienz verbessert und welche Auswirkungen KI in der Landwirtschaft hat! 

Lassen Sie uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise in die Zukunft des maschinellen Lernens

Kostenloser Start
Link in die Zwischenablage kopiert