Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten

Wie berechnet man Entfernungen mit Computer-Vision-Modellen?

Abirami Vina

4 Min. Lesezeit

3. April 2025

Erfahren Sie, wie die Distanzberechnung in Computer-Vision-Anwendungen mit Ultralytics YOLO11 dazu beiträgt, die Nähe von Objekten in Echtzeit zu messen.

Wenn Sie eine Straße überqueren und ein Auto auf sich zukommen sehen, können Sie sofort erkennen, wie weit es ungefähr entfernt ist. Diese schnelle, fast instinktive Einschätzung ist einem räumlichen Verständnis Ihrer Umgebung zu verdanken. Aufgrund dieses Gefühls können Sie entscheiden, ob Sie schneller werden, anhalten oder weitergehen. 

In ähnlicher Weise ist Computer Vision ein Zweig der künstlichen Intelligenz (KI), der es Maschinen ermöglicht, ein Verständnis für ihre Umgebung zu entwickeln, indem sie visuelle Daten interpretieren. So wie Sie die Nähe eines Autos einschätzen können, um schnelle Entscheidungen zu treffen, können Computer-Vision-Modelle Bilder und Videos analysieren und Maschinen helfen, die Welt um sie herum wahrzunehmen und darauf zu reagieren.

Zum Beispiel ist Ultralytics YOLO11 ein Computer Vision Modell, das Objekte in Bildern und Videos in Echtzeit erkennen und verfolgen kann. Einfach ausgedrückt, YOLO11 betrachtet das gesamte Bild auf einmal und nicht in Teilen, was es schneller und effizienter macht. Es kann auch Computer Vision Aufgaben wie Instanzsegmentierung, Pose-Schätzung und Bildklassifizierung bewältigen.

Insbesondere können die Fähigkeiten von YOLO11 verwendet werden, um zu berechnen, wie weit Objekte voneinander entfernt sind, was in vielen Bereichen wie der Fertigung, dem Einzelhandel und dem Crowd-Management nützlich ist und zur Verbesserung der Sicherheit und Effizienz beiträgt.

In diesem Artikel werden wir untersuchen, wie YOLO11 für die Entfernungsberechnung in Computer-Vision-Anwendungen verwendet werden kann, warum dies wichtig ist und welche Auswirkungen dies auf verschiedene Branchen hat.

__wf_reserved_inherit
Abb. 1. Ein Beispiel für die Verwendung von YOLO zur Berechnung der Landedistanz eines Flugzeugs.

Ein Überblick über die Distanzberechnung in Computer Vision

Die Entfernungsberechnung in der Computer Vision umfasst das Erkennen, Lokalisieren und Messen der Pixel zwischen zwei Objekten in einem Bild. Pixel sind die einzelnen Einheiten, aus denen ein digitales Bild besteht, wobei jedes Pixel einen einzelnen Punkt mit einem bestimmten Farb- oder Intensitätswert darstellt. 

Um Pixelmessungen in reale Entfernungen umzurechnen, ist die Kalibrierung der Schlüssel. Sie können sich das wie die Verwendung eines Lineals zum Messen von etwas vorstellen und diese Messung dann verwenden, um die Größe anderer Objekte zu verstehen. Durch den Bezug auf Objekte mit bekannten Größen schafft die Kalibrierung eine Verbindung zwischen den Pixeln und den tatsächlichen physischen Entfernungen.

Betrachten wir ein Beispiel, um zu sehen, wie das funktioniert. Im folgenden Bild ist die Münze das Referenzobjekt, und ihre Größe (0,9 Zoll mal 1,0 Zoll) ist bekannt. Durch den Vergleich der Pixelmessungen der anderen Objekte mit der Größe der Münze können wir ihre tatsächliche Größe berechnen.

__wf_reserved_inherit
Abb. 2. Eine Münze kann als Referenz verwendet werden, um die tatsächliche Größe anderer Objekte zu messen.

Die Distanzberechnung erfolgt jedoch in einer zweidimensionalen (2D) Ebene, was bedeutet, dass nur die horizontalen und vertikalen Abstände zwischen Objekten gemessen werden. Dies unterscheidet sich von der Tiefenschätzung, bei der der Abstand von Objekten im dreidimensionalen Raum gemessen wird, einschließlich ihres Abstands von der Kamera.

Während Tiefenkameras die tatsächliche Tiefe messen und detailliertere räumliche Informationen liefern können, reicht in vielen Fällen eine einfache kalibrierte Entfernung aus. Zum Beispiel funktioniert das Wissen, wie weit Objekte in einer 2D-Ebene voneinander entfernt sind, gut für Aufgaben wie das Verfolgen von Objekten oder das Verwalten von Warteschlangen, sodass in diesen Situationen keine Tiefenschätzung erforderlich ist.

Verstehen, wie die Distanzberechnung mit YOLO11 funktioniert

Gehen wir als Nächstes durch, wie man den Abstand zwischen zwei Objekten mithilfe der YOLO11-Unterstützung für Objekterkennung und -verfolgung berechnet. Hier ist eine Aufschlüsselung:

  • Objekterkennung und -verfolgung: YOLO11 kann verwendet werden, um Objekte zu erkennen, indem es sie in einem Frame erkennt und ihre Bewegung über Frames in einem Video verfolgt. Es weist jedem Objekt eine eindeutige Track-ID zu, sodass das System seine Position und Bewegung während des gesamten Videos überwachen kann.
  • Bounding Boxes: Bounding Boxes werden basierend auf den Objekterkennungsergebnissen von YOLO11 um die erkannten Objekte gezeichnet, wodurch deren Position im Bild definiert wird.
  • Objekte auswählen: Es können zwei Objekte ausgewählt werden, auf die man sich konzentrieren möchte, und YOLO11 aktualisiert die Begrenzungsrahmen, wenn sich die Objekte in Echtzeit bewegen.
  • Zentroidberechnung: Zentroide (die Mittelpunkte der Bounding Boxes der beiden Objekte) werden basierend auf den Koordinaten der Bounding-Box-Ecken berechnet, die die Positionen der Objekte darstellen.
  • Abstandsberechnung: Die Schwerpunkte der beiden Objekte können dann verwendet werden, um den euklidischen Abstand zwischen ihnen zu berechnen. Der euklidische Abstand ist die geradlinige Entfernung zwischen zwei Punkten in einer 2D-Ebene, die unter Verwendung der Differenzen sowohl in horizontaler als auch in vertikaler Richtung berechnet wird. Dies liefert den Abstand zwischen den beiden Objekten in Pixeln.

Es ist wichtig zu beachten, dass die mit dieser Methode berechneten Entfernungen nur Schätzungen sind, da sie auf 2D-Pixelmessungen basieren.

__wf_reserved_inherit
Abb. 3. Verwendung von Ultralytics YOLO zur Erkennung einer Person und zur Berechnung von Entfernungen. 

Die Auswirkungen der YOLO-Entfernungsschätzung

Wenn man bedenkt, dass die Berechnung von Entfernungen mit YOLO11 eine Schätzung ist, fragen Sie sich vielleicht: Wo kann dies eingesetzt werden, und wie kann es einen Unterschied machen? 

Da Kalibrierungen verwendet werden, um zu diesen Entfernungsschätzungen zu gelangen, sind sie genau genug, um in vielen praktischen Situationen zu helfen. Die Entfernungsschätzung von YOLO11 ist besonders nützlich in dynamischen Umgebungen, wie z. B. Lagerhäusern, in denen sich Objekte ständig bewegen und Echtzeit-Anpassungen notwendig sind, um einen reibungslosen Ablauf zu gewährleisten.

Ein interessantes Beispiel ist die Verwendung von YOLO11, um Pakete zu verfolgen auf einem Förderband und den Abstand zwischen ihnen in Echtzeit zu schätzen. Dies hilft Lagerverwaltern sicherzustellen, dass die Pakete richtig platziert sind, wodurch Kollisionen vermieden und der Betrieb reibungslos läuft. 

In solchen Fällen ist eine exakte Entfernung nicht immer erforderlich. Typischerweise wird ein Bereich oder Schwellenwert für die optimale Entfernung festgelegt, so dass eine Schätzung für diese Art von Anwendungen gut funktioniert.

__wf_reserved_inherit
Abb. 4. Erkennung von Paketen mit YOLO11 und Berechnung des Abstands zwischen ihnen.

Entfernungsberechnung in Computer-Vision-Anwendungen

Verschiedene Computer-Vision-Anwendungen können von der Berechnung der Entfernung zwischen Objekten mit YOLO11 profitieren. Im Einzelhandel hilft es beispielsweise, das Warteschlangenmanagement durch die Echtzeitverfolgung von Kundenpositionen zu verbessern. Dies ermöglicht es Unternehmen, Ressourcen besser zu verteilen, Wartezeiten zu verkürzen und ein reibungsloseres Einkaufserlebnis zu schaffen. Durch die dynamische Anpassung des Personalbestands und die Steuerung des Kundenstroms können Geschäfte Überfüllung vermeiden und die Raumnutzung optimieren.

Auch im Verkehrsmanagement hilft die Abstandsschätzung bei der Überwachung des Fahrzeugabstands und der Analyse von Verkehrsmustern. Dies kann verwendet werden, um gefährliches Verhalten, wie z. B. Drängeln, zu erkennen und Verkehrssignale anzupassen, um den Verkehrsfluss aufrechtzuerhalten. Es kann dazu beitragen, die Straßen sicherer zu machen, indem es potenzielle Probleme identifiziert und das gesamte Verkehrsmanagement in Echtzeit verbessert.

__wf_reserved_inherit
Abb. 5. Die visionsgestützte Distanzberechnung kann zur Verkehrsüberwachung eingesetzt werden.

Eine weitere einzigartige Anwendung dieser Technologie fand während der COVID-19-Pandemie statt, als sie dazu beitrug, Social Distancing zu fördern. Sie stellte sicher, dass die Menschen in öffentlichen Räumen, Geschäften und Krankenhäusern einen Sicherheitsabstand einhielten, wodurch das Risiko der Virusverbreitung verringert wurde. 

Durch die Echtzeitverfolgung von Entfernungen könnten Warnmeldungen gesendet werden, wenn sich Personen zu nahe kommen, was es Unternehmen und Gesundheitsdienstleistern erleichtern würde, schnell zu reagieren und eine sicherere Umgebung für alle aufrechtzuerhalten.

Vor- und Nachteile der Distanzberechnung in der Computer Vision

Nachdem wir nun einige der Anwendungen der Distanzberechnung mithilfe von Computer Vision erörtert haben, werfen wir einen genaueren Blick auf die damit verbundenen Vorteile:

  • Automatisierung: Vision AI kann Aufgaben zur Abstandsberechnung automatisieren, die andernfalls eine manuelle Verfolgung erfordern würden, wodurch menschliche Fehler und Arbeitskosten reduziert und gleichzeitig die Produktivität gesteigert werden.
  • Ressourcenoptimierung: Durch die Kenntnis des ungefähren Abstands und der Nähe von Objekten können Ressourcen (wie Personal oder Maschinen) optimiert werden, wodurch Verschwendung reduziert und Arbeitsabläufe verbessert werden.
  • Minimale Einrichtungskomplexität: Nach der Einrichtung sind visionsgestützte Systeme zur Distanzberechnung relativ wartungsarm und erfordern weniger menschliches Eingreifen im Vergleich zu anderen Systemen, die auf manueller Eingabe oder komplexen Maschinen basieren.

Trotz dieser Vorteile gibt es auch einige Einschränkungen, die bei der Implementierung solcher Systeme zu beachten sind. Hier ist ein kurzer Überblick über die wichtigsten Faktoren, die bei der Entfernungsmessung mit Computer Vision zu berücksichtigen sind:

  • Empfindlichkeit gegenüber Umweltfaktoren: Die Genauigkeit der Abstandsberechnung kann durch Lichtverhältnisse, Schatten, Reflexionen oder Hindernisse beeinträchtigt werden, was zu potenziellen Fehlern oder Inkonsistenzen führt.
  • Datenschutzbedenken: Die Verwendung von Computer Vision zur Verfolgung von Objekten oder Personen kann Datenschutzprobleme aufwerfen, insbesondere in öffentlichen Räumen oder sensiblen Umgebungen, in denen personenbezogene Daten betroffen sein könnten.
  • Komplexität in Multi-Objekt-Szenarien: In Umgebungen mit zahlreichen sich bewegenden Objekten kann die genaue Berechnung von Abständen zwischen mehreren Objekten gleichzeitig zu Verwirrung führen, insbesondere wenn sie nahe beieinander liegen oder sich überschneiden.

Wesentliche Erkenntnisse

Die Berechnung des Abstands zwischen Objekten mit YOLO11 ist eine zuverlässige Lösung, die die Entscheidungsfindung unterstützen kann. Sie ist besonders nützlich in dynamischen Umgebungen wie Lagerhäusern, Einzelhandel und Verkehrsmanagement, wo die Verfolgung der Objektnähe die Effizienz und Sicherheit verbessern kann. 

YOLO11 ermöglicht die Automatisierung von Aufgaben, die normalerweise manuellen Aufwand erfordern würden. Obwohl es einige Herausforderungen gibt, wie z. B. die Empfindlichkeit gegenüber Umweltfaktoren und Bedenken hinsichtlich des Datenschutzes, sind die Vorteile, wie Automatisierung, Skalierbarkeit und einfache Integration, von großer Bedeutung. Da sich Computer Vision immer weiter verbessert, insbesondere in Bereichen wie der Distanzberechnung, werden wir wahrscheinlich eine echte Veränderung in der Art und Weise erleben, wie Maschinen mit ihrer Umgebung interagieren und sie verstehen.

Treten Sie unserer Community bei! Erkunden Sie unser GitHub-Repository, um mehr über Vision AI zu erfahren. Wenn Sie daran interessiert sind, Computer Vision zu nutzen, sehen Sie sich unsere Lizenzoptionen an. Erfahren Sie, wie Computer Vision im Gesundheitswesen die Effizienz verbessert, und sehen Sie sich die Auswirkungen von KI in der Landwirtschaft an, indem Sie unsere Lösungsseiten besuchen! 

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens

Kostenlos starten
Link in die Zwischenablage kopiert