Ein Leitfaden zur Verfolgung bewegter Objekte in Videos mit Ultralytics YOLO-Modellen

Abirami Vina

5 Minuten lesen

15. April 2025

Erfahren Sie, wie Computer Vision Tracking-Systeme funktionieren, lernen Sie beliebte Modelle zur Objektverfolgung wie YOLO11 kennen und entdecken Sie deren praktische Anwendungen.

Roboter, die elektrische Teile montieren können, Systeme, die zu schnell fahrende Autos erfassen, und intelligente Einzelhandelslösungen, die das Kaufverhalten der Kunden verfolgen - all diese Innovationen beruhen auf der Computer Vision. Es handelt sich um einen Zweig der künstlichen Intelligenz (KI), der Maschinen hilft, Bilder und Videos zu analysieren und zu verstehen.

Ein Roboter muss zum Beispiel verschiedene Teile erkennen und verfolgen, um sie richtig zusammenzusetzen. In ähnlicher Weise kann ein Verkehrssystem mithilfe von Computer Vision Autos erkennen, Nummernschilder lesen und herausfinden, wann jemand zu schnell fährt. In Geschäften kann Vision AI dabei helfen zu verfolgen, was die Kunden ansehen oder mitnehmen, und sogar den Bestand im Auge behalten.

Solche Anwendungen werden von Bildverarbeitungsmodellen wie Ultralytics YOLO11 unterstützt, die ein breites Spektrum an visuellen Aufgaben abdecken. Viele dieser Aufgaben konzentrieren sich auf die Gewinnung von Erkenntnissen aus einem einzigen Bild, aber eine besonders interessante Aufgabe, die Objektverfolgung, kann verwendet werden, um die Bewegung von Objekten über eine Reihe von Bildern oder Videobildern zu verfolgen.

__wf_reserved_inherit
Abb. 1. Ein Beispiel für die Erkennung und Verfolgung von Autos.

In diesem Leitfaden sehen wir uns die Funktionsweise der Objektverfolgung genauer an und untersuchen Beispiele aus der Praxis, wie sie eingesetzt wird. Wir werden auch erörtern, wie Vision AI-Modelle wie Ultralytics YOLO11 die Objektverfolgung unterstützen. Fangen wir an!

Ein genauerer Blick auf Computer Vision Tracking Systeme

Die Objektverfolgung ist eine Aufgabe der Computer Vision , die dazu dient, die Bewegung von Objekten über Videobilder hinweg zu verfolgen und Systemen dabei zu helfen, zu überwachen und zu verstehen, wie sich Dinge im Laufe der Zeit verändern. Dies ähnelt sehr der Art und Weise, wie Menschen eine sich bewegende Person oder ein Objekt mit ihren Augen verfolgen können, z. B. wenn Sie ein Tennisspiel verfolgen und Ihre Augen den Ball verfolgen, während er sich über den Platz hin und her bewegt.

Bei der Objektverfolgung werden Kameras und KI eingesetzt, um die Bewegung des Balls in Echtzeit zu verfolgen. Diese Technologie kann den Zuschauern zu Hause ein besseres Verständnis des Spielverlaufs vermitteln, insbesondere durch Analysen wie Geschwindigkeit, Flugbahn und Positionierung der Spieler.

Während diese Art der visuellen Verfolgung für Menschen mühelos erscheinen mag, erfordert sie bei der maschinellen Bildverarbeitung eine Reihe von Schritten, die von Vision AI-Modellen unterstützt werden. Hier ist eine einfache Aufschlüsselung, wie die Objektverfolgung funktioniert: 

  • Aufnahme von Videos: Kameras zeichnen Videomaterial auf und halten fest, wie sich Objekte im Laufe der Zeit durch eine Szene bewegen.
  • Erkennen von Objekten: KI-gestützte Computer-Vision-Modelle wie YOLO11 können jedes Bild analysieren, um bestimmte Objekte wie Personen, Fahrzeuge oder Produkte zu identifizieren und zu lokalisieren.
  • Zuweisung einer Identität: Sobald ein Objekt erkannt wurde, weisen die Verfolgungsalgorithmen ihm eine eindeutige ID zu, um es über mehrere Bilder hinweg zu verfolgen, damit das System weiß, dass es sich um dasselbe Objekt handelt, auch wenn es sich bewegt.
  • Überwachung der Bewegung: Das System verfolgt die Bewegung im Laufe der Zeit, und diese Daten können verwendet werden, um Daten wie Geschwindigkeit, Richtung und Interaktionen mit anderen Objekten zu sammeln.
  • Gewinnung von Erkenntnissen: Diese Informationen können in Echtzeit genutzt werden, um Analysen zu erstellen, die Entscheidungsfindung zu unterstützen oder visuelle Überlagerungen zu erstellen - je nach Anwendungsfall.

Vergleich von Objekterkennung und -verfolgung mit YOLO

Eine weitere von YOLO11 unterstützte Bildverarbeitungsaufgabe, die eng mit der Objektverfolgung verbunden ist, ist die Objekterkennung. Lassen Sie uns den Unterschied zwischen diesen beiden Aufgaben untersuchen. 

Bei der Objekterkennung geht es um die Identifizierung und Lokalisierung von Objekten von Interesse in einem einzelnen Bild oder Videobild. Ein selbstfahrendes Auto nutzt beispielsweise die Objekterkennung, um ein Stoppschild oder einen Fußgänger in einem Einzelbild zu erkennen, das von den Kameras an Bord aufgenommen wurde. Damit wird die Frage beantwortet: "Was ist in diesem Bild und wo befindet es sich?" Es liefert jedoch keine Informationen darüber, wohin sich das Objekt als nächstes bewegt.

Die Objektverfolgung baut auf der Objekterkennung auf, indem sie ein Verständnis für die Bewegung über die Zeit hinzufügt. Der Hauptunterschied zwischen den beiden Verfahren besteht darin, wie sie mit Zeit und Bewegung umgehen. Bei der Objekterkennung wird jedes Einzelbild als unabhängiger Schnappschuss behandelt, während bei der Objektverfolgung die Punkte zwischen den Einzelbildern miteinander verbunden werden, wobei vergangene Daten verwendet werden, um die zukünftige Position eines Objekts vorherzusagen.

Wenn wir beides kombinieren, können wir leistungsstarke KI-Systeme für die Echtzeitverfolgung in dynamischen Umgebungen entwickeln. Ein automatisiertes Sicherheitssystem kann zum Beispiel Personen erkennen, die einen Raum betreten, und ihre Bewegung kontinuierlich über das Bild hinweg verfolgen.

Verfolgung in Echtzeit mit Ultralytics YOLO-Modellen

Nachdem wir nun den Unterschied zwischen Objekterkennung und -verfolgung erläutert haben, wollen wir einen Blick darauf werfen, wie die YOLO-Modelle von Ultralytics, wie YOLO11, die Objektverfolgung in Echtzeit unterstützen.

YOLO-Modelle sind zwar selbst keine Verfolgungsalgorithmen, aber sie spielen eine wichtige Rolle bei der Erkennung von Objekten in jedem Videobild. Sobald Objekte erkannt sind, werden Verfolgungsalgorithmen benötigt, um ihnen eindeutige IDs zuzuweisen, damit das System ihre Bewegung von Bild zu Bild verfolgen kann. 

Um diesem Bedarf gerecht zu werden, integriert das Ultralytics-Python-Paket die Objekterkennung nahtlos mit gängigen Verfolgungsalgorithmen wie BoT-SORT und ByteTrack. Diese Integration ermöglicht es den Benutzern, Erkennung und Verfolgung mit minimaler Einrichtung gemeinsam auszuführen.

Bei der Verwendung von YOLO-Modellen für die Objektverfolgung können Sie je nach den Anforderungen Ihrer Anwendung wählen, welchen Verfolgungsalgorithmus Sie anwenden möchten. BoT-SORT ist beispielsweise eine gute Option für die Verfolgung von Objekten, die sich unvorhersehbar bewegen, dank der Verwendung von Bewegungsvorhersage und Deep Learning. ByteTrack hingegen eignet sich besonders gut für belebte Szenen und sorgt für eine zuverlässige Verfolgung, selbst wenn die Objekte verschwommen oder teilweise verdeckt sind.

__wf_reserved_inherit
Abbildung 2. Das Ultralytics Python-Paket integriert BoT-SORT und ByteTrack nahtlos.

Wie hängt das Training des benutzerdefinierten YOLO-Modells mit der Objektverfolgung zusammen?

Benutzerdefiniertes Training ist der Prozess der Feinabstimmung eines vortrainierten Objekterkennungsmodells wie YOLO11 auf einem bestimmten Datensatz, damit es Objekte erkennen kann, die nicht in Standarddatensätzen enthalten sind. Dies ist besonders wichtig, wenn Ihr Tracking-System benutzerdefinierte oder ungewöhnliche Objekte verfolgen muss.

Verfolgungssysteme sind darauf angewiesen, dass das Erkennungsmodell das Objekt zuerst erkennt. Wenn ein YOLO-Modell ein bestimmtes Objekt nicht erkennen kann, z. B. einen bestimmten Maschinentyp oder eine bestimmte Tierart, kann der Verfolgungsalgorithmus dem Objekt nicht folgen.

Deshalb ist benutzerdefiniertes Training so wichtig: Es stellt sicher, dass das Erkennungsmodell die Objekte, die Sie verfolgen möchten, genau identifizieren kann.

Es ist auch wichtig zu bedenken, dass nur das Erkennungsmodell während dieses Prozesses feinabgestimmt wird. Die Verfolgungsalgorithmen, wie BoT-SORT oder ByteTrack, werden nicht speziell trainiert - sie verwenden einfach die Ausgabe des YOLO-Modells, um die erkannten Objekte über Frames hinweg zu verfolgen.

Anwendungen der Objektverfolgung mit Ultralytics YOLO

Nachdem wir nun besser verstanden haben, was Objektverfolgung ist und wie sie funktioniert, wollen wir nun einige reale Anwendungen untersuchen, in denen diese Technologie zum Einsatz kommt.

Echtzeitverfolgung mit Ultralytics YOLO zur Geschwindigkeitsschätzung

Systeme zur Schätzung der Geschwindigkeit, die durch Computer Vision ermöglicht werden, hängen von Aufgaben wie Objekterkennung und -verfolgung ab. Diese Systeme sollen berechnen, wie schnell sich ein Objekt bewegt - egal ob es sich um ein Fahrzeug, einen Radfahrer oder sogar eine Person handelt. Diese Informationen sind für eine Vielzahl von Anwendungen entscheidend, vom Verkehrsmanagement über die Sicherheitsüberwachung bis hin zur industriellen Automatisierung.

Mit einem Modell wie Ultralytics YOLO11 können Objekte über Videobilder hinweg erkannt und verfolgt werden. Durch die Analyse, wie weit sich ein Objekt innerhalb eines bestimmten Zeitraums bewegt, kann das System seine Geschwindigkeit abschätzen. 

__wf_reserved_inherit
Abb. 3. Verwendung der YOLO11-Unterstützung für die Objektverfolgung zur Geschwindigkeitsschätzung.

Erforschung der Objektverfolgung in der Fertigung

Fertigungsprozesse können schnell und hochkomplex sein, so dass es schwierig ist, jeden produzierten Artikel manuell zu verfolgen. Die Objektverfolgung bietet eine gute Lösung für die Automatisierung der Überwachung von Produkten auf ihrem Weg durch die einzelnen Produktionsstufen. Es kann Fabriken dabei helfen, ein hohes Maß an Genauigkeit und Effizienz aufrechtzuerhalten, ohne die Abläufe zu verlangsamen.

Ob beim Zählen von Produkten auf einem Förderband, beim Erkennen von Fehlern oder bei der Überprüfung der ordnungsgemäßen Montage - die Objektverfolgung sorgt für Transparenz und Kontrolle bei Aufgaben, die ansonsten zeitaufwändig oder fehleranfällig wären. Diese Technologie ist vor allem in Branchen mit hohem Produktionsvolumen wie Lebensmittelverarbeitung, Elektronik und Verpackung von Bedeutung, wo Geschwindigkeit und Präzision entscheidend sind.

__wf_reserved_inherit
Abb. 4. Ein Beispiel für die Verfolgung und Zählung von Lebensmitteln an einem Fließband mit YOLO11.

Ein Überblick über die Objektverfolgung in der Einzelhandelsanalytik

Unzählige Kunden gehen jeden Tag in Einzelhandelsgeschäften ein und aus, und das Verständnis ihres Verhaltens ist der Schlüssel zur Verbesserung des Kundenerlebnisses und der Unternehmensleistung. Die Objektverfolgung ermöglicht es Einzelhändlern, den Fußverkehr zu überwachen, die Verweildauer zu messen und die Bewegungsmuster zu analysieren - und das alles ohne invasive oder manuelle Methoden.

Durch die Verfolgung von Personen beim Betreten, Verlassen und Bewegen durch das Geschäft können Unternehmen Einblicke in Stoßzeiten, beliebte Bereiche und sogar die Länge von Warteschlangen gewinnen. Diese Erkenntnisse können als Entscheidungsgrundlage für die Personalbesetzung, das Ladenlayout und die Platzierung des Inventars dienen, was letztlich zu effizienteren Abläufen und höheren Umsätzen führt.

__wf_reserved_inherit
Abb. 5. Verwendung der Objektverfolgungsfähigkeiten von YOLO11 zur Überwachung von Personen beim Betreten und Verlassen eines Geschäfts.

Vor- und Nachteile der Objektverfolgung

Von Einzelhandelsgeschäften bis hin zu Fabrikhallen wird die Objektverfolgung in allen möglichen Branchen eingesetzt, um Faktoren wie Effizienz, Sicherheit und das Gesamterlebnis zu verbessern. Hier sind einige der wichtigsten Vorteile, die Objektverfolgung in verschiedenen Branchen bieten kann:

  • Ermöglicht Echtzeit-Warnungen: Systeme mit integrierter Objektverfolgung können so konfiguriert werden, dass sie automatisch Alarme auslösen, wenn etwas Ungewöhnliches entdeckt wird, z. B. wenn eine Person einen gesperrten Bereich betritt oder eine Lieferung zu lange an einem Ort liegen bleibt.
  • Integrierbar mit anderen Systemen: Objektverfolgungsdaten können mit anderen Technologien wie Gesichtserkennung, Wärmebildkameras oder Inventarsystemen kombiniert werden, um noch bessere Einblicke zu erhalten.
  • Langfristig kosteneffizient: Auch wenn die anfängliche Einrichtung Investitionen erfordert, reduziert die automatische Verfolgung den Bedarf an manueller Arbeit, senkt die Fehlerquote und senkt die Betriebskosten im Laufe der Zeit.

Diese Vorteile verdeutlichen zwar, wie sich die Objektverfolgung auf verschiedene Anwendungsfälle positiv auswirkt, aber es ist auch wichtig, die Herausforderungen bei der Implementierung zu berücksichtigen. Werfen wir einen genaueren Blick auf einige Einschränkungen der Objektverfolgung:

  • Schwierigkeit in überfüllten Umgebungen: In belebten Umgebungen wie Konzerten, Einkaufszentren oder Straßen in der Stadt können Ortungssysteme Schwierigkeiten haben, zwischen nahe beieinander stehenden Personen oder Objekten zu unterscheiden, was zu Verwirrung oder ungenauen Ergebnissen führt.
  • Empfindlich gegenüber Umgebungsbedingungen: Schlechte Beleuchtung, Nebel, schnelle Bewegungen oder Verwacklungen der Kamera können die Fähigkeit des Systems beeinträchtigen, Objekte genau zu verfolgen, insbesondere im Freien oder in unkontrollierten Umgebungen.
  • Datenschutz und rechtliche Bedenken: Der unsachgemäße Umgang mit personenbezogenen Daten, die fehlende Zustimmung der Nutzer oder die Überwachung im öffentlichen Raum können ethische Fragen aufwerfen und zur Nichteinhaltung von Datenschutzgesetzen führen.

Die wichtigsten Erkenntnisse

Bei der Objektverfolgung handelt es sich um eine Computer-Vision-Aufgabe, die es Maschinen ermöglicht, die Bewegung von Objekten im Laufe der Zeit zu verfolgen. Es wird in einer Vielzahl von realen Szenarien eingesetzt - von der Schätzung der Fahrzeuggeschwindigkeit über das Zählen von Produkten auf einem Fließband bis hin zur Analyse von Spielerbewegungen im Sport.

Mit Vision AI-Modellen wie YOLO11 und Verfolgungsalgorithmen wie BoT-SORT und ByteTrack ist die Objektverfolgung schneller, intelligenter und in verschiedenen Branchen zugänglicher geworden. Die Weiterentwicklung der Objektverfolgungstechnologie trägt dazu bei, dass Systeme intelligenter, effizienter und reaktionsschneller werden - Bild für Bild.

Möchten Sie mehr über Computer Vision und KI erfahren? Erkunden Sie unser GitHub-Repository, tauschen Sie sich mit unserer Community aus, und informieren Sie sich über unsere Lizenzierungsoptionen, um Ihr Computer-Vision-Projekt zu starten. Wenn Sie sich für Innovationen wie KI in der Fertigung und Computer Vision in der Automobilindustrie interessieren, besuchen Sie unsere Lösungsseiten, um mehr zu erfahren. 

Lassen Sie uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise in die Zukunft des maschinellen Lernens

Kostenloser Start
Link in die Zwischenablage kopiert