Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Objektverfolgung

Entdecken Sie die Objektverfolgung mit Ultralytics! Erfahren Sie, wie Sie Bewegung, Verhalten und Interaktionen in Videos mit YOLO für Echtzeitanwendungen track können.

Die Objektverfolgung ist eine zentrale Aufgabe im Computer Vision (CV), die die Identifizierung bestimmte Objekte in einer Videosequenz zu identifizieren und ihre Bewegung in aufeinanderfolgenden Bildern zu verfolgen. Im Gegensatz zur statischen Bild Bildanalyse führt dieser Prozess eine zeitliche Dimension ein, die es den Systemen ermöglicht, eine eindeutige Identität für jedes erkannten Objekts beim Durchqueren einer Szene. Durch die Zuweisung einer dauerhaften Identifikationsnummer (ID) für jedes Objekt, können Modelle der künstlichen Intelligenz (KI) Trajektorien analysieren, Geschwindigkeiten berechnen und Interaktionen im Zeitverlauf verstehen. Diese Fähigkeit ist unerlässlich für Videorohdaten in verwertbare Erkenntnisse umzuwandeln und dient als Rückgrat für fortschrittliche Videoverstehenssysteme.

Kernmechanismen des Tracking

Moderne Ortungssysteme arbeiten in der Regel nach dem Paradigma "Tracking-by-Detection". Dieser Arbeitsablauf beginnt mit einem Objekterkennungsmodell, wie zum Beispiel dem Stand der Technik YOLO11das Objekte in jedem Einzelbild lokalisiert Einzelbild lokalisiert. Sobald die Objekte erkannt und mit Bounding Boxes lokalisiert sind Bounding Boxes lokalisiert sind, übernimmt der Tracking-Algorithmus die diese Erkennungen mit vorhandenen Spuren aus früheren Bildern zu verknüpfen.

Der Prozess umfasst im Allgemeinen drei entscheidende Schritte:

  1. Bewegungsvorhersage: Algorithmen wie der Kalman-Filter (KF) verwenden den vergangenen Position und Geschwindigkeit des Objekts, um abzuschätzen, wo es wahrscheinlich im nächsten Bild erscheinen wird. Diese Vorhersage engt den Suchbereich Suchbereich ein und verbessert die Recheneffizienz erheblich.
  2. Datenzuordnung: Das System ordnet neu erkannte Objekte mithilfe von Optimierungsmethoden Optimierungsmethoden wie dem ungarischen Algorithmus. Dieser Schritt stützt sich auf Metriken wie Intersection over Union (IoU) für räumliche Überschneidungen oder visuelle Ähnlichkeiten von Merkmalen.
  3. Identitätserhalt: Hochentwickelte Tracker, wie ByteTrack und BoT-SORT, bewältigen komplexe Szenarien, in denen Objekte Wege kreuzen oder vorübergehend hinter Hindernissen verborgen sind (Okklusion). Durch den Einsatz von Merkmalsextraktion und Deep Learning Einbettungen kann das System ein Objekt auch dann wiedererkennen, wenn es wieder auftaucht, und so einen "ID-Wechsel" verhindern.

Objektverfolgung vs. Objekterkennung

Diese Begriffe werden zwar oft zusammen verwendet, dienen aber unterschiedlichen Zwecken in der Pipeline des maschinellen Lernens (ML).

  • Die Objekterkennung beantwortet die Frage: "Was ist in diesem Bild vorhanden und wo?" Es behandelt jedes Bild als unabhängiges Ereignis und gibt Klassenbezeichnungen und Konfidenzwerte aus, ohne sich an die Vergangenheit zu erinnern.
  • Die Objektverfolgung beantwortet die Frage: "Wohin bewegt sich dieses bestimmte Objekt?" Es verbindet die Erkennungen über die Zeit hinweg, so dass das System erkennen kann, dass ein Auto in Bild 10 das gleiche Fahrzeug ist wie in Bild 100. Diese Unterscheidung ist entscheidend für Anwendungen, die vorausschauende Modellierung von Verhalten erfordern.

Anwendungsfälle in der Praxis

Die Fähigkeit, Objekte zuverlässig zu verfolgen, verändert verschiedene Branchen, indem sie Echtzeit-Inferenz in dynamischen Umgebungen.

  • Intelligente Verkehrssysteme: Im Bereich der autonomen autonomen Fahrzeugen ist die Verfolgung nicht verhandelbar. Selbstfahrende Autos müssen Fußgänger, Radfahrer und andere Fahrzeuge track , um deren zukünftige und Kollisionen zu vermeiden. Dazu müssen oft Daten von Kameras und LiDAR-Sensoren, um die Genauigkeit bei verschiedenen Wetterbedingungen aufrechtzuerhalten.
  • Analytik im Einzelhandel: Der stationäre Handel nutzt KI im Einzelhandel, um die Kundenströme abzubilden. Durch die Verfolgung Bewegungsmuster können Einzelhändler Heatmaps von beliebten Gängen erstellen, Verweilzeiten analysieren und das Ladenlayout Layouts. Diese Daten helfen bei der effizienten Warteschlangenmanagement und die Platzierung des Inventars.
  • Sportanalyse: Profiteams nutzen das Tracking, um die Leistung ihrer Spieler zu analysieren. Durch die Kombination Kombination von Tracking und Posenschätzung können Trainer Biomechanik, Geschwindigkeit und Mannschaftsaufstellungen auswerten und sich durch datengesteuerte Strategien einen Wettbewerbsvorteil verschaffen.

Implementierung von Tracking mit Python

Die Implementierung von High-Performance-Tracking ist einfach mit dem ultralytics Paket. Das folgende Beispiel zeigt, wie man ein vortrainiertes Modell YOLO11 und Objekte in einer Videodatei track . Die Website track Modus übernimmt automatisch die Erkennung und ID-Zuweisung.

from ultralytics import YOLO

# Load the official YOLO11 nano model
model = YOLO("yolo11n.pt")

# Track objects in a video source (use '0' for webcam)
# The 'show=True' argument visualizes the tracking IDs in real-time
results = model.track(source="https://supervision.roboflow.com/assets/", show=True)

# Print the unique IDs detected in the first frame
if results[0].boxes.id is not None:
    print(f"Tracked IDs: {results[0].boxes.id.cpu().numpy()}")

Verwandte Konzepte

Um die Feinheiten des Trackings zu verstehen, ist es hilfreich, Folgendes zu wissen Multi-Object Tracking (MOT) zu verstehen, das das sich speziell auf die gleichzeitige Verfolgung mehrerer Ziele in überfüllten Szenen konzentriert. Außerdem wird das Tracking oft mit der Segmentierung von Instanzen kombiniert, um track um präzise Objektkonturen und nicht nur Bounding Boxes zu verfolgen, was einen höheren Grad an Granularität für Aufgaben wie medizinische Bildgebung oder Robotermanipulation.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten