Entdecken Sie die Objektverfolgung mit Ultralytics! Erfahren Sie, wie Sie Bewegung, Verhalten und Interaktionen in Videos mit YOLO für Echtzeitanwendungen track können.
Die Objektverfolgung ist eine zentrale Aufgabe im Computer Vision (CV), die die Identifizierung bestimmte Objekte in einer Videosequenz zu identifizieren und ihre Bewegung in aufeinanderfolgenden Bildern zu verfolgen. Im Gegensatz zur statischen Bild Bildanalyse führt dieser Prozess eine zeitliche Dimension ein, die es den Systemen ermöglicht, eine eindeutige Identität für jedes erkannten Objekts beim Durchqueren einer Szene. Durch die Zuweisung einer dauerhaften Identifikationsnummer (ID) für jedes Objekt, können Modelle der künstlichen Intelligenz (KI) Trajektorien analysieren, Geschwindigkeiten berechnen und Interaktionen im Zeitverlauf verstehen. Diese Fähigkeit ist unerlässlich für Videorohdaten in verwertbare Erkenntnisse umzuwandeln und dient als Rückgrat für fortschrittliche Videoverstehenssysteme.
Moderne Ortungssysteme arbeiten in der Regel nach dem Paradigma "Tracking-by-Detection". Dieser Arbeitsablauf beginnt mit einem Objekterkennungsmodell, wie zum Beispiel dem Stand der Technik YOLO11das Objekte in jedem Einzelbild lokalisiert Einzelbild lokalisiert. Sobald die Objekte erkannt und mit Bounding Boxes lokalisiert sind Bounding Boxes lokalisiert sind, übernimmt der Tracking-Algorithmus die diese Erkennungen mit vorhandenen Spuren aus früheren Bildern zu verknüpfen.
Der Prozess umfasst im Allgemeinen drei entscheidende Schritte:
Diese Begriffe werden zwar oft zusammen verwendet, dienen aber unterschiedlichen Zwecken in der Pipeline des maschinellen Lernens (ML).
Die Fähigkeit, Objekte zuverlässig zu verfolgen, verändert verschiedene Branchen, indem sie Echtzeit-Inferenz in dynamischen Umgebungen.
Die Implementierung von High-Performance-Tracking ist einfach mit dem ultralytics Paket. Das folgende
Beispiel zeigt, wie man ein vortrainiertes
Modell YOLO11
und Objekte in einer Videodatei track . Die Website track Modus übernimmt automatisch die Erkennung und ID-Zuweisung.
from ultralytics import YOLO
# Load the official YOLO11 nano model
model = YOLO("yolo11n.pt")
# Track objects in a video source (use '0' for webcam)
# The 'show=True' argument visualizes the tracking IDs in real-time
results = model.track(source="https://supervision.roboflow.com/assets/", show=True)
# Print the unique IDs detected in the first frame
if results[0].boxes.id is not None:
print(f"Tracked IDs: {results[0].boxes.id.cpu().numpy()}")
Um die Feinheiten des Trackings zu verstehen, ist es hilfreich, Folgendes zu wissen Multi-Object Tracking (MOT) zu verstehen, das das sich speziell auf die gleichzeitige Verfolgung mehrerer Ziele in überfüllten Szenen konzentriert. Außerdem wird das Tracking oft mit der Segmentierung von Instanzen kombiniert, um track um präzise Objektkonturen und nicht nur Bounding Boxes zu verfolgen, was einen höheren Grad an Granularität für Aufgaben wie medizinische Bildgebung oder Robotermanipulation.