Découvrez comment fonctionne le suivi d'objets dans la vision par ordinateur. Découvrez comment utiliser Ultralytics pour identifier et surveiller des objets à l'aide d'identifiants uniques afin de réaliser des analyses en temps réel.
Le suivi d'objets est un processus dynamique en vision par ordinateur (CV) qui consiste à identifier des entités spécifiques dans une vidéo et à surveiller leurs mouvements à travers une séquence d'images. Contrairement à l'analyse d'images statiques, qui traite chaque instantané de manière isolée, le suivi introduit la dimension temporelle. Cela permet aux systèmes d'intelligence artificielle (IA) d' attribuer un numéro d'identification unique (ID) à chaque élément détecté, tel qu'une voiture, une personne ou un animal, et de conserver cette identité lorsque l'objet se déplace, change d'orientation ou est temporairement masqué. Cette capacité est la pierre angulaire de la compréhension vidéo avancée, permettant aux machines d'analyser les comportements, de calculer les trajectoires et de tirer des conclusions exploitables à partir d'images brutes.
Les systèmes de suivi modernes utilisent généralement un paradigme de « suivi par détection ». Ce flux de travail combine des modèles de détection puissants avec des algorithmes spécialisés pour associer les détections au fil du temps. Le processus suit généralement trois étapes principales :
Bien que ces termes soient étroitement liés, ils remplissent des fonctions distinctes dans le pipeline d'apprentissage automatique (ML).
La capacité à conserver l'identité des objets permet des applications d'inférence complexes en temps réel dans divers secteurs.
Ultralytics la mise en œuvre d'un suivi hautement performant. Le track mode dans la bibliothèque
gère automatiquement la détection, la prédiction de mouvement et l'attribution d'identifiant. L'exemple ci-dessous montre comment utiliser le
Plate-forme Ultralytics modèle YOLO26 compatible pour track dans une
vidéo.
from ultralytics import YOLO
# Load the official YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Track objects in a video file or webcam (source=0)
# 'show=True' displays the video with bounding boxes and unique IDs
results = model.track(source="https://ultralytics.com/images/bus.jpg", show=True)
# Access the unique tracking IDs from the results
if results[0].boxes.id is not None:
print(f"Detected Track IDs: {results[0].boxes.id.cpu().numpy()}")
Pour bien comprendre l'écosystème du suivi, il est utile d'explorer la segmentation d'instance, qui suit les contours précis d'un objet au niveau du pixel plutôt que simplement une boîte. De plus, les défis de suivi multi-objets (MOT) impliquent souvent des benchmarks largement utilisés comme MOTChallenge pour évaluer la capacité des algorithmes à gérer les scènes encombrées et les occlusions. Pour le déploiement dans des environnements de production, les développeurs utilisent souvent des outils tels que NVIDIA ou OpenCV pour intégrer ces modèles dans des pipelines efficaces.