Glossaire

Suivi de plusieurs objets (MOT)

Découvrez le suivi multi-objets (MOT) dans la vision par ordinateur. Apprenez à detect à track à l'aide Ultralytics pour la conduite autonome, la vente au détail et bien plus encore.

Le suivi multi-objets (MOT) est une tâche dynamique en vision par ordinateur (CV) qui consiste à détecter plusieurs entités distinctes dans un flux vidéo et à maintenir leur identité au fil du temps. Contrairement à la détection d'objets standard, qui traite chaque image comme un instantané isolé, le MOT introduit une dimension temporelle dans l' intelligence artificielle (IA). En attribuant un numéro d'identification unique (ID) à chaque instance détectée, telle qu'un piéton spécifique dans une foule ou un véhicule sur une autoroute, les algorithmes MOT permettent aux systèmes de suivre les trajectoires, d'analyser les comportements et de comprendre les interactions. Cette capacité est fondamentale pour la compréhension vidéo moderne et permet aux machines de percevoir la continuité dans un environnement changeant.

Comment fonctionne le MOT ?

La plupart des systèmes de suivi contemporains fonctionnent selon un paradigme de « suivi par détection ». Cette approche sépare le processus en deux étapes principales : identifier ce qui se trouve dans le cadre, puis associer ces résultats à des objets connus du passé.

Détection : dans chaque image, un modèle haute performance tel que YOLO26 analyse l'image pour localiser les objets, générant ainsi des rectangles englobants et des probabilités de classe.
Prédiction de mouvement : pour anticiper le prochain déplacement d'un objet, les algorithmes utilisent souvent un filtre de Kalman. Cet outil mathématique estime l'état d'un système dynamique, tel que la vitesse et la position, ce qui permet de réduire la zone de recherche dans l'image suivante .
Association des données : le système associe les nouvelles détections aux pistes existantes. Des méthodes d'optimisation telles que l'algorithme hongrois résolvent ce problème d'affectation en minimisant le coût de l'association, souvent en s'appuyant sur l' intersection sur l'union (IoU) pour mesurer le chevauchement spatial.
Re-identification (ReID) : en cas d'obstacles visuels (appelés occlusions), les trackers avancés utilisent des intégrations visuelles pour reconnaître l'objet lorsqu'il réapparaît. Cela permet d'éviter les « changements d'identité » et garantit que le système sait que la voiture qui sort d'un tunnel est la même que celle qui y est entrée.

Distinguer le MOT du suivi d'objet unique

Bien que la terminologie soit similaire, le suivi multi-objets (MOT) diffère considérablement du suivi d'objet unique (SOT). Le SOT se concentre sur le suivi d'une cible spécifique initialisée dans la première image, ignorant souvent toutes les autres entités. En revanche, le MOT doit gérer un nombre inconnu et variable de cibles qui peuvent entrer ou sortir de la scène à tout moment. Cela rend le MOT plus exigeant sur le plan informatique, car il nécessite une logique robuste pour gérer track et la fin track , ainsi que les interactions complexes entre plusieurs corps en mouvement.

Applications concrètes

La capacité à track simultanément track entités stimule l'innovation dans plusieurs secteurs majeurs.

Conduite autonome : les voitures autonomes s'appuient fortement sur le MOT pour naviguer en toute sécurité. En suivant les piétons, les cyclistes et les autres véhicules, les systèmes autonomes peuvent prédire les positions futures afin d'éviter les collisions. Cela implique souvent de fusionner les données provenant des caméras et des capteurs LiDAR pour une fiabilité maximale.
Analyse du commerce de détail : dans les magasins physiques, les détaillants utilisent l'IA dans le commerce de détail pour cartographier le parcours des clients. Les algorithmes MOT génèrent des cartes thermiques du trafic piétonnier, aidant ainsi les gestionnaires à optimiser l'agencement des magasins et à améliorer la gestion des files d'attente pendant les heures de pointe.
Analyse sportive : les équipes professionnelles utilisent la MOT pour analyser les mouvements des joueurs et les formations des équipes. En suivant chaque joueur sur le terrain, les entraîneurs peuvent extraire des mesures détaillées sur la vitesse, la distance parcourue et le positionnement tactique à l'aide de techniques d'estimation de la pose.

Mise en œuvre de MOT avec Python

Ultralytics la mise en œuvre du suivi grâce à des modèles de pointe. Le track() Cette méthode intègre de manière transparente la logique de détection et de suivi, prenant en charge des algorithmes tels que ByteTrack et BoT-SORT. L'exemple ci-dessous montre comment suivre des véhicules dans une vidéo à l'aide de la méthode recommandée. Modèle YOLO26.

from ultralytics import YOLO

# Load the official YOLO26 small model
model = YOLO("yolo26s.pt")

# Track objects in a video file (or use '0' for webcam)
# The 'persist=True' argument keeps track IDs consistent between frames
results = model.track(source="traffic_analysis.mp4", show=True, persist=True)

# Print the IDs of objects tracked in the first frame
if results[0].boxes.id is not None:
    print(f"Tracked IDs: {results[0].boxes.id.int().tolist()}")

Les défis du suivi multi-objets

Malgré les progrès réalisés, le MOT reste un domaine difficile. L'occlusion est l'une des principales difficultés : lorsque des objets se croisent ou se cachent derrière des obstacles, il est complexe de maintenir leur identité. Les scènes encombrées, telles que un marathon très fréquenté ou un vol d'oiseaux, testent les limites des algorithmes d'association de données. De plus, le maintien de vitesses d'inférence en temps réel lors du traitement de flux vidéo haute résolution nécessite des architectures de modèles efficaces et souvent du matériel spécialisé, tel que les appareils NVIDIA .

Pour relever ces défis, les chercheurs explorent des approches d'apprentissage profond de bout en bout qui unifient la détection et le suivi dans un réseau unique, et exploitent Ultralytics pour annoter des ensembles de données complexes et former des modèles personnalisés robustes.

Suivi de plusieurs objets (MOT)

Former les modèlesYOLO d'Ultralytics pour rationaliser les flux de travail dans tous les secteurs d'activité

Solution de licence d'entreprise flexible pour dynamiser votre innovation

Former des modèles d'IA en quelques secondes avec Ultralytics YOLO

Comment fonctionne le MOT ?

Distinguer le MOT du suivi d'objet unique

Applications concrètes

Mise en œuvre de MOT avec Python

Les défis du suivi multi-objets

En savoir plus dans cette catégorie

12 cas d'utilisation de l'imagerie aérienne grâce à la vision par ordinateur

Qu'est-ce que l'estimation monoculaire de la profondeur ? Aperçu général

Un aperçu de l'utilisationYOLO Ultralytics pour la détection des menaces par l'IA

Rejoindre la communauté Ultralytics