Le suivi d'objets est une tâche fondamentale de la vision par ordinateur (VA) qui consiste à identifier et à suivre des objets spécifiques qui se déplacent dans une séquence d'images vidéo ou de flux de caméra. Contrairement à la détection d'objets, qui se concentre sur la localisation d'objets dans des images statiques individuelles ou des images vidéo uniques, le suivi d'objets maintient l'identité et la trajectoire de ces objets au fil du temps. Cette surveillance continue permet aux systèmes de comprendre le mouvement, le comportement et les interactions des objets dans des environnements dynamiques, offrant ainsi des informations plus riches que la seule détection. Il s'agit d'un composant essentiel dans de nombreuses applications d'intelligence artificielle.
Différences essentielles par rapport aux concepts apparentés
Il est important de distinguer le suivi d'objet des autres tâches de vision par ordinateur:
- Détection d'objets: Identifie et localise les objets (généralement avec des boîtes de délimitation) au sein d'une seule image ou d'un seul cadre. Elle répond à la question "Quels objets se trouvent à quel endroit dans cette image ?" Le suivi d'objet s'appuie sur la détection en ajoutant la dimension temporelle, en répondant à "Où cet objet spécifique s'est-il déplacé dans le temps ?"
- Classification d'images: Attribue une seule étiquette à une image entière (par exemple, " contient un chat "). Elle ne localise pas les objets et ne les suit pas.
- Segmentation d'image: Attribue une étiquette de classe à chaque pixel d'une image. Alors que la segmentation d'instance distingue différentes instances d'objets, la segmentation standard ne suit pas ces instances d'une image à l'autre. La combinaison de la segmentation d'instance et du suivi(segmentation d'instance et suivi) est une tâche connexe mais plus complexe qui fournit des masques au niveau des pixels pour les objets suivis.
Applications dans le monde réel
Le suivi des objets, et plus particulièrement le suivi d'objets multiples (MOT), est crucial pour de nombreuses applications d'intelligence artificielle dans le monde réel :
- Véhicules autonomes: Essentiel pour suivre les piétons, les cyclistes et les autres véhicules afin de prédire leurs mouvements, ce qui permet une navigation sûre et d'éviter les collisions. Cette capacité est fondamentale pour atteindre des niveaux plus élevés d 'automatisation de la conduite et alimente de nombreuses solutions d'IA dans les voitures autonomes.
- Vidéosurveillance et sécurité : Surveiller les personnes ou les véhicules dans les zones sensibles, détecter les comportements inhabituels et activer des alertes automatisées. Les exemples incluent la construction d'un système d'alarme de sécurité ou l'utilisation de caméras de sécurité IA pour la protection du périmètre.
- Analytique du commerce de détail: Suivre les parcours des clients dans les magasins pour optimiser l'agencement, analyser les temps de séjour, effectuer une gestion automatisée des files d'attente et comprendre les habitudes d'achat pour améliorer l'expérience des clients dans l'IA dans le commerce de détail.
- Analyses sportives: Suivre les joueurs et le ballon pendant les matchs fournit des données précieuses pour l'analyse des performances, la planification tactique et la génération de temps forts automatisés. En savoir plus sur la vision par ordinateur dans les sports.
- Robotique: Permettre aux robots de suivre et d'interagir avec des objets ou des personnes dans des environnements dynamiques, ce qui est crucial pour des tâches telles que la fabrication collaborative ou la navigation autonome dans les entrepôts.
- Surveillance de la faune : Suivi non invasif des animaux pour étudier le comportement, les schémas de migration et la taille des populations, afin de contribuer aux efforts de conservation. Les modèles Ultralytics tels que YOLOv8 ont été utilisés pour la surveillance des animaux.
- Gestion du trafic : Surveillance du flux de véhicules, comptage des véhicules dans des régions spécifiques(Region Counting), et détection des incidents pour une infrastructure urbaine plus intelligente(AI in traffic management).
Outils et mise en oeuvre
La mise en œuvre du suivi d'objets implique souvent de combiner des modèles de détection d'objets avec des algorithmes de suivi. Les bibliothèques populaires comme OpenCV fournissent des fonctionnalités de suivi de base. Des structures telles que PyTorch et TensorFlow sont utilisés pour construire et former les modèles de détection sous-jacents. Ultralytics simplifie ce processus en intégrant des capacités de suivi directement dans ses modèles comme. YOLO11. Les utilisateurs peuvent facilement activer le suivi en utilisant le mode de suivi dédié. Pour gérer l'ensemble du flux de travail, de l'annotation des données au déploiement, des plateformes comme Ultralytics HUB proposent des outils complets. Tu peux suivre des guides comme celui sur le suivi des objets deYOLO11 pour commencer.
Comment fonctionne le suivi d'objet
Le suivi d'objets commence généralement par la détection d'objets dans l'image initiale à l'aide d'un détecteur d'objets, tel qu'un détecteur d'objets. Ultralytics YOLO d'Ultralytics. Une fois qu'un objet est détecté, souvent représenté par une boîte englobante, l'algorithme de suivi lui attribue un identifiant unique. Dans les images suivantes, l'algorithme prédit le nouvel emplacement de l'objet en fonction de son état précédent, qui peut inclure la position, la vitesse et les caractéristiques d'apparence. Cette prédiction fait souvent appel à des techniques telles que l'estimation du mouvement. Le système associe ensuite les objets nouvellement détectés dans l'image en cours aux objets suivis existants, en mettant à jour leurs trajectoires et en conservant leurs identifiants uniques.
Ce processus doit gérer plusieurs défis, notamment les objets qui deviennent temporairement cachés (occlusion), les changements d'apparence des objets, les interactions complexes entre plusieurs objets et les variations de l'éclairage ou du point de vue de la caméra. Les techniques courantes utilisées pour y remédier comprennent des méthodes de filtrage comme le filtre de Kalman (KF) pour la prédiction et l'association des mouvements, et des approches d'apprentissage profond (DL) plus avancées comme SORT (Simple Online and Realtime Tracking) et DeepSORT, qui combinent les caractéristiques de mouvement et d'apparence pour un suivi plus robuste. Les modèles Ultralytics prennent en charge divers trackers disponibles pour la mise en œuvre de ces techniques. Une gestion efficace des occlusions est cruciale pour maintenir la continuité de la piste.