Object Re-identification (Re-ID)
Apprends comment la ré-identification d'objets (Re-ID) fait correspondre les identités entre les vues de caméras. Découvre comment utiliser Ultralytics YOLO26 et BoT-SORT pour un suivi visuel robuste.
La réidentification d'objets (Re-ID) est une tâche spécialisée en vision par ordinateur (CV) conçue pour faire correspondre un objet ou une personne spécifique à travers différentes vues de caméras non superposées ou sur des périodes prolongées. Alors que la détection d'objets standard se concentre sur la reconnaissance de la classe d'une entité — en identifiant qu'une image contient une "personne" ou une "voiture" — la Re-ID va plus loin en déterminant quelle personne ou voiture spécifique il s'agit en se basant sur l'apparence visuelle. Cette capacité est essentielle pour créer un récit cohérent du mouvement dans des environnements à grande échelle où une seule caméra ne peut pas couvrir toute la zone, reliant ainsi efficacement les points entre des observations visuelles isolées.
Link to this sectionComment fonctionne la réidentification#
Le défi principal de la Re-ID est de maintenir la cohérence de l'identité malgré les variations d'éclairage, d'angles de caméra, de pose et l'encombrement de l'arrière-plan. Pour y parvenir, le système utilise généralement un pipeline multi-étapes impliquant des réseaux de neurones profonds.
- Extraction de caractéristiques : Une fois qu'un objet est détecté, un réseau de neurones convolutifs (CNN) analyse le recadrage de l'image pour générer un vecteur de caractéristiques, communément appelé embedding. Ce vecteur est une représentation numérique dense des traits visuels uniques de l'objet, tels que la texture des vêtements ou la couleur du véhicule.
- Apprentissage métrique : Les modèles sous-jacents sont entraînés à l'aide de techniques d'apprentissage métrique. L'objectif est de s'assurer que les embeddings du même objet sont mathématiquement proches dans l'espace vectoriel, tandis que les embeddings d'objets différents sont poussés loin les uns des autres. Des architectures spécialisées comme les réseaux de neurones siamois sont souvent utilisées pour apprendre ces relations.
- Correspondance par similarité : Lors du déploiement, le système compare l'embedding d'un objet de requête à une galerie d'identités stockées. Cette comparaison implique généralement le calcul de la similarité cosinus ou de la distance euclidienne. Si le score de similarité dépasse un seuil prédéfini, le système confirme une correspondance.
Link to this sectionRe-ID vs suivi d'objets#
Il est important de distinguer la Re-ID du suivi d'objets, car ils jouent des rôles complémentaires mais distincts dans un pipeline de vision.
- Suivi d'objets : Ce processus repose sur la continuité temporelle. Des algorithmes comme le Filtre de Kalman prédisent l'emplacement futur d'un objet dans la toute prochaine image en fonction de sa vitesse et de sa trajectoire actuelles. Il utilise souvent l'Intersection sur Union (IoU) pour associer les détections dans des images adjacentes.
- Réidentification : La Re-ID est cruciale lorsque la continuité temporelle est rompue. Cela se produit lors d'une occlusion — lorsqu'un objet est caché derrière un obstacle — ou lorsqu'un objet quitte le champ de vision d'une caméra et en rejoint une autre. La Re-ID rétablit l'identité en se basant sur l'apparence plutôt que sur l'historique de localisation, permettant un suivi multi-objets (MOT) robuste.
Link to this sectionApplications concrètes#
La capacité à maintenir l'identité à travers des vues disjointes permet des analyses sophistiquées dans diverses industries.
- Gestion du trafic dans les villes intelligentes : Dans le contexte de l'IA dans les villes intelligentes, la Re-ID permet aux systèmes municipaux de suivre un véhicule alors qu'il se déplace à travers un réseau d'intersections à l'échelle de la ville. Cela aide à calculer les temps de trajet moyens et à optimiser la synchronisation des feux de signalisation sans dépendre uniquement de la reconnaissance de plaques d'immatriculation.
- Analyse de la clientèle de détail : Les détaillants utilisent la Re-ID pour comprendre le comportement des acheteurs. En reliant les observations d'un client dans différentes allées, les magasins peuvent générer des cartes de chaleur des parcours populaires. Cela aide à optimiser les aménagements des magasins et les niveaux de personnel, fournissant des informations sur l'ensemble du parcours client plutôt que sur de simples interactions isolées.
Link to this sectionImplémentation du suivi avec les fonctionnalités de Re-ID#
Les flux de travail modernes d'IA en vision combinent souvent des détecteurs haute performance avec des trackers qui utilisent des concepts de Re-ID. Le modèle YOLO26 peut être intégré de manière transparente avec des trackers comme BoT-SORT, qui tire parti des caractéristiques d'apparence pour maintenir la cohérence du suivi. Pour les utilisateurs souhaitant gérer efficacement leurs jeux de données et leurs pipelines d'entraînement, la Plateforme Ultralytics offre une interface unifiée pour l'annotation et le déploiement.
L'exemple suivant démontre comment effectuer un suivi d'objets en utilisant le package Python Ultralytics, qui gère automatiquement la persistance de l'identité :
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Track objects in a video file
# The 'persist=True' argument is vital for maintaining IDs across frames
# BoT-SORT is a tracker that can utilize appearance features for Re-ID
results = model.track(
source="https://www.ultralytics.com/blog/ultralytics-yolov8-for-speed-estimation-in-computer-vision-projects",
tracker="botsort.yaml",
persist=True,
)
# Print the unique ID assigned to the first detected object in the first frame
if results[0].boxes.id is not None:
print(f"Tracked Object ID: {results[0].boxes.id[0].item()}")Pour des performances robustes, l'entraînement de ces modèles nécessite des données d'entraînement de haute qualité. Des techniques comme la perte triplet sont souvent utilisées lors de l'entraînement de sous-modules de Re-ID spécifiques pour affiner le pouvoir discriminant des embeddings. Comprendre les nuances de la précision et du rappel est également crucial lors de l'évaluation de la capacité d'un système de Re-ID à éviter les fausses correspondances.






