Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Ré-identification des objets (Re-ID)

Découvrez comment la réidentification d'objets (Re-ID) fait correspondre les identités entre les différentes vues de caméra. Découvrez comment utiliser Ultralytics et BoT-SORT pour un suivi visuel robuste.

La réidentification d'objets (Re-ID) est une tâche spécialisée en vision par ordinateur (CV) conçue pour faire correspondre un objet ou un individu spécifique entre différentes vues de caméra qui ne se chevauchent pas ou sur des périodes prolongées. Alors que la détection d'objet standard se concentre sur la reconnaissance de la classe d'une entité (identifier qu'une image contient une « personne » ou une « voiture »), la Re-ID va plus loin en déterminant de quelle personne ou voiture spécifique il s'agit en se basant sur l'apparence visuelle. Cette capacité est essentielle pour créer un récit cohérent du mouvement dans des environnements à grande échelle où une seule caméra ne peut pas couvrir toute la zone, reliant efficacement les points entre des observations visuelles isolées.

Comment fonctionne la réidentification

Le principal défi de la Re-ID consiste à maintenir la cohérence de l'identité malgré les variations d'éclairage, d'angle de caméra, de pose et d'encombrement de l'arrière-plan. Pour y parvenir, le système utilise généralement un pipeline en plusieurs étapes impliquant des réseaux neuronaux profonds .

  • Extraction de caractéristiques : une fois qu'un objet est détecté, un réseau neuronal convolutif (CNN) analyse le recadrage de l'image pour générer un vecteur de caractéristiques, communément appelé « embedding ». Ce vecteur est une représentation numérique dense des traits visuels uniques de l'objet, tels que la texture des vêtements ou la couleur du véhicule.
  • Apprentissage métrique : les modèles sous-jacents sont entraînés à l'aide de techniques d'apprentissage métrique. L'objectif est de garantir que les intégrations d'un même objet soient mathématiquement proches les unes des autres dans l'espace vectoriel, tandis que les intégrations d'objets différents soient éloignées les unes des autres. Des architectures spécialisées telles que les réseaux neuronaux siamois sont souvent utilisées pour apprendre ces relations.
  • Correspondance par similarité : lors du déploiement, le système compare l'intégration d'un objet de requête à une galerie d'identités stockées. Cette comparaison implique généralement le calcul de la similarité cosinus ou de la distance euclidienne. Si le score de similarité dépasse un seuil prédéfini, le système confirme la correspondance.

Re-ID vs. Object Tracking

Il est important de distinguer la Re-ID du suivi d'objets, car ils jouent des rôles complémentaires mais distincts dans un pipeline de vision.

  • Suivi d'objet : ce processus repose sur la continuité temporelle. Des algorithmes tels que le filtre de Kalman prédisent la position future d'un objet dans l'image suivante en fonction de sa vitesse et de sa trajectoire actuelles. Il utilise souvent l' intersection sur l'union (IoU) pour associer les détections dans les images adjacentes.
  • Réidentification : la réidentification est cruciale lorsque la continuité temporelle est rompue. Cela se produit lors d'une occlusion, lorsqu'un objet est caché derrière un obstacle, ou lorsqu'un objet quitte le champ de vision d'une caméra et entre dans celui d'une autre. La réidentification rétablit l'identité en se basant sur l'apparence plutôt que sur l'historique de localisation, ce qui permet un suivi multi-objets (MOT) robuste.

Applications concrètes

La capacité à conserver l'identité à travers des vues disjointes permet d'effectuer des analyses sophistiquées dans divers secteurs.

  • Gestion du trafic dans les villes intelligentes : dans le contexte de l' IA dans les villes intelligentes, la technologie Re-ID permet aux systèmes municipaux de track véhicule lorsqu'il se déplace à travers un réseau d'intersections à l'échelle de la ville. Cela aide à calculer les temps de trajet moyens et à optimiser la synchronisation des feux de circulation sans se fier uniquement à la reconnaissance des plaques d'immatriculation.
  • Analyse des clients dans le commerce de détail : les détaillants utilisent la technologie Re-ID pour comprendre le comportement des acheteurs. En reliant les observations d'un client dans différentes allées, les magasins peuvent générer des cartes thermiques des chemins les plus fréquentés. Cela permet d' optimiser l'agencement des magasins et les niveaux de personnel, en fournissant des informations sur l'ensemble du parcours client plutôt que sur des interactions isolées.

Mise en œuvre du suivi avec les fonctionnalités Re-ID

Les flux de travail modernes basés sur l'IA visuelle combinent souvent des détecteurs haute performance avec des trackers qui utilisent des concepts de Re-ID. Le modèle YOLO26 peut être intégré de manière transparente à des trackers tels que BoT-SORT, qui exploite les caractéristiques d'apparence pour maintenir track . Pour les utilisateurs qui souhaitent gérer efficacement leurs ensembles de données et leurs pipelines de formation, Ultralytics offre une interface unifiée pour l'annotation et le déploiement.

L'exemple suivant montre comment effectuer un suivi d'objet à l'aide duPython Ultralytics , qui gère automatiquement la persistance d'identité :

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Track objects in a video file
# The 'persist=True' argument is vital for maintaining IDs across frames
# BoT-SORT is a tracker that can utilize appearance features for Re-ID
results = model.track(
    source="https://www.ultralytics.com/blog/ultralytics-yolov8-for-speed-estimation-in-computer-vision-projects",
    tracker="botsort.yaml",
    persist=True,
)

# Print the unique ID assigned to the first detected object in the first frame
if results[0].boxes.id is not None:
    print(f"Tracked Object ID: {results[0].boxes.id[0].item()}")

Pour obtenir des performances robustes, l'entraînement de ces modèles nécessite des données d'entraînement de haute qualité . Des techniques telles que la perte triplet sont souvent utilisées lors de l'entraînement de sous-modules Re-ID spécifiques afin d'affiner le pouvoir discriminant des intégrations. Il est également essentiel de comprendre les nuances de la précision et du rappel pour évaluer dans quelle mesure un système Re-ID évite les fausses correspondances.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant