Ré-identification des objets (Re-ID)
Discover object Re-ID : faites correspondre des personnes ou des véhicules à travers des caméras qui ne se chevauchent pas avec des incrustations d'apparence afin d'améliorer la surveillance, l'analyse du commerce de détail et la criminalistique.
La ré-identification d'objets (Re-ID) est une technique sophistiquée de
technique sophistiquée de vision par ordinateur (VA)
reconnaître et associer un objet ou un individu spécifique dans des vues de caméras qui ne se chevauchent pas ou dans des intervalles de temps distincts.
intervalles de temps distincts. Contrairement à la détection standard, qui se contente de classer un objet, la ré-identification vise à déterminer si un objet détecté à un endroit donné est le même que celui qui a été détecté à un autre endroit.
objet détecté à un endroit donné est de la même identité qu'un objet vu précédemment à un autre endroit. Cette capacité
Cette capacité est essentielle pour créer une compréhension cohérente des mouvements et des comportements dans les environnements à grande échelle, tels que les aéroports, les centres commerciaux et les systèmes intelligents.
aéroports, les centres commerciaux et les villes intelligentes, où une seule caméra ne peut pas couvrir toute la zone.
Les mécanismes de la ré-identification
Le principal défi de la réidentification est de faire correspondre les identités malgré les variations d'éclairage, de pose, de point de vue et d'occlusion. Pour ce faire, le système crée une signature numérique unique pour chaque objet détecté.
Pour y parvenir, le système crée une signature numérique unique pour chaque objet détecté.
-
Extraction de caractéristiques: Lorsqu'un objet est identifié dans une
boîte englobante, un modèle d'apprentissage
modèle d'apprentissage profond (DL) traite le patch d'image
l'image pour générer un vecteur à haute dimension connu sous le nom de
embedding. Ce vecteur encapsule des caractéristiques visuelles distinctes, telles que les couleurs des vêtements d'une personne ou la marque d'un produit.
caractéristiques visuelles distinctes, telles que les couleurs des vêtements d'une personne ou les détails de la marque et du modèle d'un véhicule.
-
Apprentissage des mesures: Pour garantir la précision, ces modèles utilisent
techniques d'apprentissage métrique. La formation implique souvent
réseaux neuronaux siamois ou l'utilisation d'une
fonction de perte triplet, qui apprend au réseau à
minimiser la distance entre les enregistrements de la même identité tout en maximisant la distance entre les différentes identités.
identités différentes.
-
Correspondance avec la galerie: pendant l'inférence, le système compare l'intégration d'un objet nouvellement détecté (la "requête") à une "galerie" d'intégrations stockées provenant de détections précédentes.
(la "requête") à une "galerie" d'encastrements stockés provenant de détections antérieures. Les algorithmes classent
ces comparaisons par similarité, en utilisant souvent la
la similarité en cosinus ou la distance euclidienne pour trouver la
meilleure correspondance.
Re-ID vs. Object Tracking
Bien qu'elles soient souvent utilisées ensemble, la réidentification d'objets et le suivi d'objets ont des objectifs distincts dans la vidéo.
suivi d'objet ont des objectifs distincts dans un
vidéo.
-
Suivi d'objet: Ce processus permet de conserver l'identité d'un objet image par image dans un flux vidéo continu.
flux vidéo unique et continu. Il s'appuie fortement sur la continuité temporelle et les algorithmes de prédiction de mouvement
comme le filtre de Kalman. Si un objet quitte l'image
ou est occulté pendant une longue période, la track est généralement perdue ou un nouvel identifiant lui est attribué à son retour.
-
Ré-identification des objets: La ré-identification résout le problème des "traces perdues" en réassociant une identité entre des vues discontinues.
en réassociant une identité à des vues discontinues. Elle relie les points entre les différentes caméras dans un système de suivi multi-objets (MOT).
système de suivi d'objets multiples (MOT),
permettant la reconstruction d'une trajectoire complète à travers un réseau distribué.
Applications concrètes
La technologie Re-ID est une pierre angulaire de l'analyse moderne, qui permet d'obtenir des informations exploitables dans divers secteurs d'activité.
-
Commerce de détail intelligent: Dans les
dans les environnements de vente au détail alimentés par l'IA, Re-ID aide
les détaillants à cartographier les parcours des clients dans un magasin. En comprenant les sections qu'un client visite et en le ré-identifiant lorsqu'il se déplace d'un étage à l'autre, les
et en les réidentifiant lorsqu'ils se déplacent d'un étage à l'autre, les entreprises peuvent optimiser l'agencement du magasin et l'emplacement des produits sans avoir besoin de collecter des données biométriques.
sans avoir à collecter de données biométriques.
-
Surveillance des villes intelligentes: Pour la
la sécurité urbaine,
Re-ID permet aux opérateurs de rechercher une personne d'intérêt, comme un enfant disparu ou un suspect, dans un réseau de caméras à l'échelle de la ville.
réseau de caméras à l'échelle d'une ville. Cela permet de réduire considérablement le temps nécessaire à l'examen judiciaire des vidéos, un processus soutenu par des ensembles de données de recherche comme Market-1501.
des ensembles de données de recherche tels que Market-1501.
Mise en œuvre de la ré-ID avec Ultralytics YOLO
Les cadres modernes de détection d'objets intègrent souvent des algorithmes de suivi qui utilisent des caractéristiques d'apparence similaires à la
Re-ID pour maintenir les identités pendant les occlusions. Les
YOLO11 peut être facilement associé à des algorithmes de suivi avancés
comme BoT-SORT, qui incorpore des fonctions Re-ID pour un suivi robuste.
L'exemple suivant montre comment lancer le suivi d'une source vidéo à l'aide de l'interface Python .
from ultralytics import YOLO
# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")
# Run tracking on a video file using the BoT-SORT tracker
# BoT-SORT utilizes Re-ID features to improve tracking robustness
results = model.track(source="path/to/video.mp4", tracker="botsort.yaml", show=True)
# Access the unique tracking IDs assigned to detected objects
for r in results:
if r.boxes.id is not None:
print(f"Track IDs: {r.boxes.id.cpu().numpy()}")
Autres lectures et ressources
Pour approfondir votre compréhension des technologies sous-jacentes, explorez des concepts tels que
l'extraction de caractéristiques et l'architecture d'un
réseau neuronal (NN). Des cadres tels que
PyTorch et
TensorFlow fournissent les outils nécessaires pour construire et
pour construire et former des modèles Re-ID personnalisés. Pour ceux qui s'intéressent au domaine plus large de la surveillance intelligente, l'examen de la compréhension de la vidéo peut fournir des informations supplémentaires.
vidéo peut fournir un contexte supplémentaire sur la
contexte supplémentaire sur la façon dont les machines interprètent les données visuelles temporelles.