En cliquant sur « Accepter tous les cookies », vous acceptez le stockage de cookies sur votre appareil pour améliorer la navigation sur le site, analyser son utilisation et contribuer à nos efforts de marketing. Plus d’infos
Paramètres des cookies
En cliquant sur « Accepter tous les cookies », vous acceptez le stockage de cookies sur votre appareil pour améliorer la navigation sur le site, analyser son utilisation et contribuer à nos efforts de marketing. Plus d’infos
Découvrez comment les modèlesYOLO d'Ultralytics peuvent jouer un rôle dans les solutions de ré-identification des véhicules en fournissant des détections précises et exactes.
Lorsque vous regardez une course de Formule 1, il est facile de repérer la voiture de votre équipe préférée. Le rouge vif de Ferrari ou l'argent de Mercedes se distinguent tour après tour.
Demander à une machine de faire la même chose, non pas sur une piste de course propre, mais dans les rues d'une ville encombrée par la circulation, est beaucoup plus difficile. C'est pourquoi la réidentification des véhicules (vehicle re-ID) a récemment fait l'objet d'une attention particulière dans le domaine de l'IA.
La réidentification des véhicules donne aux machines la capacité de reconnaître le même véhicule à travers des caméras à vues multiples ou non superposées. Elle vise également à identifier les véhicules après une occlusion temporaire (lorsqu'un véhicule est partiellement caché) ou des changements d'éclairage et de point de vue.
La vision par ordinateur est une technologie essentielle à la réidentification des véhicules. La vision par ordinateur est un sous-domaine de l'intelligence artificielle qui vise à enseigner aux machines à comprendre et à interpréter les informations visuelles, telles que les images et les vidéos. Grâce à cette technologie, les systèmes d'intelligence artificielle peuvent analyser les caractéristiques des véhicules et les track manière fiable sur de vastes réseaux de caméras pour des applications telles que la surveillance urbaine et le contrôle du trafic.
En particulier, les modèles Vision AI tels que Ultralytics YOLO11 et le futur Ultralytics YOLO26 prennent en charge des tâches telles que la détection et le suivi d'objets. Ils peuvent rapidement localiser les véhicules dans chaque image et suivre leur mouvement dans une scène. Lorsque ces modèles sont associés à des réseaux de réidentification des véhicules, le système combiné peut reconnaître le même véhicule sur différents flux de caméras, même lorsque les vues ou les conditions d'éclairage changent.
Fig. 1. Exemple d'utilisation de YOLO11 pour le suivi de véhicules et l'estimation de la vitesse(Source)
Dans cet article, nous verrons comment fonctionne la réidentification des véhicules, la technologie qui la rend possible et où elle est utilisée dans les systèmes de transport intelligents. Commençons par le commencement !
Qu'est-ce que la ré-identification des véhicules ?
La réidentification des véhicules est une application importante de la vision par ordinateur. Il s'agit de reconnaître le même véhicule tel qu'il apparaît sur différentes caméras qui ne se chevauchent pas, en conservant son identité au fur et à mesure qu'il se déplace dans la ville. Il s'agit d'un défi car chaque caméra peut capturer le véhicule sous un angle différent, sous un éclairage différent ou avec une occultation partielle.
Prenons le cas d'une berline bleue qui traverse un carrefour et apparaît plus tard dans une autre rue, sous l'œil d'une autre caméra. L'angle, l'éclairage et l'arrière-plan ont tous changé, et d'autres voitures peuvent brièvement bloquer la vue. Malgré cela, le système de réidentification des véhicules doit toujours déterminer qu'il s'agit du même véhicule.
Les récentes avancées en matière d'apprentissage profond, notamment avec les réseaux neuronaux convolutifs (CNN) et les modèles basés sur les transformateurs, ont rendu ce processus beaucoup plus précis. Ces modèles peuvent extraire des modèles visuels significatifs et distinguer les véhicules qui se ressemblent tout en identifiant le bon.
Dans les systèmes de transport intelligents, cette capacité permet la surveillance continue, la reconstitution des itinéraires et l'analyse du trafic à l'échelle de la ville, ce qui donne aux systèmes urbains intelligents une image plus claire de la façon dont les véhicules se déplacent. Ils contribuent à améliorer la sécurité et l'efficacité.
Comprendre le fonctionnement de la ré-identification des véhicules
En règle générale, les séquences vidéo des carrefours, des parkings et des autoroutes sont analysées à l'aide de techniques de réidentification des véhicules afin de déterminer si le même véhicule apparaît sur différentes caméras. Ce concept est similaire à celui de la réidentification des personnes, où les systèmes track individus sur plusieurs vues, mais ici l'accent est mis sur l'analyse des caractéristiques spécifiques au véhicule plutôt que sur l'apparence humaine.
Le processus comprend plusieurs étapes clés, chacune conçue pour aider le système à detect véhicules, à extraire leurs caractéristiques visuelles et à les faire correspondre de manière fiable entre différents points de vue.
À un niveau élevé, le système détecte d'abord les véhicules dans chaque image, puis extrait des caractéristiques telles que la couleur, la forme et la texture afin de créer une représentation numérique unique, ou embeddding, pour chacun d'entre eux. Ces représentations sont comparées dans le temps et entre les caméras, souvent à l'aide d'un suivi d'objet et de vérifications spatio-temporelles, afin de déterminer si deux observations appartiennent au même véhicule.
Fig. 2. Comment fonctionne la réidentification des véhicules.(Source)
Voici un aperçu de ce processus :
Détection d'objets: Le système commence par identifier et localiser les véhicules dans chaque image vidéo, afin de savoir exactement quelles régions traiter. Cette étape est généralement gérée par des modèles de détection d'objets.
Extraction des caractéristiques: Après la détection, un réseau dédié de ré-identification ou d'extraction de caractéristiques analyse chaque récolte du véhicule et génère des cartes de caractéristiques ou des représentations de caractéristiques qui capturent les détails visuels tels que la couleur, la forme, la texture et les parties distinctives.
Génération de l'intégration : Les caractéristiques extraites sont transformées en une représentation numérique appelée "embedding". Cette représentation agit comme une empreinte digitale numérique qui capture l'apparence du véhicule sous différents angles. Avant la mise en correspondance, ces incorporations sont généralement normalisées afin que les différences causées par l'éclairage, le contraste ou les réglages de l'appareil photo n'interfèrent pas avec la comparaison des identités. La normalisation garantit que le système se concentre sur les caractéristiques significatives liées à l'identité plutôt que sur le bruit.
Suivi d'objets : Dans une vue de caméra unique, les algorithmes de suivi relient les détections entre les images, ce qui permet de maintenir une identité cohérente lorsque le véhicule se déplace dans la scène.
Correspondance entre caméras : pour faire correspondre le même véhicule entre différentes caméras, le système compare les enregistrements (générés par le réseau Re-ID) avec les informations de temps et d'emplacement. Cette étape permet de déterminer si deux observations appartiennent au même véhicule, même si les caméras ne se chevauchent pas.
Comment les modèlesYOLO d'Ultralytics peuvent aider à la ré-identification des véhicules
Les modèlesYOLO 'Ultralytics jouent un rôle important dans les processus de ré-identification des véhicules. Bien qu'ils n'effectuent pas de ré-identification à eux seuls, ils fournissent d'autres capacités essentielles, telles que la détection rapide et le suivi stable, dont dépendent les réseaux de ré-identification pour une mise en correspondance précise entre les caméras.
Voyons maintenant comment les modèlesYOLO d'Ultralytics , comme YOLO11 , peuvent améliorer les systèmes de ré-identification des véhicules.
Un module de détection de véhicules précis : La première partie des systèmes Re-ID
La base de tout système de réidentification de véhicules est une détection précise des objets. Les modèlesYOLO d'Ultralytics , tels que YOLO11 , constituent une excellente option à cet égard, car ils peuvent detect rapidement detect véhicules dans chaque image, même dans des scènes très fréquentées avec des occultations partielles, une circulation dense ou des conditions d'éclairage changeantes.
Ils peuvent également être formés sur mesure, ce qui signifie que vous pouvez affiner le modèle sur votre propre ensemble de données afin qu'il apprenne à reconnaître des types de véhicules spécifiques, tels que les taxis, les camionnettes de livraison ou les véhicules de flotte. Cette fonction est particulièrement utile lorsqu'une solution nécessite une détection plus spécialisée. En fournissant des zones de délimitation nettes et précises, les modèlesYOLO d'Ultralytics permettent aux réseaux Re-ID de travailler avec des entrées de haute qualité, ce qui conduit à une correspondance plus fiable entre les caméras.
Prise en charge d'un suivi fiable d'une seule caméra
Une fois les véhicules détectés, les modèles tels que YOLO11 peuvent également prendre en charge le suivi d'objets stables dans une vue de caméra unique. Le suivi d'objet consiste à suivre un véhicule détecté sur plusieurs images consécutives et à lui attribuer un identifiant cohérent au fur et à mesure qu'il se déplace.
Grâce à la prise en charge intégrée d'algorithmes de suivi tels que ByteTrack et BoT-SORT dans le packagePython Ultralytics , YOLO11 peut maintenir des identifications cohérentes lorsque les véhicules se déplacent dans une scène. Ce suivi stable réduit les changements d'identité avant que le système Re-ID ne prenne le relais, ce qui améliore en fin de compte la précision de la correspondance entre les caméras.
Re-ID optionnel au niveau du traqueur pour une meilleure stabilité de l'identité
En plus du suivi standard basé sur le mouvement, l'ensemble Ultralytics Python inclut des capacités optionnelles de ré-identification basées sur l'apparence au sein de son tracker BoT-SORT. Cela signifie que le tracker peut utiliser les caractéristiques de l'apparence visuelle, et pas seulement les modèles de mouvement ou le chevauchement de la boîte de délimitation, pour déterminer si deux détections appartiennent au même véhicule.
Lorsque cette option est activée, BoT-SORT extrait du détecteur ou d'un modèle de classification YOLO11 des incrustations d'apparence légères qu'il utilise pour vérifier l'identité entre les images. Ce repère d'apparence supplémentaire aide le suiveur à maintenir des identifications plus stables dans des situations difficiles, telles que de brèves occlusions, des véhicules passant à proximité les uns des autres ou de petits changements causés par le mouvement de la caméra.
Bien que cette Re-ID intégrée ne soit pas destinée à remplacer la ré-identification complète du véhicule à travers la caméra, elle améliore la cohérence de l'identité au sein d'une seule vue de caméra et produit des tracklets plus propres sur lesquels les modules Re-ID en aval peuvent s'appuyer. Pour utiliser ces fonctionnalités de suivi basées sur l'apparence, il suffit d'activer la Re-ID dans un fichier de configuration du tracker BoT-SORT en définissant "with_reid" sur "True" et en sélectionnant le modèle qui fournira les fonctionnalités d'apparence.
Fournir des données de haute qualité aux réseaux Re-ID
Au-delà de l'amélioration de la stabilité de l'identité pendant le suivi, les modèles YOLO jouent également un rôle important dans la préparation d'entrées visuelles propres pour le réseau Re-ID lui-même.
Après la détection d'un véhicule, sa zone de délimitation est généralement recadrée et envoyée à un réseau de réidentification, qui extrait les caractéristiques visuelles nécessaires à la mise en correspondance. Étant donné que les modèles de réidentification s'appuient fortement sur ces images recadrées, des données d'entrée de mauvaise qualité, telles que des images floues, mal alignées ou incomplètes, peuvent entraîner des incrustations plus faibles et une mise en correspondance moins fiable entre les caméras.
Les modèlesYOLO 'Ultralytics permettent de réduire ces problèmes en produisant systématiquement des boîtes de délimitation propres et bien alignées qui capturent entièrement le véhicule en question. Avec des images plus claires et plus précises, le réseau Re-ID peut se concentrer sur des détails significatifs tels que la couleur, la forme, la texture et d'autres caractéristiques distinctives. Des données d'entrée de haute qualité permettent d'obtenir des performances de Re-ID plus fiables et plus précises sur l'ensemble des vues de la caméra.
Permettre la correspondance entre les caméras lorsqu'elle est associée à un modèle Re-ID
Bien que les modèlesYOLO Ultralytics n'effectuent pas de ré-identification en eux-mêmes, ils fournissent les informations essentielles dont un réseau de ré-identification a besoin pour comparer les véhicules à travers différentes vues de caméras. Les modèles tels que YOLO11 peuvent se charger de la localisation et du suivi des véhicules dans chaque caméra, tandis que le modèle Re-ID détermine si deux cultures de véhicules provenant d'endroits différents appartiennent à la même identité.
Lorsque ces composants fonctionnent ensemble, YOLO pour la détection et le suivi, et un modèle d'intégration dédié pour l'extraction des caractéristiques, ils forment un pipeline complet de mise en correspondance de véhicules multi-caméras. Il est ainsi possible d'associer le même véhicule lorsqu'il se déplace dans un réseau de caméras plus vaste.
Par exemple, dans une étude récente, des chercheurs ont utilisé un modèle léger YOLO11 comme détecteur de véhicules dans un système de suivi multi-caméras en ligne. L'étude a montré que l'utilisation de YOLO11 permettait de réduire le temps de détection sans sacrifier la précision, ce qui améliorait les performances globales du suivi en aval et de la correspondance entre les caméras.
Fig. 3. Suivi et ré-identification de plusieurs véhicules à YOLO11 sur plusieurs caméras.(Source)
Architectures basées sur l'apprentissage profond pour la ré-identification des véhicules
Maintenant que nous comprenons mieux comment les modèlesYOLO d'Ultralytics peuvent aider à la ré-identification des véhicules, examinons de plus près les modèles d'apprentissage profond qui gèrent les étapes d'extraction et de mise en correspondance des caractéristiques. Ces modèles sont responsables de l'apprentissage de l'apparence des véhicules, de la création d'encastrements robustes et de la distinction entre des véhicules visuellement similaires dans différentes vues de caméra.
Voici quelques exemples de composants d'apprentissage profond utilisés dans les systèmes de réidentification d'objets :
Extraction de caractéristiques avec les CNN : Les réseaux de neurones à convolution tels que ResNet50 ou ResNet101 apprennent des caractéristiques profondes par le biais de la reconnaissance des formes, en identifiant des éléments tels que la couleur, la forme et la texture qui différencient un véhicule d'un autre. Ces modèles appris sont ensuite convertis en enregistrements qui constituent la représentation numérique unique du véhicule.
Mécanismes d'attention et les transformateurs : Les réseaux et couches d'attention, y compris l'attention spatiale, peuvent aider à mettre en évidence les régions importantes d'un véhicule, telles que les phares, les fenêtres ou les zones de la plaque d'immatriculation. L'attention spatiale concentre le modèle sur l'emplacement des indices visuels les plus informatifs, tandis que les modèles basés sur les transformateurs, tels que Vision Transformers (ViT), capturent les relations globales sur l'ensemble de l'image. Ensemble, ils améliorent la précision de l'image lorsque les véhicules se ressemblent beaucoup.
Réseaux basés sur les pièces et réseaux multibranches : Certains modèles Re-ID analysent séparément des zones spécifiques du véhicule, telles que le toit, les feux arrière ou les panneaux latéraux, puis combinent les résultats. Cela signifie que le système reste robuste même lorsque les véhicules sont partiellement occultés ou vus sous des angles difficiles.
Outre ces composants architecturaux, l'apprentissage métrique joue un rôle clé dans la formation des modèles de ré-identification des véhicules. Les fonctions de perte telles que la perte de triplet, la perte de contraste et la perte d'entropie croisée permettent au système d'apprendre à intégrer des images fortes et discriminantes en rapprochant les images d'un même véhicule et en séparant les images de véhicules différents.
Ensembles de données de ré-identification de véhicules populaires et points de référence
Dans le domaine de la recherche en vision artificielle, la qualité d'un ensemble de données a un impact majeur sur les performances d'un modèle une fois déployé. Un ensemble de données fournit les images ou vidéos étiquetées à partir desquelles un modèle apprend.
Pour la réidentification des véhicules, ces ensembles de données de pointe doivent tenir compte de diverses conditions telles que l'éclairage, les changements de point de vue et les variations météorologiques. Cette diversité aide les modèles à gérer la complexité des environnements de transport réels.
Voici un aperçu des ensembles de données les plus utilisés pour la formation, l'optimisation et l'évaluation des modèles de réidentification des véhicules :
Jeu de données VeRi-776: Il s'agit d'une collection de plus de 50 000 images annotées de véhicules capturées par 20 caméras urbaines. Les annotations comprennent l'ID du véhicule, la couleur, le modèle et les régions de la plaque d'immatriculation, ce qui permet un apprentissage détaillé des caractéristiques.
Ensemble de données VehicleID : Cet ensemble de données à grande échelle contient plus de 200 000 images représentant plus de 26 000 véhicules. Il est souvent choisi pour étudier l'extensibilité et pour effectuer des comparaisons de base entre différentes méthodes.
L'ensemble de données VeRi-Wild : Il est conçu pour refléter la variabilité du monde réel, y compris les différences de point de vue, les conditions météorologiques et l'occlusion partielle. Il est couramment utilisé pour évaluer la robustesse et la généralisation des modèles.
Fig. 4. Exemple de véhicules dans l'ensemble de données VeRi-776.(Source)
Les performances des modèles sur ces ensembles de données sont généralement évaluées à l'aide de mesures telles que la précision moyennemAP et l'exactitude des rangs 1 et 5. mAP mesure la précision avec laquelle le modèle récupère toutes les correspondances pertinentes pour un véhicule donné, tandis que les scores des rangs 1 et 5 indiquent si la correspondance correcte apparaît en tête de la liste des résultats ou parmi les premières prédictions.
Ensemble, ces critères offrent aux chercheurs un moyen cohérent de comparer différentes approches et jouent un rôle important dans l'orientation du développement de systèmes de réidentification des véhicules plus précis et plus fiables pour une utilisation dans le monde réel.
Applications de la réidentification des véhicules
Maintenant que nous avons abordé les principes de base, examinons quelques cas d'utilisation réels où la réidentification des véhicules prend en charge des flux de travail pratiques dans les domaines du transport, de la mobilité et de la surveillance.
Surveillance et contrôle du trafic urbain
Les routes urbaines très fréquentées sont constamment remplies de mouvements, et les caméras de circulation ont souvent du mal à track le même véhicule lorsqu'il passe d'une zone à l'autre. Les changements d'éclairage, les scènes encombrées et les véhicules qui semblent presque identiques peuvent entraîner la perte d'identité d'une caméra à l'autre.
La ré-identification des véhicules permet de résoudre ce problème en détectant clairement les véhicules, en extrayant leurs caractéristiques distinctives et en conservant des identifications cohérentes, même dans les séquences à faible résolution ou très chargées. Il en résulte un suivi plus fluide et continu sur l'ensemble du réseau, ce qui permet aux équipes chargées de la circulation d'avoir une idée plus précise de la façon dont les véhicules se déplacent dans la ville et d'apporter des réponses plus rapides et mieux informées en cas d'embouteillages ou d'incidents.
Systèmes de stationnement intelligents
Les parkings intelligents s'appuient sur une identification cohérente des véhicules pour gérer les entrées, les sorties, le contrôle d'accès et l'attribution des places. Cependant, dans ces environnements, les caméras capturent souvent les véhicules sous des angles inhabituels et dans des conditions d'éclairage difficiles, comme dans les garages souterrains, les zones ombragées ou les terrains extérieurs à la tombée de la nuit.
Dans ces conditions, il est plus difficile de confirmer si le même véhicule est vu dans différentes zones. Lorsque les identités sont incohérentes, les registres de stationnement peuvent être interrompus, le contrôle d'accès devient moins fiable et les conducteurs peuvent subir des retards. C'est pourquoi de nombreux systèmes de stationnement intelligents intègrent des modèles de réidentification des véhicules afin de maintenir une identité stable pour chaque véhicule lorsqu'il se déplace dans l'installation.
Fig. 5. Exemple de ré-identification d'un véhicule montrant l'image du véhicule sélectionné à gauche et les résultats de recherche correspondants à droite.(Source)
Application de la loi et criminalistique
Outre la surveillance du trafic, la réidentification des véhicules joue également un rôle important dans l'application de la loi et les enquêtes médico-légales. Dans de nombreux cas, les agents doivent suivre un véhicule à l'aide de plusieurs caméras, mais les plaques d'immatriculation peuvent être illisibles, manquantes ou délibérément masquées.
Les scènes encombrées, la faible visibilité et l'occultation partielle peuvent donner à différents véhicules une apparence trompeuse, rendant l'identification manuelle lente et peu fiable. La ré-identification des véhicules peut être utilisée pour retracer le mouvement d'un véhicule à travers des réseaux de caméras qui ne se chevauchent pas, en analysant ses caractéristiques visuelles plutôt que de dépendre uniquement des plaques d'immatriculation.
Cela signifie que les enquêteurs peuvent plus facilement suivre les mouvements d'un véhicule, comprendre quand il est apparu à différents endroits et confirmer sa trajectoire avant et après un incident. La ré-identification des véhicules par l'IA permet également de suivre les véhicules suspects, d'examiner les images de l'incident ou de déterminer la direction empruntée par un véhicule avant ou après un événement.
Fig. 6. Véhicules appariés sur différentes caméras avec des perspectives variées.(Source)
Suivi de la flotte et de la logistique
Les opérations de flotte et de logistique s'appuient souvent sur le GPS, les étiquettes RFID et les registres manuels pour track mouvements des véhicules, mais ces outils présentent des lacunes dans les zones couvertes par les caméras de sécurité ou les caméras de chantier, telles que les quais de chargement, les cours d'entrepôt et les réseaux routiers internes.
Les véhicules se déplacent souvent entre des caméras qui ne se chevauchent pas, disparaissent derrière des structures ou sont presque identiques à d'autres véhicules de la flotte, ce qui rend difficile de confirmer si le même véhicule a été vu à différents endroits. Les systèmes de réidentification des véhicules peuvent aider à combler ces lacunes en analysant les détails visuels et les informations temporelles afin de maintenir une identité cohérente pour chaque véhicule lorsqu'il se déplace dans l'installation.
Les gestionnaires de flotte disposent ainsi d'une vue plus complète de l'activité au sein de leurs hubs, ce qui leur permet de vérifier les itinéraires de livraison, d'identifier les mouvements inhabituels et de s'assurer que les véhicules suivent les itinéraires prévus.
Avantages et inconvénients des tâches de réidentification des véhicules
Voici quelques-uns des principaux avantages de la réidentification des véhicules par l'IA :
Réduction de la charge de travail manuel : Le système de ré-identification des véhicules automatise les tâches de comparaison d'identité qui nécessiteraient autrement un examen manuel approfondi, ce qui réduit considérablement le temps et les efforts nécessaires à l'analyse des séquences vidéo.
Automatisation et informations en temps réel : En combinant la détection, le suivi et la correspondance des caractéristiques, la ré-identification des véhicules permet une surveillance automatisée continue et peut fournir des alertes en temps réel pour une réponse plus rapide aux incidents.
Évolutivité et adaptabilité : Les modèles de réidentification peuvent s'adapter à de nouveaux environnements, à de nouvelles conditions d'éclairage ou à de nouveaux angles de caméra grâce à un apprentissage robuste des caractéristiques, à l'extraction de caractéristiques à plusieurs échelles et à des représentations invariantes qui restent stables en cas de changements visuels. Ces capacités les rendent adaptés à la fois aux réseaux des grandes villes et aux déploiements plus modestes.
Si la réidentification des véhicules présente de nombreux avantages, il faut également tenir compte de certaines limites. Voici quelques facteurs qui affectent sa fiabilité dans des environnements réels :
Forte demande de calcul : L'extraction de caractéristiques, la génération d'incrustations et la comparaison entre caméras nécessitent une puissance de traitement importante, en particulier lors de la surveillance de vastes réseaux de caméras.
Variabilité environnementale : Des facteurs tels que l'éclairage nocturne, les changements météorologiques, les ombres et les occlusions peuvent réduire la capacité du modèle à maintenir des identités cohérentes d'une scène à l'autre.
Limites de l'ensemble de données et du domaine : Les modèles formés sur des ensembles de données limités ou idéalisés peuvent ne pas bien s'adapter aux conditions du monde réel sans un réglage plus fin ou une adaptation au domaine.
La voie à suivre pour les méthodes de réidentification des véhicules
La réidentification des véhicules continue de progresser au fur et à mesure que la technologie évolue. Des publications récentes de l'IEEE, de CVPR et d'arXiv, ainsi que des présentations lors de conférences internationales, mettent en évidence une nette évolution vers des modèles plus riches qui combinent plusieurs sources de données et un raisonnement plus avancé sur les caractéristiques. Les travaux futurs dans ce domaine se concentreront probablement sur la construction de systèmes plus robustes, plus efficaces et capables de gérer la variabilité du monde réel à grande échelle.
Par exemple, l'utilisation de modèles basés sur des transformateurs et de réseaux d'agrégation de graphes est une voie prometteuse. Les transformateurs peuvent analyser l'ensemble d'une image et comprendre comment tous les détails visuels s'intègrent, ce qui aide le système à reconnaître le même véhicule même lorsque l'angle ou l'éclairage change.
Les modèles basés sur les graphes vont plus loin en traitant les différentes parties du véhicule ou les vues de la caméra comme des points connectés dans un réseau. Cela permet au système de comprendre la corrélation entre ces points clés et de prendre de meilleures décisions concernant l'identité des véhicules et les caractéristiques discriminantes.
La fusion de données multimodales et la fusion de caractéristiques constituent une autre avancée majeure. Au lieu de s'appuyer uniquement sur les images, les systèmes les plus récents combinent les informations visuelles avec d'autres signaux multimédias, tels que les données GPS ou les modèles de mouvement provenant des capteurs. Ce contexte supplémentaire permet au système de rester précis lorsque les véhicules sont partiellement bloqués, lorsque l'éclairage est faible ou lorsque l'angle de la caméra change soudainement.
Principaux points à retenir
La réidentification des véhicules devient une méthodologie clé dans les systèmes de transport intelligents, aidant les villes à track véhicules de manière plus fiable à travers différentes caméras. Grâce aux progrès de l'apprentissage profond et à une meilleure validation à l'aide d'ensembles de données plus riches et plus diversifiés, ces systèmes deviennent plus précis et plus pratiques dans des conditions réelles.
À mesure que la technologie évolue, il est important d'équilibrer l'innovation avec des pratiques responsables en matière de protection de la vie privée, de sécurité et d'éthique. Dans l'ensemble, ces progrès ouvrent la voie à des réseaux de transport plus intelligents, plus sûrs et plus efficaces.