En cliquant sur "Accepter tous les cookies", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de nous aider dans nos efforts de marketing. Plus d'informations
Paramètres des cookies
En cliquant sur "Accepter tous les cookies", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de nous aider dans nos efforts de marketing. Plus d'informations
Découvrez comment le calcul de la distance dans les applications de vision par ordinateur à l'aide d'Ultralytics YOLO11 permet de mesurer la proximité des objets en temps réel.
Lorsque vous traversez la route et que vous voyez une voiture arriver vers vous, vous pouvez instantanément déterminer la distance à laquelle elle se trouve. Ce jugement rapide, presque instinctif, est dû à une compréhension spatiale de votre environnement. Sur la base de cette perception, vous pouvez décider d'accélérer, de vous arrêter ou de continuer à marcher.
De même, la vision par ordinateur est une branche de l'intelligence artificielle (IA) qui permet aux machines de comprendre leur environnement en interprétant des données visuelles. Tout comme vous pouvez évaluer la proximité d'une voiture pour prendre des décisions rapides, les modèles de vision par ordinateur peuvent analyser des images et des vidéos, aidant ainsi les machines à percevoir le monde qui les entoure et à y réagir.
Par exemple, Ultralytics YOLO11 est un modèle de vision par ordinateur qui peut détecter et suivre des objets dans des images et des vidéos en temps réel. En termes simples, YOLO11 fonctionne en examinant l'ensemble de l'image en une seule fois, plutôt qu'en plusieurs parties, ce qui le rend plus rapide et plus efficace. Il peut également prendre en charge des tâches de vision par ordinateur telles que la segmentation d'instances, l'estimation de la pose et la classification d'images.
Les capacités de YOLO11 peuvent notamment être utilisées pour calculer la distance qui sépare les objets les uns des autres, ce qui est utile dans de nombreux domaines tels que la fabrication, la vente au détail et la gestion des foules, et permet d'améliorer la sécurité et l'efficacité.
Dans cet article, nous verrons comment YOLO11 peut être utilisé pour le calcul de la distance dans les applications de vision par ordinateur, pourquoi il est important et quel est son impact dans différents secteurs d'activité.
Fig. 1. Exemple d'utilisation de YOLO pour calculer la distance d'atterrissage d'un avion.
Vue d'ensemble du calcul de la distance dans la vision par ordinateur
Le calcul de la distance en vision par ordinateur implique la détection, la localisation et la mesure des pixels entre deux objets dans une image. Les pixels sont les unités individuelles qui composent une image numérique, chacune représentant un point unique avec une couleur ou une valeur d'intensité spécifique.
Pour convertir les mesures des pixels en distances réelles, l'étalonnage est essentiel. C'est comme si l'on utilisait une règle pour mesurer quelque chose et que l'on se servait ensuite de cette mesure pour comprendre la taille d'autres objets. En se référant à des objets dont la taille est connue, l'étalonnage crée un lien entre les pixels et les distances physiques réelles.
Prenons un exemple pour voir comment cela fonctionne. Dans l'image ci-dessous, la pièce de monnaie est l'objet de référence et sa taille (0,9 x 1,0) est connue. En comparant les mesures en pixels des autres objets à la taille de la pièce, nous pouvons calculer leur taille réelle.
Fig. 2. Une pièce de monnaie peut être utilisée comme référence pour mesurer la taille réelle d'autres objets.
Cependant, le calcul de la distance se fait dans un plan bidimensionnel (2D), ce qui signifie qu'il ne mesure que les distances horizontales et verticales entre les objets. Cela diffère de l'estimation de la profondeur, qui mesure la distance des objets dans un espace tridimensionnel, y compris leur distance par rapport à la caméra.
Bien que les caméras de profondeur puissent mesurer la profondeur réelle et fournir des informations spatiales plus détaillées, dans de nombreux cas, une simple distance calibrée suffit. Par exemple, la connaissance de la distance entre les objets sur un plan 2D est utile pour des tâches telles que le suivi d'objets ou la gestion de files d'attente, de sorte que l'estimation de la profondeur n'est pas nécessaire dans ces situations.
Comprendre comment fonctionne le calcul de la distance avec YOLO11
Ensuite, nous allons voir comment calculer la distance entre deux objets en utilisant le support de YOLO11 pour la détection et le suivi d'objets. En voici un aperçu :
Détection et suivi d'objets: YOLO11 peut être utilisé pour détecter des objets en les reconnaissant dans une image et en suivant leur mouvement d'une image à l'autre dans une vidéo. Il attribue un identifiant unique à chaque objet, ce qui permet au système de suivre leur position et leur mouvement tout au long de la vidéo.
Boîtes de délimitation: Des cadres sont dessinés autour des objets détectés en fonction des résultats de la détection d'objets de YOLO11, qui définissent leur emplacement dans l'image.
Sélection d'objets: Il est possible de sélectionner deux objets sur lesquels se concentrer, et YOLO11 met à jour les boîtes de délimitation au fur et à mesure que les objets se déplacent en temps réel.
Calcul du centroïde: Les centroïdes (les points centraux des boîtes englobantes des deux objets) sont calculés sur la base des coordonnées des coins des boîtes englobantes, représentant les positions des objets.
Calcul de la distance: Les centroïdes des deux objets peuvent ensuite être utilisés pour calculer la distance euclidienne qui les sépare. La distance euclidienne est la distance en ligne droite entre deux points d'un plan 2D, calculée en utilisant les différences dans les directions horizontale et verticale. Elle fournit la distance entre les deux objets en pixels.
Il est important de garder à l'esprit que les distances calculées à l'aide de cette méthode ne sont que des estimations puisqu'elles sont basées sur des mesures de pixels en 2D.
Fig. 3. Utilisation d'Ultralytics YOLO pour détecter une personne et calculer les distances.
L'impact de l'estimation de la distance YOLO
Étant donné que le calcul des distances à l'aide de YOLO11 est une estimation, vous vous posez peut-être la question : Où cela peut-il être utilisé, et en quoi cela peut-il faire la différence ?
Étant donné que des étalonnages sont utilisés pour obtenir ces estimations de distance, elles sont suffisamment précises pour être utiles dans de nombreuses situations pratiques. L'estimation de la distance par YOLO11 est particulièrement utile dans les environnements dynamiques, comme les entrepôts, où les objets sont constamment en mouvement et où des ajustements en temps réel sont nécessaires pour assurer le bon déroulement des opérations.
Un exemple intéressant est l'utilisation de YOLO11 pour suivre les colis sur un tapis roulant et estimer la distance qui les sépare en temps réel. Les responsables d'entrepôt peuvent ainsi s'assurer que les colis sont correctement espacés, ce qui permet d'éviter les collisions et d'assurer le bon fonctionnement de l'entrepôt.
Dans ce cas, une distance exacte n'est pas toujours nécessaire. Généralement, une fourchette ou un seuil est fixé pour la distance optimale, de sorte qu'une estimation fonctionne bien pour ces types d'applications.
Fig. 4. Détection des paquets à l'aide de YOLO11 et calcul de la distance entre eux.
Calcul de la distance dans les applications de vision par ordinateur
Diverses applications de vision par ordinateur peuvent bénéficier du calcul de la distance entre les objets à l'aide de YOLO11. Dans le domaine de l'analyse du commerce de détail, par exemple, il permet d'améliorer la gestion des files d'attente en suivant la position des clients en temps réel. Les entreprises peuvent ainsi mieux répartir les ressources, réduire les temps d'attente et créer une expérience d'achat plus fluide. En ajustant dynamiquement les niveaux de personnel et en gérant le flux de clients, les magasins peuvent éviter la surpopulation et optimiser l'utilisation de l'espace.
De même, dans la gestion du trafic, l'estimation de la distance permet de surveiller l'espacement des véhicules et d'analyser les schémas de circulation. Elle peut être utilisée pour détecter les comportements dangereux, comme la queue de poisson, et ajuster les feux de circulation pour assurer la fluidité du trafic. Elle peut contribuer à rendre les routes plus sûres en identifiant les problèmes potentiels et en améliorant la gestion globale du trafic en temps réel.
Fig. 5. Le calcul de la distance par la vision peut être utilisé pour surveiller le trafic.
Une autre utilisation unique de cette technologie a eu lieu pendant la pandémie de COVID-19, lorsqu'elle a contribué à promouvoir la distanciation sociale. Elle a permis de s'assurer que les gens gardaient une distance de sécurité dans les espaces publics, les magasins et les hôpitaux, réduisant ainsi le risque de propagation du virus.
Grâce au suivi des distances en temps réel, des alertes peuvent être envoyées lorsque des personnes sont trop proches, ce qui permet aux entreprises et aux prestataires de soins de santé de réagir rapidement et de maintenir un environnement plus sûr pour tout le monde.
Avantages et inconvénients du calcul de la distance dans la vision par ordinateur
Maintenant que nous avons abordé quelques-unes des applications du calcul de la distance à l'aide de la vision par ordinateur, nous allons examiner de plus près les avantages qui en découlent :
Automatisation: Vision AI peut automatiser les tâches de calcul de distance qui nécessiteraient autrement un suivi manuel, réduisant ainsi les erreurs humaines et les coûts de main-d'œuvre tout en augmentant la productivité.
Optimisation des ressources: En connaissant l'espacement approximatif et la proximité des objets, les ressources (comme le personnel ou les machines) peuvent être optimisées, ce qui réduit le gaspillage et améliore les flux de travail.
Complexité d'installation minimale: Une fois installés, les systèmes de calcul de distance par vision nécessitent relativement peu d'entretien et d'intervention humaine par rapport à d'autres systèmes qui reposent sur une saisie manuelle ou des machines complexes.
Malgré ces avantages, il y a également certaines limites à prendre en compte lors de la mise en œuvre de ces systèmes. Voici un aperçu rapide des facteurs clés à prendre en compte lorsqu'il s'agit de calculer la distance à l'aide de la vision par ordinateur :
Sensibilité aux facteurs environnementaux: La précision du calcul de la distance peut être affectée par les conditions d'éclairage, les ombres, les reflets ou les obstacles, ce qui peut entraîner des erreurs ou des incohérences.
Protection de la vie privée: L'utilisation de la vision par ordinateur pour suivre des objets ou des personnes peut poser des problèmes de respect de la vie privée, en particulier dans les espaces publics ou les environnements sensibles où des données personnelles peuvent être impliquées.
Complexité dans les scénarios multi-objets: Dans les environnements comportant de nombreux objets en mouvement, le calcul précis des distances entre plusieurs objets simultanément peut être source de confusion, en particulier s'ils sont proches les uns des autres ou s'ils se croisent.
Principaux enseignements
Le calcul de la distance entre les objets à l'aide de YOLO11 est une solution fiable qui peut faciliter la prise de décision. Elle est particulièrement utile dans les environnements dynamiques tels que les entrepôts, le commerce de détail et la gestion du trafic, où le suivi de la proximité des objets peut améliorer l'efficacité et la sécurité.
YOLO11 permet d'automatiser des tâches qui nécessiteraient normalement un effort manuel. Bien qu'il y ait quelques défis à relever, tels que la sensibilité aux facteurs environnementaux et les préoccupations en matière de protection de la vie privée, les avantages, tels que l'automatisation, l'évolutivité et la facilité d'intégration, en font un outil très utile. À mesure que la vision par ordinateur continue de s'améliorer, notamment dans des domaines tels que le calcul de la distance, il est probable que nous assisterons à un véritable changement dans la manière dont les machines interagissent avec leur environnement et le comprennent.