Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024

Des visualisations aux informations commerciales grâce à la vision par ordinateur

Abirami Vina

5 min de lecture

19 septembre 2024

Apprenez à transformer les visuels de la vision par ordinateur en informations commerciales pertinentes. Découvrez comment relier les images et les données pour prendre de meilleures décisions.

La vision par ordinateur est un sous-domaine de l'intelligence artificielle (IA) qui permet aux machines d'interpréter et de prendre des décisions basées sur des données visuelles. Lorsqu'une application de vision par ordinateur est présentée, elle comprend généralement diverses sorties visuelles, telles que des images ou des vidéos, annotées avec des boîtes englobantes ou des masques de segmentation pour mettre en évidence les objets d'intérêt. Bien que ces visuels soient impressionnants, ils ne donnent pas toujours une image claire des informations exploitables qu'ils peuvent fournir.

Prenons un magasin de détail, par exemple. Un modèle de vision par ordinateur comme Ultralytics YOLOv8 peut être utilisé pour créer une carte thermique montrant où les clients passent le plus de temps. La visualisation pourrait ressembler à une carte colorée indiquant où la plupart des clients ont tendance à marcher ou à s'attarder. Cependant, la véritable information obtenue est la capacité d'identifier les sections du magasin qui sont sous-performantes. Les détaillants peuvent utiliser cette information exploitable pour réorganiser les placements de produits, optimiser l'espace de rayonnage ou ajuster les présentoirs promotionnels afin de stimuler davantage l'engagement des clients et d'augmenter les ventes. 

__wf_reserved_inherit
Fig 1. Un exemple de carte thermique créée pour un magasin de détail à l'aide de YOLOv8.

La valeur réelle de la vision par ordinateur réside dans la traduction de ces résultats visuels en informations commerciales significatives qui peuvent directement améliorer et optimiser les opérations pour stimuler la croissance et l'efficacité. Dans cet article, nous examinerons ce que la vision par ordinateur peut offrir aux entreprises et comment elle peut avoir un impact réel sur leurs opérations. Nous discuterons également des stratégies à mettre en œuvre pour aller au-delà des résultats visuels et exploiter des informations exploitables qui génèrent des résultats concrets. Commençons !

Visualisation vs. informations dans l'IA : l'idée fausse courante

Commençons par comprendre la différence entre les visualisations et les informations. En vision par ordinateur, les visualisations telles que les boîtes englobantes et les cartes thermiques sont importantes pour comprendre la sortie du modèle. Ces sorties visuelles servent de tremplin pour illustrer ce que la vision par ordinateur peut et ne peut pas faire. Les informations, cependant, vont au-delà de ces visuels et offrent des informations précieuses qui peuvent être utilisées pour prendre des décisions éclairées, améliorer les processus ou comprendre les modèles plus en profondeur. Elles transforment les données visuelles brutes en conclusions significatives qui aident à découvrir les tendances, à prédire les résultats ou à optimiser les stratégies.

Par exemple, un système de surveillance d'entraînement par vision artificielle pourrait utiliser l'estimation de pose et des modèles comme YOLOv8 pour suivre les mouvements du corps en identifiant les points clés tels que les articulations et les membres. Le rendu visuel, comme des squelettes animés montrant comment une personne bouge, peut être intéressant à regarder. Cependant, la véritable valeur réside dans les informations quantifiables que ces données fournissent, telles que le nombre de pompes ou de squats effectués, la durée de chaque exercice, la régularité des répétitions et la qualité de la forme maintenue tout au long de la session. 

Les entraîneurs peuvent utiliser ces informations pour analyser les mouvements de leurs clients pendant l'exercice, repérer les mouvements incorrects qui pourraient causer des blessures, suivre les performances au fil du temps et comprendre les habitudes d'entraînement. Ces informations aident les entraîneurs à donner de meilleurs commentaires, à concevoir des plans d'entraînement plus efficaces et à aider les clients à atteindre leurs objectifs de remise en forme de manière plus sûre et plus efficace.

__wf_reserved_inherit
Fig 2. Utilisation de YOLOv8 pour suivre les mouvements du corps.

Fournir de la valeur commerciale grâce à la vision par ordinateur

À mesure que la technologie progresse, les entreprises sont toujours à la recherche de moyens de garder une longueur d'avance sur la concurrence, et la vision par ordinateur est un excellent moyen d'y parvenir. En intégrant les informations issues de la vision par ordinateur dans leurs flux de travail existants, elles peuvent constater des résultats mesurables et concrets.

Ces informations peuvent offrir des renseignements précieux dans divers domaines de l'entreprise, tels que :

  • Mesures de performance : Données quantitatives qui mettent en évidence les indicateurs de performance clés et les tendances.
  • Analyse des tendances : Comprendre les tendances émergentes et les changements dans le comportement des clients ou les conditions du marché au fil du temps.
  • Informations prédictives : Prévision des résultats futurs ou identification des problèmes potentiels à l’aide de données passées et en temps réel.
  • Alertes en temps réel : Notifications instantanées pour les événements importants, les anomalies ou les changements qui nécessitent une attention particulière.

Par exemple, dans l'industrie pétrolière et gazière, la détection des incendies ou des fuites de gaz provenant des fours était traditionnellement gérée à l'aide d'une surveillance manuelle ou de systèmes de capteurs de base. Ces méthodes manquent souvent de la rapidité et de la précision nécessaires pour détecter rapidement les dangers potentiels. La vision par ordinateur peut améliorer ce processus en utilisant des caméras et des modèles de détection d'objets comme YOLOv8 pour surveiller en permanence les fours et repérer rapidement les problèmes comme les flammes inhabituelles, l'excès de fumée ou les fuites de gaz. 

La sortie visuelle de cette application pourrait se présenter sous forme de boîtes englobantes sur des images, mettant en évidence les zones où un incendie est détecté. Le véritable avantage, cependant, réside dans la transformation de ces indices visuels en informations exploitables. Ces informations peuvent aider à identifier la cause d'un incendie, à prédire les problèmes d'équipement et à planifier la maintenance pour prévenir de futurs problèmes. En utilisant ces informations, les entreprises industrielles peuvent réagir rapidement aux incendies potentiels, éviter des dommages coûteux, réduire les temps d'arrêt et améliorer la sécurité et l'efficacité.

__wf_reserved_inherit
Fig 3. Utilisation de YOLOv8 pour détecter le feu.

Prise de décision basée sur les données avec l'IA

Les sorties visuelles d'un modèle entraîné peuvent être transformées en informations organisées en tableaux de bord et en bases de données pour une analyse plus approfondie. Les tableaux de bord, en particulier, peuvent aider les chefs d'entreprise à avoir une vue claire des indicateurs de performance, à repérer les anomalies et à prendre des décisions fondées sur des données en temps réel.

Par exemple, dans la surveillance du trafic, un modèle de vision par ordinateur comme YOLOv8 peut être utilisé pour analyser les images du trafic en direct afin de détecter et de suivre différents véhicules, comme les voitures, les camionnettes et les bus, sur la route. La visualisation de la sortie peut montrer les véhicules étiquetés et suivre le nombre de véhicules entrant et sortant de zones spécifiques. Ces informations peuvent également être affichées sur un tableau de bord qui fournit une ventilation du nombre de véhicules par zone et calcule des indicateurs clés comme le nombre total de véhicules et la vitesse moyenne. 

__wf_reserved_inherit
Fig 4. Utilisation de YOLOv8 pour détecter et suivre le trafic.

Ces informations aident les équipes de gestion du trafic à comprendre la fluidité du trafic, à identifier les points de congestion, à prédire les embouteillages et à ajuster les feux de circulation ou les itinéraires pour assurer une circulation fluide. En transformant les données visuelles en informations exploitables, ce système aide les urbanistes à prendre des décisions intelligentes pour améliorer la fluidité du trafic et réduire les problèmes sur la route.

Combler le fossé entre l'IA et les besoins des entreprises

Maintenant que nous avons discuté de l'impact commercial des informations exploitables de la vision par ordinateur, examinons les stratégies permettant de combler le fossé entre la visualisation des données et les informations commerciales. Lors du développement de solutions d'IA, ces considérations sont essentielles car elles aident à aller au-delà des simples tâches de vision par ordinateur pour comprendre le contexte et les relations au sein des données. Une analyse approfondie permet de créer des informations plus significatives et plus pertinentes pour les besoins de l'entreprise.

Pour commencer, il est essentiel d'améliorer la communication entre les développeurs d'IA et les chefs d'entreprise. Les développeurs d'IA peuvent avoir des discussions ouvertes avec les parties prenantes de l'entreprise afin de comprendre leurs objectifs, leurs défis et ce qu'ils espèrent accomplir. En se mettant à la place du chef d'entreprise, il est plus facile de déterminer comment la vision par ordinateur peut directement résoudre des problèmes spécifiques. Plutôt que de développer des solutions génériques, les développeurs peuvent se concentrer sur la création d'applications de vision par ordinateur qui répondent à des besoins commerciaux réels. 

Par exemple, dans le scénario pétrolier et gazier dont nous avons parlé précédemment, parler directement avec un intervenant commercial pourrait aider un développeur à comprendre des besoins spécifiques, comme l'envoi d'alertes basées sur la taille et la gravité d'un incendie détecté. Connaître ces détails aide les développeurs à personnaliser la solution pour donner la priorité aux alertes critiques, assurant ainsi des temps de réponse plus rapides et réduisant les risques, ce qui améliore la sécurité et l'efficacité.

__wf_reserved_inherit
Fig 5. La communication est essentielle. Source de l'image : Envato Elements.

Une fois qu'une communication claire est établie, l'étape suivante consiste à se concentrer sur la qualité et le traitement des données. Les développeurs peuvent s'assurer que les données utilisées pour l'entraînement et l'analyse sont propres, cohérentes et pertinentes par rapport aux besoins du client. La rationalisation du traitement des données peut contribuer à réduire les retards et à fournir des informations précises et opportunes. De plus, l'intégration de systèmes de vision par ordinateur aux outils commerciaux existants peut améliorer la prise de décision et permettre aux entreprises de réagir rapidement aux informations importantes.

Voici d'autres facteurs à prendre en compte :

  • Visualisation conviviale : S’assurer que les sorties visuelles sont simples et faciles à interpréter pour les parties prenantes non techniques.
  • Scalabilité : Concevez des solutions d'IA qui peuvent évoluer avec les besoins croissants de l'entreprise en matière de données et les changements opérationnels.
  • Analyse en temps réel : Intégrez le traitement des données en temps réel pour fournir des informations pertinentes qui peuvent inciter à une action immédiate.
  • Sécurité et confidentialité : Protégez l'intégrité et la confidentialité des données, en particulier lorsque vous traitez des informations sensibles.
  • Apprentissage et adaptation continus : Mettre en œuvre des mécanismes d'apprentissage continu et de mise à jour des modèles pour s'adapter à l'évolution des environnements commerciaux et des modèles de données.

L'avenir de la vision par ordinateur pour les entreprises

Bien que les sorties visuelles, telles que les boîtes englobantes et les masques, démontrent les capacités de la vision par ordinateur, les entreprises ont besoin de plus que de simples représentations visuelles ; elles ont besoin d'informations exploitables qui peuvent stimuler la prise de décision et les améliorations opérationnelles. En comprenant les objectifs de l'entreprise et en appliquant la vision par ordinateur à des problèmes du monde réel, les développeurs peuvent fournir des informations qui améliorent les opérations, améliorent l'expérience client et réduisent les coûts. 

Pour combler le fossé entre la visualisation et les informations exploitables, les développeurs peuvent communiquer clairement avec les parties prenantes, utiliser des données de haute qualité et améliorer le traitement des données. Ces étapes aident les entreprises à tirer le meilleur parti de la technologie de vision par ordinateur, en transformant les informations en avantages réels.

Apprenons et explorons ensemble ! Consultez notre dépôt GitHub pour découvrir nos contributions à l'IA, et n'oubliez pas de vous engager avec notre communauté. Découvrez comment nous redéfinissons des secteurs tels que la fabrication et la santé grâce à une technologie d'IA de pointe.

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement
Lien copié dans le presse-papiers