Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Ultralytics YOLO

Explorer comment fonctionnent les applications de vision par ordinateur

Fais une plongée en profondeur avec nous dans les applications de la vision par ordinateur. Nous passerons également en revue diverses tâches de vision par ordinateur comme la détection d'objets et la segmentation.

ABAbirami Vina
5 min read
Applications de la vision par ordinateur

Lorsque nous avons exploré l'histoire des modèles de vision par ordinateur, nous avons vu comment la vision par ordinateur a évolué et le chemin qui a mené aux modèles de vision avancés dont nous disposons aujourd'hui. Les modèles modernes comme Ultralytics YOLOv8 prennent en charge de multiples tâches de vision par ordinateur et sont utilisés dans diverses applications passionnantes.

Dans cet article, nous allons examiner les bases de la vision par ordinateur et des modèles de vision. Nous couvrirons leur fonctionnement et leurs diverses applications dans de nombreux secteurs. Les innovations en vision par ordinateur sont partout, façonnant silencieusement notre monde. Découvrons-les une par une !

Link to this sectionQu'est-ce que la vision par ordinateur ?#

L'intelligence artificielle (IA) est un terme générique qui englobe de nombreuses technologies visant à reproduire une partie de l'intelligence humaine. La vision par ordinateur est l'un de ces sous-domaines de l'IA. La vision par ordinateur se concentre sur le fait de donner aux machines des yeux capables de voir, d'observer et de comprendre leur environnement.

Tout comme la vision humaine, les solutions de vision par ordinateur visent à distinguer des objets, à calculer des distances et à détecter des mouvements. Cependant, contrairement aux humains, qui possèdent toute une vie d'expériences pour les aider à voir et à comprendre, les ordinateurs s'appuient sur de vastes quantités de données, des caméras haute définition et des algorithmes complexes.

Comparaison entre la vision humaine et la vision par ordinateur

Fig 1. Comparaison entre la vision humaine et la vision par ordinateur.

Les systèmes de vision par ordinateur peuvent traiter et analyser des données visuelles comme des images et des vidéos avec une vitesse et une précision incroyables. La capacité d'analyser rapidement et précisément de grandes quantités d'informations visuelles fait de la vision par ordinateur un outil puissant dans divers secteurs, allant de la fabrication aux soins de santé.

Link to this sectionLes modèles de vision prennent en charge diverses tâches de vision par ordinateur#

Les modèles de vision par ordinateur sont au cœur de toute application de vision par ordinateur. Il s'agit essentiellement d'algorithmes informatiques basés sur des techniques d'apprentissage profond, conçus pour donner aux machines la capacité d'interpréter et de comprendre des informations visuelles. Les modèles de vision permettent d'effectuer des tâches cruciales de vision par ordinateur allant de la classification d'images à la détection d'objets. Examinons de plus près certaines de ces tâches et leurs cas d'utilisation plus en détail.

Link to this sectionClassification d'images#

La classification d'images consiste à catégoriser et à étiqueter des images dans des classes ou catégories prédéfinies. Un modèle de vision comme YOLOv8 peut être entraîné sur de vastes datasets d'images étiquetées. Pendant l'entraînement, le modèle apprend à reconnaître les motifs et les caractéristiques associés à chaque classe. Une fois entraîné, il peut prédire la catégorie de nouvelles images inédites en analysant leurs caractéristiques et en les comparant aux motifs appris.

Un exemple de classification d'images

Fig 2. Un exemple de classification d'images. (source : towardsdatascience.com)

Il existe différents types de classification d'images. Par exemple, lorsqu'il s'agit d'images médicales, tu peux utiliser la classification binaire pour diviser les images en deux groupes, comme sain ou malade. Un autre type est la classification multiclasse. Elle peut aider à classer les images en plusieurs groupes, comme classer différents animaux dans une ferme comme des cochons, des chèvres et des vaches. Ou, disons que tu veux classer des animaux en groupes et sous-groupes, comme classer les animaux en mammifères et oiseaux, puis plus précisément en espèces telles que lions, tigres, aigles et moineaux ; la classification hiérarchique serait la meilleure option.

Link to this sectionDétection d'objets#

La détection d'objets est le processus d'identification et de localisation d'objets dans des images et des cadres vidéo à l'aide de la vision par ordinateur. Elle se compose de deux tâches : la localisation d'objets, qui dessine des boîtes englobantes (bounding boxes) autour des objets, et la classification d'objets, qui identifie la catégorie de chaque objet. Sur la base des annotations de boîtes englobantes, un modèle de vision peut apprendre à reconnaître les motifs et caractéristiques spécifiques à chaque catégorie d'objet et prédire la présence et l'emplacement de ces objets dans de nouvelles images inédites.

Détection d'objets YOLOv8 détectant des joueurs sur un terrain de football

Fig 3. Détection d'objets par YOLOv8 utilisée pour détecter des joueurs sur un terrain de football.

La détection d'objets a de nombreux cas d'utilisation dans différents secteurs, allant du sport à la biologie marine. Par exemple, dans le commerce de détail, la technologie Amazon’s Just Walk Out utilise la détection d'objets pour automatiser le paiement en identifiant les articles que les clients ramassent. Une combinaison de vision par ordinateur et de données de capteurs permet aux clients de prendre leurs articles et de partir sans faire la queue.

Voici un aperçu plus détaillé de son fonctionnement :

  • Les caméras montées au plafond capturent les mouvements des clients dans le magasin, et ces images vidéo sont traitées en temps réel par des modèles de vision.
  • La détection d'objets est utilisée pour identifier le produit exact qu'un client ramasse et place dans son panier afin de mettre à jour son panier virtuel en conséquence.
  • Les capteurs de poids sur les étagères améliorent la précision en détectant le retrait ou le remplacement d'un article.
  • Lorsque le client sort du magasin, la détection d'objets et la technologie de reconnaissance faciale peuvent être utilisées pour confirmer que le client est parti, et ses détails de paiement, comme une carte de crédit, peuvent être utilisés pour le facturer automatiquement.

Link to this sectionSegmentation sémantique et d'instance#

La segmentation sémantique et la segmentation d'instance sont des tâches de vision par ordinateur qui aident à partitionner les images en segments significatifs. La segmentation sémantique classifie les pixels en fonction de leur signification sémantique et traite tous les objets au sein d'une catégorie comme une entité unique avec la même étiquette. Elle est adaptée pour étiqueter des objets innombrables comme "le ciel" ou "l'océan" ou des groupes comme "les feuilles" ou "l'herbe".

La segmentation d'instance, en revanche, peut distinguer différentes instances de la même classe en assignant une étiquette unique à chaque objet détecté. Tu peux utiliser la segmentation d'instance pour segmenter des objets dénombrables où le nombre et l'indépendance des objets sont importants. Cela permet une identification et une différenciation plus précises.

Un exemple de segmentation sémantique et d'instance

Fig 4. Un exemple de segmentation sémantique et d'instance.

Nous pouvons comprendre plus clairement le contraste entre la segmentation sémantique et d'instance avec un exemple lié aux voitures autonomes. La segmentation sémantique est idéale pour les tâches qui nécessitent de comprendre le contenu d'une scène et peut être utilisée dans les véhicules autonomes pour classer les caractéristiques sur la route, comme les passages piétons et les panneaux de signalisation. Pendant ce temps, la segmentation d'instance peut être utilisée dans les véhicules autonomes pour distinguer les piétons, les véhicules et les obstacles individuels.

Link to this sectionEstimation de pose#

L'estimation de pose est une tâche de vision par ordinateur axée sur la détection et le suivi des points clés des poses d'un objet dans des images ou des vidéos. Elle est le plus souvent utilisée pour l'estimation de pose humaine, avec des points clés incluant des zones comme les épaules et les genoux. Estimer la pose d'un humain nous aide à comprendre et à reconnaître les actions et les mouvements qui sont critiques pour diverses applications.

Un exemple d'estimation de pose utilisant YOLOv8

Fig 5. Un exemple d'estimation de pose utilisant YOLOv8.

L'estimation de pose peut être utilisée dans le sport pour analyser la façon dont les athlètes se déplacent. La NBA utilise l'estimation de pose pour étudier les mouvements et les positions des joueurs pendant le match. En suivant les points clés comme les épaules, les coudes, les genoux et les chevilles, l'estimation de pose fournit des informations détaillées sur les mouvements des joueurs. Ces informations aident les entraîneurs à développer de meilleures stratégies, à optimiser les programmes d'entraînement et à effectuer des ajustements en temps réel pendant les matchs. De plus, les données peuvent aider à surveiller la fatigue et le risque de blessure des joueurs pour améliorer leur santé et leurs performances globales.

Link to this sectionDétection d'objets par boîtes englobantes orientées#

La détection d'objets par boîtes englobantes orientées (OBB) utilise des rectangles pivotés pour identifier et localiser précisément les objets dans une image. Contrairement aux boîtes englobantes standard qui s'alignent sur les axes de l'image, les OBB pivotent pour correspondre à l'orientation de l'objet. Cela les rend particulièrement utiles pour les objets qui ne sont pas parfaitement horizontaux ou verticaux. Elles sont excellentes pour localiser et isoler avec précision les objets pivotés afin d'éviter les chevauchements dans les environnements encombrés.

Détection de boîtes englobantes orientées sur une image aérienne de bateaux utilisant YOLOv8

Fig 6. Un exemple de détection par boîte englobante orientée sur une image aérienne de bateaux utilisant YOLOv8.

Dans la surveillance maritime, l'identification et le suivi des navires sont essentiels pour la sécurité et la gestion des ressources. La détection OBB peut être utilisée pour une localisation précise des navires, même lorsqu'ils sont densément regroupés ou orientés selon divers angles. Elle aide à surveiller les voies de navigation, à gérer le trafic maritime et à optimiser les opérations portuaires. Elle peut également aider à la réponse aux catastrophes en identifiant et en évaluant rapidement les dommages aux navires et aux infrastructures après des événements comme des ouragans ou des marées noires.

Link to this sectionSuivi d'objets#

Jusqu'à présent, nous avons discuté des tâches de vision par ordinateur qui traitent des images. Le suivi d'objets est une tâche de vision par ordinateur qui peut suivre un objet à travers les images d'une vidéo. Il commence par identifier l'objet dans la première image à l'aide d'algorithmes de détection, puis suit continuellement sa position au fur et à mesure qu'il se déplace dans la vidéo. Le suivi d'objets implique des techniques telles que la détection d'objets, l'extraction de caractéristiques et la prédiction de mouvement pour maintenir la précision du suivi.

Utilisation de YOLOv8 pour suivre des poissons

Fig 7. Utilisation de YOLOv8 pour suivre des poissons.

Les modèles de vision comme YOLOv8 peuvent être utilisés pour suivre les poissons en biologie marine. À l'aide de caméras sous-marines, les chercheurs peuvent surveiller les mouvements et les comportements des poissons dans leurs habitats naturels. Le processus commence par la détection des poissons individuels dans les premières images, puis suit leurs positions tout au long de la vidéo. Le suivi des poissons aide les scientifiques à comprendre les modèles de migration, les comportements sociaux et les interactions avec l'environnement. Il soutient également les pratiques de pêche durable en fournissant des informations sur la distribution et l'abondance des poissons.

Link to this sectionUn dernier regard sur la vision par ordinateur#

La vision par ordinateur change activement notre façon d'utiliser la technologie et d'interagir avec le monde. En utilisant des modèles d'apprentissage profond et des algorithmes complexes pour comprendre les images et les vidéos, la vision par ordinateur aide les secteurs à rationaliser de nombreux processus. Les tâches de vision par ordinateur comme la détection d'objets et le suivi d'objets permettent de créer des solutions qui n'avaient jamais été imaginées auparavant. Alors que la technologie de vision par ordinateur continue de s'améliorer, l'avenir réserve encore bien d'autres applications innovantes !

Apprenons et grandissons ensemble ! Explore notre référentiel GitHub pour voir nos contributions à l'IA. Découvre comment nous redéfinissons des industries comme les voitures autonomes et l'agriculture avec l'IA. 🚀

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique