Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Guides

Tout ce que tu dois savoir sur les tâches de vision par ordinateur

Apprends comment fonctionnent les tâches de vision par ordinateur comme le suivi d'objets, la segmentation d'instances et la classification d'images, et comment Ultralytics YOLO11 les prend en charge.

ABAbirami Vina
4 min read
Tâches de vision par ordinateur prises en charge par Ultralytics YOLO11

Grâce aux caméras et aux avancées de l'intelligence artificielle (IA), les ordinateurs et les machines sont désormais capables de voir le monde d'une manière similaire à celle des humains. Par exemple, ils peuvent reconnaître des personnes, suivre des objets et même comprendre le contexte de ce qui se passe dans une vidéo.

Plus précisément, la vision par ordinateur est la branche de l'IA qui permet aux machines de comprendre et d'interpréter les informations visuelles du monde qui les entoure. La vision par ordinateur implique une variété de tâches, chacune conçue pour extraire un type spécifique d'information à partir d'images ou de vidéos. Par exemple, la détection d'objets aide à identifier et à localiser différents éléments dans une image, tandis que d'autres tâches comme le suivi, la segmentation et l'estimation de pose aident les machines à mieux comprendre les mouvements, les formes et les positions avec plus de précision.

La tâche de vision par ordinateur utilisée pour une application particulière dépend du type d'informations dont tu as besoin. Les modèles de vision par ordinateur comme Ultralytics YOLO11 prennent en charge diverses tâches de vision par ordinateur, ce qui en fait un choix fiable pour construire des systèmes d'IA de vision concrets.

Dans ce guide, nous examinerons de plus près les tâches de vision par ordinateur prises en charge par des modèles comme YOLO11. Nous explorerons le fonctionnement de chaque tâche et la manière dont elles sont utilisées dans différents secteurs. Commençons !

Link to this sectionQu'est-ce que les tâches de vision par ordinateur ?#

Les tâches de vision par ordinateur visent à reproduire les capacités de vision humaine de différentes manières. Ces tâches peuvent aider les machines à détecter des objets, à suivre leurs mouvements, à estimer des poses et même à délimiter des éléments individuels dans des images et des vidéos. En règle générale, les tâches de vision par ordinateur sont activées par des modèles qui décomposent les données visuelles en parties plus petites afin de mieux interpréter ce qui se passe.

Les modèles de Vision AI comme les modèles Ultralytics YOLO prennent en charge plusieurs tâches, telles que la détection, le suivi et la segmentation, au sein d'un seul framework. Grâce à cette polyvalence, les modèles YOLO11 sont faciles à adopter pour une grande variété de cas d'utilisation.

Tâches de vision par ordinateur prises en charge par YOLO11

Fig 1. Tâches de vision par ordinateur prises en charge par YOLO11.

Un bon exemple est l'analyse sportive. YOLO11 peut être utilisé pour détecter chaque joueur sur le terrain grâce à la détection d'objets, puis il peut les suivre tout au long du match avec le suivi d'objets. Parallèlement, les capacités d'estimation de pose de YOLO11 peuvent aider à analyser les mouvements et les techniques des joueurs, et la segmentation d'instance peut séparer chaque joueur de l'arrière-plan, ajoutant ainsi de la précision à l'analyse.

Ensemble, ces tâches de vision par ordinateur activées par YOLO11 créent une image complète de ce qui se passe pendant le match, donnant aux équipes des informations plus approfondies sur les performances des joueurs, les tactiques et la stratégie globale.

Link to this sectionAperçu des tâches de vision par ordinateur prises en charge par YOLO11#

Maintenant que nous avons vu ce que sont les tâches de vision par ordinateur, plongeons dans la compréhension de chacune d'entre elles prises en charge par YOLO11 plus en détail, en utilisant des exemples concrets.

Link to this sectionLa prise en charge de la classification d'images par YOLO11#

Quand tu regardes une photo, la plupart des gens peuvent facilement dire si elle montre un chien, une montagne ou un panneau de signalisation car nous avons tous appris à quoi ces choses ressemblent généralement. La classification d'images aide les machines à faire de même en leur apprenant à classifier et à étiqueter une image en fonction de son objet principal - qu'il s'agisse d'une « voiture », d'une « banane » ou d'une « radiographie avec fracture ». Cette étiquette aide les systèmes de vision par ordinateur à comprendre le contenu visuel afin qu'ils puissent réagir ou prendre des décisions en conséquence.

Une application intéressante de cette tâche de vision par ordinateur est la surveillance de la faune. La classification d'images peut être utilisée pour identifier différentes espèces animales à partir de photos prises dans la nature. En étiquetant automatiquement les images, les chercheurs peuvent suivre les populations, surveiller les schémas de migration et identifier plus facilement les espèces menacées pour soutenir les efforts de conservation.

Utilisation de YOLO11 pour la classification d'images

Fig 2. Un exemple d'utilisation de YOLO11 pour la classification d'images.

Link to this sectionLes capacités de détection d'objets de YOLO11#

Bien que la classification d'images soit utile pour obtenir une idée globale de ce qu'une image contient, elle n'attribue qu'une seule étiquette à l'image entière. Dans les situations où des informations détaillées, telles que l'emplacement précis et l'identité de plusieurs objets, sont nécessaires, la détection d'objets devient essentielle.

La détection d'objets est le processus consistant à identifier et à localiser des objets individuels dans une image, souvent en dessinant des boîtes englobantes autour d'eux. Ultralytics YOLO11 est particulièrement performant pour la détection d'objets en temps réel, ce qui le rend idéal pour un large éventail d'applications.

Prends, par exemple, les solutions de vision par ordinateur utilisées dans les magasins de détail pour le réapprovisionnement des étagères. La détection d'objets peut aider à compter les fruits, les légumes et d'autres articles, garantissant un inventaire précis. Dans les champs agricoles, la même technologie peut surveiller la maturité des cultures pour aider les agriculteurs à déterminer le meilleur moment pour récolter, en faisant même la distinction entre les produits mûrs et non mûrs.

Détection de fruits avec Ultralytics YOLO11

Fig 3. Détection de fruits avec Ultralytics YOLO11.

Link to this sectionUtiliser YOLO11 pour la segmentation d'instance#

La détection d'objets utilise des boîtes englobantes pour identifier et localiser des objets dans une image, mais elle ne capture pas leurs formes exactes. C'est là qu'intervient la segmentation d'instance. Au lieu de dessiner une boîte autour d'un objet, la segmentation d'instance trace son contour précis.

Tu peux voir les choses comme suit : plutôt que d'indiquer simplement qu'« il y a une pomme dans cette zone », elle dessine et remplit soigneusement la forme exacte de la pomme. Ce processus détaillé aide les systèmes d'IA à bien comprendre les limites d'un objet, surtout lorsque les objets sont proches les uns des autres.

La segmentation d'instance peut être appliquée à de nombreuses applications, des inspections d'infrastructure aux études géologiques. Par exemple, les données issues d'études géologiques peuvent être analysées à l'aide de YOLO11 pour segmenter les grandes et petites fissures ou anomalies de surface. En dessinant des limites précises autour de ces anomalies, les ingénieurs peuvent identifier les problèmes et les résoudre avant le début d'un projet.

Segmentation de fissures activée par YOLO11

Fig 4. Segmentation de fissures activée par YOLO11.

Link to this sectionSuivi d'objets : Suivre des objets à travers les images avec YOLO11#

Jusqu'à présent, les tâches de vision par ordinateur que nous avons examinées se concentrent sur ce qui se trouve dans une seule image. Cependant, lorsqu'il s'agit de vidéos, nous avons besoin d'informations qui vont au-delà d'une seule image. La tâche, le suivi d'objets, peut être utilisée pour cela.

La capacité de suivi d'objets de YOLO11 permet de suivre un objet spécifique, comme une personne ou une voiture, au fur et à mesure qu'il se déplace dans une série d'images vidéo. Même si l'angle de la caméra change ou que d'autres objets apparaissent, le système continue de suivre la même cible.

Ceci est crucial pour les applications nécessitant une surveillance dans le temps, comme le suivi des voitures dans la circulation. En fait, YOLO11 peut suivre avec précision les véhicules, en suivant chaque voiture pour aider à estimer leur vitesse en temps réel. Cela fait du suivi d'objets un composant clé dans les systèmes tels que la surveillance du trafic.

Suivi d'objets YOLO11 utilisé pour l'estimation de la vitesse

Fig 5. La prise en charge du suivi d'objets par YOLO11 peut être utilisée pour l'estimation de la vitesse.

Link to this sectionDétection de boîtes englobantes orientées (OBB) avec YOLO11#

Les objets dans le monde réel ne sont pas toujours parfaitement alignés - ils peuvent être inclinés, sur le côté ou positionnés selon des angles étranges. Par exemple, sur les images satellites, les navires et les bâtiments apparaissent souvent en rotation.

Les méthodes traditionnelles de détection d'objets utilisent des boîtes rectangulaires fixes qui ne s'adaptent pas à l'orientation d'un objet, ce qui rend difficile la capture précise de ces formes pivotées. La détection par boîte englobante orientée (OBB) résout ce problème en utilisant des boîtes qui pivotent pour s'ajuster parfaitement autour d'un objet, en s'alignant sur son angle pour une détection plus précise.

En ce qui concerne la surveillance portuaire, la prise en charge par YOLO11 de la détection OBB peut aider à identifier et à suivre avec précision les navires, quelle que soit leur orientation, garantissant que chaque navire entrant ou sortant du port est correctement surveillé. Cette détection précise fournit des informations en temps réel sur les positions et les mouvements des navires, ce qui est essentiel pour gérer les ports très fréquentés et prévenir les collisions.

Détection de bateaux avec la détection OBB et YOLO11

Fig 6. Détection de bateaux utilisant la détection OBB et YOLO11.

Link to this sectionEstimation de pose et YOLO11 : Suivre les points clés#

L'estimation de pose est une technique de vision par ordinateur qui suit les points clés, tels que les articulations, les membres ou d'autres marqueurs, pour comprendre comment un objet bouge. Plutôt que de traiter un objet ou un corps entier comme une unité complète, cette méthode le décompose en ses parties clés. Cela permet d'analyser en détail les mouvements, les gestes et les interactions.

Une application courante de cette technologie est l'estimation de pose humaine. En suivant les positions des différentes parties du corps en temps réel, elle fournit une image claire de la façon dont une personne bouge. Ces informations peuvent être utilisées à diverses fins, de la reconnaissance des gestes et la surveillance de l'activité à l'analyse des performances dans le sport.

De même, en rééducation physique, les thérapeutes peuvent utiliser l'estimation de pose humaine et YOLO11 pour surveiller les mouvements des patients pendant les exercices. Cela permet de s'assurer que chaque mouvement est effectué correctement tout en suivant les progrès au fil du temps.

YOLO11 surveillant un entraînement sportif avec l'estimation de pose

Fig 7. YOLO11 peut surveiller une séance d'entraînement à l'aide de l'estimation de pose.

Link to this sectionExplorer comment YOLO11 prend en charge diverses tâches de vision par ordinateur#

Maintenant que nous avons exploré en détail toutes les tâches de vision par ordinateur prises en charge par YOLO11, examinons comment YOLO11 les prend en charge.

YOLO11 n'est pas qu'un seul modèle - c'est une suite de variantes de modèles spécialisés, chacune conçue pour une tâche de vision par ordinateur spécifique. Cela fait de YOLO11 un outil polyvalent qui peut être adapté à un large éventail d'applications. Tu peux également affiner ces modèles sur des jeux de données personnalisés pour relever les défis uniques de tes projets.

Voici les variantes de modèle YOLO11 pré-entraînées pour des tâches de vision spécifiques :

  • YOLO11 : Ce modèle détecte et étiquette plusieurs objets en temps réel, ce qui le rend idéal pour la reconnaissance visuelle à grande vitesse.
  • YOLO11-seg : Cette variante se concentre sur la segmentation en utilisant des masques détaillés pour séparer les objets de leurs arrière-plans.
  • YOLO11-obb : Ce modèle est conçu pour détecter des objets pivotés en dessinant des boîtes englobantes qui s'alignent avec l'orientation de chaque objet.
  • YOLO11-cls : Cette variante classifie les images en attribuant une étiquette de catégorie unique en fonction du contenu global.
  • YOLO11-pose : Ce modèle estime les points clés sur le corps pour suivre la posture, les positions des membres et les mouvements.

Chaque variante est disponible en différentes tailles, permettant aux utilisateurs de choisir le bon équilibre entre vitesse et précision pour leurs besoins spécifiques.

Link to this sectionPoints clés#

Les tâches de vision par ordinateur changent la façon dont les machines comprennent le monde et interagissent avec lui. En décomposant les images et les vidéos en éléments clés, ces technologies facilitent l'analyse détaillée des objets, des mouvements et des interactions.

De l'amélioration de la sécurité routière et des performances sportives à la rationalisation des processus industriels, les modèles comme YOLO11 peuvent fournir des informations en temps réel qui stimulent l'innovation. À mesure que la Vision AI continue d'évoluer, elle jouera probablement un rôle de plus en plus important dans la façon dont nous interprétons et utilisons quotidiennement les données visuelles.

Rejoins notre communauté et visite notre dépôt GitHub pour voir l'IA en action. Explore nos options de licence et découvre plus sur l'IA dans l'agriculture et la vision par ordinateur dans la fabrication sur nos pages de solutions.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique