Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Intégration de la vision par ordinateur dans la robotique avec Ultralytics YOLO11

Abirami Vina

5 min de lecture

18 mars 2025

Examinez de plus près comment les modèles de vision par ordinateur comme Ultralytics YOLO11 rendent les robots plus intelligents et façonnent l'avenir de la robotique.

Les robots ont parcouru un long chemin depuis Unimate, le premier robot industriel, inventé dans les années 1950. Ce qui a commencé comme des machines préprogrammées et basées sur des règles est maintenant devenu des systèmes intelligents capables d'effectuer des tâches complexes et d'interagir de manière transparente avec le monde réel. 

Aujourd'hui, les robots sont utilisés dans tous les secteurs, de la fabrication et des soins de santé à l'agriculture, pour diverses automatisations de processus. Un facteur clé de l'évolution de la robotique est l'IA et la vision par ordinateur, une branche de l'IA qui aide les machines à comprendre et à interpréter les informations visuelles.

Par exemple, les modèles de vision artificielle comme Ultralytics YOLO11 améliorent l'intelligence des systèmes robotiques. Lorsqu'elle est intégrée à ces systèmes, la Vision IA permet aux robots de reconnaître des objets, de naviguer dans des environnements et de prendre des décisions en temps réel.

Dans cet article, nous allons examiner comment YOLO11 peut améliorer les robots avec des capacités avancées de vision par ordinateur et explorer ses applications dans divers secteurs.

Un aperçu de l'IA et de la vision par ordinateur dans la robotique

La fonctionnalité principale d'un robot dépend de sa capacité à comprendre son environnement. Cette conscience relie son matériel physique à une prise de décision intelligente. Sans elle, les robots ne peuvent que suivre des instructions fixes et ont du mal à s'adapter aux environnements changeants ou à gérer des tâches complexes. Tout comme les humains comptent sur la vue pour se déplacer, les robots utilisent la vision par ordinateur pour interpréter leur environnement, comprendre la situation et prendre les mesures appropriées.

__wf_reserved_inherit
Fig 1. Un robot jouant au Tic-Tac-Toe et utilisant la vision par ordinateur pour interpréter le plateau et effectuer des mouvements stratégiques.

En fait, la vision par ordinateur est fondamentale pour la plupart des tâches robotiques. Elle aide les robots à détecter les objets et à éviter les obstacles lorsqu'ils se déplacent. Cependant, pour ce faire, il ne suffit pas de voir le monde ; les robots doivent également être capables de réagir rapidement. Dans les situations du monde réel, même un léger retard peut entraîner des erreurs coûteuses. Des modèles comme Ultralytics YOLO11 permettent aux robots de recueillir des informations en temps réel et de réagir instantanément, même dans des situations complexes ou inconnues.

Découverte d'Ultralytics YOLO11

Avant de nous plonger dans la façon dont YOLO11 peut être intégré dans des systèmes robotiques, explorons d'abord les principales fonctionnalités de YOLO11.

Les modèles Ultralytics YOLO prennent en charge diverses tâches de vision par ordinateur qui aident à fournir des informations rapides et en temps réel. En particulier, Ultralytics YOLO11 offre des performances plus rapides, des coûts de calcul inférieurs et une précision améliorée. Par exemple, il peut être utilisé pour détecter des objets dans des images et des vidéos avec une grande précision, ce qui le rend parfait pour les applications dans des domaines tels que la robotique, la santé et la fabrication. 

Voici quelques fonctionnalités percutantes qui font de YOLO11 une excellente option pour la robotique :

  • Facilité de déploiement : Il est facile à déployer et s’intègre de manière transparente à un large éventail de plateformes logicielles et matérielles.
  • Adaptabilité : YOLO11 fonctionne bien dans différents environnements et configurations matérielles, offrant des performances constantes même dans des conditions dynamiques.

Facile d'utilisation : La documentation et l'interface conviviales de YOLO11 contribuent à réduire la courbe d'apprentissage, ce qui facilite son intégration dans les systèmes robotiques.

__wf_reserved_inherit
Fig 2. Un exemple d'analyse de la pose de personnes dans une image à l'aide de YOLO11.

Exploration des tâches de vision par ordinateur rendues possibles par YOLO11

Voici un aperçu plus détaillé de certaines des tâches de vision par ordinateur prises en charge par YOLO11 : 

  • Détection d'objets : La capacité de détection d'objets en temps réel de YOLO11 permet aux robots d'identifier et de localiser instantanément les objets dans leur champ de vision. Cela aide les robots à éviter les obstacles, à effectuer une planification dynamique des trajectoires et à réaliser une navigation automatisée dans les environnements intérieurs et extérieurs.
  • Segmentation d'instance : En identifiant les limites et les formes exactes des objets individuels, YOLO11 permet aux robots d'effectuer des opérations précises de prélèvement et de placement et des tâches d'assemblage complexes.
  • Estimation de la pose : La prise en charge de l’estimation de la pose par YOLO11 permet aux robots de reconnaître et d’interpréter les mouvements et les gestes du corps humain. C’est essentiel pour que les robots collaboratifs (cobots) travaillent en toute sécurité aux côtés des humains.
  • Suivi d'objets: YOLO11 permet de suivre les objets en mouvement dans le temps, ce qui le rend idéal pour les applications liées à la robotique autonome qui doivent surveiller leur environnement en temps réel.
  • Classification d'images : YOLO11 peut classer des objets dans des images, ce qui permet aux robots de catégoriser des éléments, de détecter des anomalies ou de prendre des décisions en fonction des types d'objets, comme l'identification de fournitures médicales dans les établissements de santé.
__wf_reserved_inherit
Fig 3. Tâches de vision par ordinateur prises en charge par YOLO11.

L'IA dans les applications de robotique : Propulsé par YOLO11

De l'apprentissage intelligent à l'automatisation industrielle, des modèles comme YOLO11 peuvent aider à redéfinir ce que les robots peuvent faire. Son intégration dans la robotique démontre comment les modèles de vision par ordinateur stimulent les progrès en matière d'automatisation. Explorons quelques domaines clés où YOLO11 peut avoir un impact significatif.

Enseigner aux robots en utilisant la vision par ordinateur 

La vision par ordinateur est largement utilisée dans les robots humanoïdes, leur permettant d'apprendre en observant leur environnement. Des modèles comme YOLO11 peuvent aider à améliorer ce processus en fournissant une détection d'objets et une estimation de la pose avancées, ce qui aide les robots à interpréter avec précision les actions et les comportements humains.

En analysant les mouvements et les interactions subtiles en temps réel, les robots peuvent être entraînés à reproduire des tâches humaines complexes. Cela leur permet d'aller au-delà des routines préprogrammées et d'apprendre des tâches, comme l'utilisation d'une télécommande ou d'un tournevis, simplement en regardant une personne.

__wf_reserved_inherit
Fig 4. Un robot imitant l'action d'un humain.

Ce type d'apprentissage peut être utile dans différents secteurs. Par exemple, dans l'agriculture, les robots peuvent observer des travailleurs humains apprendre des tâches telles que la plantation, la récolte et la gestion des cultures. En copiant la façon dont les humains effectuent ces tâches, les robots peuvent s'adapter à différentes conditions agricoles sans avoir besoin d'être programmés pour chaque situation.

Applications liées à la robotique médicale

De même, dans le domaine de la santé, la vision par ordinateur prend de plus en plus d'importance. Par exemple, YOLO11 peut être utilisé dans les dispositifs médicaux pour aider les chirurgiens lors d'interventions complexes. Grâce à des fonctionnalités telles que la détection d'objets et la segmentation d'instances, YOLO11 peut aider les robots à repérer les structures internes du corps, à gérer les outils chirurgicaux et à effectuer des mouvements précis.

Bien que cela puisse ressembler à de la science-fiction, des recherches récentes démontrent l'application pratique de la vision par ordinateur dans les interventions chirurgicales. Dans une étude intéressante sur la dissection robotique autonome pour la cholécystectomie (ablation de la vésicule biliaire), des chercheurs ont intégré YOLO11 pour la segmentation des tissus (classification et séparation des différents tissus dans une image) et la détection des points clés des instruments chirurgicaux (identification de points de repère spécifiques sur les outils). 

Le système était capable de distinguer avec précision les différents types de tissus, même lorsque les tissus se déformaient (changeaient de forme) pendant la procédure, et s'adaptait dynamiquement à ces changements. Cela a permis aux instruments robotiques de suivre des trajectoires de dissection (coupe chirurgicale) précises.

Fabrication intelligente et automatisation industrielle

Les robots capables de ramasser et de placer des objets jouent un rôle clé dans l'automatisation des opérations de fabrication et l'optimisation des chaînes d'approvisionnement. Leur vitesse et leur précision leur permettent d'effectuer des tâches avec un minimum d'intervention humaine, comme l'identification et le tri des articles. 

Grâce à la segmentation d'instances précise de YOLO11, les bras robotiques peuvent être entraînés à détecter et à segmenter les objets se déplaçant sur un convoyeur, à les ramasser avec précision et à les placer aux endroits désignés en fonction de leur type et de leur taille.

Par exemple, des constructeurs automobiles populaires utilisent des robots basés sur la vision pour assembler différentes pièces automobiles, améliorant ainsi la vitesse et la précision de la chaîne de montage. Les modèles de vision par ordinateur comme YOLO11 peuvent permettre à ces robots de travailler aux côtés des travailleurs humains, assurant une intégration transparente des systèmes automatisés dans des environnements de production dynamiques. Cette avancée peut conduire à des temps de production plus rapides, à moins d'erreurs et à des produits de meilleure qualité.

__wf_reserved_inherit
Fig 5. Un bras robotique basé sur la vision assemblant une voiture.

Avantages de l'intégration d'Ultralytics YOLO11 dans la robotique

YOLO11 offre plusieurs avantages clés qui le rendent idéal pour une intégration transparente dans les systèmes de robotique autonome. Voici quelques-uns des principaux avantages :

  • Faible latence d'inférence : YOLO11 peut fournir des prédictions très précises avec une faible latence, même dans des environnements dynamiques.
  • Modèles légers : Conçus pour l'optimisation des performances, les modèles légers de YOLO11 permettent à des robots plus petits avec moins de puissance de traitement d'avoir des capacités de vision avancées sans sacrifier l'efficacité.
  • Efficacité énergétique : YOLO11 est conçu pour être économe en énergie, ce qui le rend idéal pour les robots alimentés par batterie qui doivent économiser l’énergie tout en maintenant des performances élevées.

Limites de l'IA de vision dans la robotique

Bien que les modèles de vision par ordinateur fournissent des outils puissants pour la vision robotique, il existe certaines limitations à prendre en compte lors de leur intégration dans des systèmes robotiques réels. Certaines de ces limitations incluent :

  • Collecte de données coûteuse : L'entraînement de modèles efficaces pour des tâches spécifiques à un robot nécessite souvent des ensembles de données vastes, diversifiés et bien étiquetés, qui sont coûteux à acquérir.
  • Variations environnementales : Les robots fonctionnent dans des environnements imprévisibles, où des facteurs tels que les conditions d'éclairage ou les arrière-plans encombrés peuvent affecter les performances des modèles de vision.
  • Problèmes de calibrage et d'alignement : S'assurer que les systèmes de vision sont correctement calibrés et alignés avec les autres capteurs du robot est essentiel pour des performances précises, et un mauvais alignement peut entraîner des erreurs dans la prise de décision.

L'avenir des avancées en robotique et en IA

Les systèmes de vision artificielle ne sont pas seulement des outils pour les robots d'aujourd'hui ; ils sont les éléments constitutifs d'un avenir où les robots peuvent fonctionner de manière autonome. Grâce à leurs capacités de détection en temps réel et à leur prise en charge de multiples tâches, ils sont parfaits pour la robotique de nouvelle génération.

En fait, les tendances actuelles du marché montrent que la vision par ordinateur devient de plus en plus essentielle dans la robotique. Les rapports de l'industrie soulignent que la vision par ordinateur est la deuxième technologie la plus utilisée sur le marché mondial de la robotique basée sur l'IA. 

__wf_reserved_inherit
Fig 6. Part de marché mondiale des robots d'IA par technologie.

Principaux points à retenir

Grâce à sa capacité à traiter des données visuelles en temps réel, YOLO11 peut aider les robots à détecter, identifier et interagir avec leur environnement de manière plus précise. Cela fait une énorme différence dans des domaines tels que la fabrication, où les robots peuvent collaborer avec les humains, et les soins de santé, où ils peuvent aider dans des chirurgies complexes. 

À mesure que la robotique continue de progresser, l'intégration de la vision par ordinateur dans ces systèmes sera essentielle pour permettre aux robots de gérer plus efficacement un large éventail de tâches. L'avenir de la robotique s'annonce prometteur, avec l'IA et la vision par ordinateur qui stimulent des machines encore plus intelligentes et adaptables.

Rejoignez notre communauté et consultez notre dépôt GitHub pour en savoir plus sur les développements récents en matière d'IA. Explorez diverses applications de l'IA dans le secteur de la santé et de la vision par ordinateur dans l'agriculture sur nos pages de solutions. Consultez nos plans de licence pour créer vos propres solutions de vision par ordinateur.

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement
Lien copié dans le presse-papiers