En cliquant sur « Accepter tous les cookies », vous acceptez le stockage de cookies sur votre appareil pour améliorer la navigation sur le site, analyser son utilisation et contribuer à nos efforts de marketing. Plus d’infos
Paramètres des cookies
En cliquant sur « Accepter tous les cookies », vous acceptez le stockage de cookies sur votre appareil pour améliorer la navigation sur le site, analyser son utilisation et contribuer à nos efforts de marketing. Plus d’infos
Découvrez le nouveau modèle Ultralytics YOLO11, ses fonctionnalités et ses applications en temps réel dans divers secteurs. Nous vous guiderons à travers tout ce que vous devez savoir.
Le lundi 30 septembre, Ultralytics a officiellement lancé Ultralytics YOLO11, la dernière avancée en matière de vision par ordinateur, suite à son lancement à YOLO Vision 2024 (YV24), l'événement hybride annuel d'Ultralytics. La communauté de l'IA est en effervescence alors qu'elle s'empresse d'explorer les capacités du modèle. Avec un traitement plus rapide, une plus grande précision et des modèles optimisés pour les appareils périphériques et le déploiement dans le cloud, YOLO11 redéfinit les possibilités dans les applications de vision par ordinateur en temps réel.
Dans une interview, le fondateur et PDG d'Ultralytics, Glenn Jocher, a déclaré : « Le monde s'oriente vers l'énergie propre, mais pas assez vite. Nous voulons que nos modèles puissent être entraînés en moins d'époques, avec moins d'augmentations et moins de données, et nous y travaillons d'arrache-pied. Le plus petit modèle de détection d'objets, YOLO11n, ne compte que 2,6 millions de paramètres, soit à peu près la taille d'un JPEG, ce qui est vraiment fou. Le plus grand modèle de détection d'objets, YOLO11x, compte environ 56 millions de paramètres, et même cela est incroyablement petit par rapport à d'autres modèles. Vous pouvez les entraîner sur un GPU bon marché, comme un GPU Nvidia vieux de cinq ans, avec juste un peu d'enthousiasme et un peu de café. »
Dans cet article, nous allons examiner de plus près YOLO11, en explorant ses caractéristiques, ses améliorations, ses benchmarks de performance et ses applications concrètes pour vous aider à comprendre ce que ce modèle peut faire. Commençons !
Comprendre YOLO11 : Améliorations par rapport aux versions précédentes
YOLO11 est la dernière avancée de la série YOLO (You Only Look Once) de modèles de vision par ordinateur, et il offre des améliorations significatives par rapport aux versions précédentes comme YOLOv5 et YOLOv8. L'équipe d'Ultralytics a intégré les commentaires de la communauté et la recherche de pointe pour rendre YOLO11 plus rapide, plus précis et plus efficace. YOLO11 prend également en charge les mêmes tâches de vision par ordinateur que YOLOv8, y compris la détection d'objets, la segmentation d'instance et la classification d'images. En fait, les utilisateurs peuvent facilement passer à YOLO11 sans avoir à modifier les flux de travail existants.
L'un des principaux atouts de YOLO11 est sa performance supérieure en termes de précision et de vitesse par rapport à ses prédécesseurs. Avec 22 % de paramètres en moins que YOLOv8m, YOLO11m atteint une précision moyenne (mAP) plus élevée sur le jeu de données COCO, ce qui signifie qu'il peut détecter les objets avec plus de précision et d'efficacité. En termes de vitesse de traitement, YOLO11 surpasse les modèles précédents, ce qui le rend idéal pour les applications en temps réel, où la détection et la réponse rapides sont essentielles, et où chaque milliseconde compte.
Le graphique de référence ci-dessous illustre comment YOLO11 se distingue des modèles précédents. Sur l'axe horizontal, il indique la précision moyenne de la boîte COCO (AP), qui mesure l'exactitude de la détection d'objets. L'axe vertical affiche la latence en utilisant TensorRT10 FP16 sur un GPU NVIDIA T4, indiquant la vitesse à laquelle le modèle traite les données.
Fig. 1. YOLO11 fournit des capacités de détection d'objets en temps réel à la pointe de la technologie.
Lancement du modèle YOLO11 : Options open source et entreprise
Pour la première fois, Ultralytics présente des modèles entreprise, marquant une étape importante dans nos offres de produits, et nous sommes ravis de partager ces nouvelles innovations avec nos utilisateurs. YOLO11 introduit cinq modèles propriétaires conçus spécifiquement pour les cas d'utilisation commerciaux. Ces modèles d'entreprise, qui seront disponibles le mois prochain, sont entraînés sur le nouveau jeu de données propriétaire d'Ultralytics, composé de plus d'un million d'images, offrant des modèles pré-entraînés plus robustes. Ils sont conçus pour des applications exigeantes du monde réel, telles que l'analyse d'imagerie médicale et le traitement d'images satellite, où la détection précise d'objets est cruciale.
Exploration des fonctionnalités YOLO11 de nouvelle génération
Maintenant que nous avons discuté de ce que YOLO11 offre, regardons ce qui rend YOLO11 si spécial.
L'un des principaux défis du développement de YOLO11 a été de trouver le juste équilibre entre des priorités concurrentes : rendre les modèles plus petits, plus rapides et plus précis. Comme l'a expliqué Glenn Jocher, fondateur et PDG d'Ultralytics, « Travailler sur la recherche et le développement de YOLO est vraiment difficile, car vous voulez aller dans trois directions différentes : vous voulez rendre les modèles plus petits, vous voulez qu'ils soient plus précis, mais vous voulez aussi qu'ils soient plus rapides sur différentes plateformes comme le CPU et le GPU. Tous ces intérêts sont concurrents, vous devez donc faire des compromis et choisir où apporter des changements. » Malgré ces défis, YOLO11 atteint un équilibre impressionnant, offrant à la fois des améliorations de vitesse et de précision par rapport aux versions précédentes comme YOLOv8.
Fig 3. Un exemple d'utilisation de YOLO11 pour la détection d'objets.
YOLO11 apporte des améliorations substantielles telles qu’une extraction de caractéristiques améliorée grâce à une architecture dorsale et de cou remaniée, ce qui permet une détection d’objets plus précise. Le modèle est également optimisé pour la vitesse et l’efficacité, offrant des temps de traitement plus rapides tout en conservant une grande précision. En plus de ces avantages, YOLO11 est très adaptable à différents environnements, fonctionnant de manière transparente sur les appareils périphériques, les plateformes cloud et les systèmes utilisant des GPU NVIDIA. Cette adaptabilité en fait un choix idéal pour les utilisateurs qui ont besoin d’options de déploiement flexibles sur diverses configurations matérielles, des appareils mobiles aux serveurs à grande échelle.
Applications YOLO11 en temps réel
La polyvalence de YOLO11 en fait un outil fiable dans de nombreux secteurs, en particulier lorsqu'il s'agit de cas d'utilisation complexes. Par exemple, il fonctionne de manière transparente sur les appareils périphériques et peut être utilisé pour des applications nécessitant une analyse en temps réel dans des environnements où la puissance de calcul est limitée. Un excellent exemple en est la conduite autonome, où les véhicules doivent prendre des décisions en une fraction de seconde pour assurer la sécurité de tous. YOLO11 aide à détecter et à analyser les objets sur la route, comme les piétons ou les autres voitures, même dans des conditions difficiles, comme une faible luminosité ou lorsque les choses sont partiellement cachées. Une détection rapide et précise aide à prévenir les accidents et garantit que les véhicules autonomes peuvent se déplacer en toute sécurité.
Fig 4. Glenn Jocher sur scène à YV24, parlant des applications de YOLO11.
Un autre exemple intéressant de la portée de YOLO11 est sa capacité à gérer les boîtes englobantes orientées (OBB). Il est essentiel pour détecter les objets qui ne sont pas parfaitement alignés. La détection d'objets OBB est une fonctionnalité particulièrement utile dans des secteurs tels que l'agriculture, la cartographie et la surveillance, où les images contiennent souvent des objets pivotés comme des cultures ou des bâtiments dans l'imagerie aérienne ou satellitaire. Contrairement aux modèles traditionnels, YOLO11 peut identifier les objets sous n'importe quel angle et fournir des résultats beaucoup plus précis pour les tâches qui nécessitent de la précision.
YOLO11 pour les développeurs en IA : Essayez-le vous-même
Démarrer avec YOLO11 est simple et accessible, que vous préfériez le codage ou une option sans code. Pour travailler avec YOLO11 par le biais du code, vous pouvez utiliser le paquet Python Ultralytics pour entraîner et déployer facilement des modèles. Si vous préférez une approche sans code, Ultralytics HUB vous permet d'essayer YOLO11 en quelques clics.
Présentation du code YOLO11
Pour utiliser YOLO11 avec Python, vous devrez d'abord installer le package Ultralytics. Selon vos préférences, vous pouvez le faire en utilisant pip, conda ou Docker. Pour des instructions détaillées et les meilleures pratiques relatives au processus d'installation, assurez-vous de consulter notre Guide d'installation d'Ultralytics. Lors de l'installation des packages requis pour YOLO11, si vous rencontrez des difficultés, consultez notre Guide des problèmes courants pour obtenir des solutions et des conseils.
Fig 5. Utilisation de YOLO11 via le package Ultralytics.
Pour les utilisateurs qui préfèrent une approche sans code, Ultralytics HUB offre un moyen facile d'entraîner et de déployer des modèles YOLO11 en quelques clics. Pour commencer avec HUB, créez simplement un compte sur la plateforme Ultralytics HUB, et vous pouvez commencer à entraîner et à gérer vos modèles via une interface intuitive.
YOLO11 : Façonner l'avenir de la vision IA
La communauté de l'IA fait constamment progresser le domaine de la vision par ordinateur en s'efforçant de développer des modèles plus rapides et plus précis pour les applications du monde réel. Ultralytics YOLO11 est une étape importante dans cet effort, apportant une vitesse, une précision et une flexibilité améliorées. Il est conçu pour les applications en temps réel et en périphérie, ce qui le rend idéal pour des secteurs tels que la santé et la conduite autonome. Que vous utilisiez le package Python Ultralytics ou Ultralytics Hub sans code, YOLO11 simplifie les tâches complexes de vision par l'IA. Il offre de puissantes capacités de vision par ordinateur, ce qui en fait un excellent choix pour les développeurs et les entreprises.