Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024

Comparaison entre Ultralytics YOLO11 et les modèles YOLO précédents

Abirami Vina

4 min de lecture

2 avril 2025

Comparez Ultralytics YOLOv8, YOLOv9, YOLOv10 et Ultralytics YOLO11 pour comprendre comment ces modèles ont évolué et se sont améliorés de 2023 à 2025.

De l'automatisation des tâches quotidiennes à l'aide à la prise de décisions éclairées en temps réel, l'intelligence artificielle (IA) remodèle l'avenir de divers secteurs. Un domaine particulièrement fascinant de l'IA est la vision par ordinateur, également connue sous le nom de Vision AI. Elle se concentre sur la capacité des machines à analyser et à interpréter les données visuelles comme le font les humains. 

Plus précisément, les modèles de vision par ordinateur sont à l'origine d'innovations qui améliorent à la fois la sécurité et l'efficacité. Par exemple, ces modèles sont utilisés dans les voitures autonomes pour détecter les piétons et dans les caméras de sécurité pour surveiller les locaux 24 heures sur 24. 

Parmi les modèles de vision par ordinateur les plus connus, on trouve les modèles YOLO (You Only Look Once), réputés pour leurs capacités de détection d'objets en temps réel. Au fil du temps, les modèles YOLO se sont améliorés, chaque nouvelle version offrant de meilleures performances et une plus grande flexibilité.

Les versions plus récentes comme Ultralytics YOLO11 peuvent gérer diverses tâches, comme la segmentation d'instances, la classification d'images, l'estimation de pose et le suivi multi-objets, avec une meilleure précision, rapidité et exactitude que jamais.

Dans cet article, nous comparerons Ultralytics YOLOv8, YOLOv9, YOLOv10 et Ultralytics YOLO11 afin de mieux comprendre l'évolution de ces modèles. Nous analyserons leurs principales caractéristiques, les résultats des benchmarks et les différences de performance. Commençons !

Présentation d'Ultralytics YOLOv8

YOLOv8, lancé par Ultralytics le 10 janvier 2023, a constitué une avancée majeure par rapport aux modèles YOLO précédents. Il est optimisé pour une détection précise en temps réel, combinant des approches éprouvées avec des mises à jour innovantes pour de meilleurs résultats.

Au-delà de la détection d'objets, il prend également en charge les tâches de vision par ordinateur suivantes : la segmentation d'instances, l'estimation de pose, la détection d'objets par boîtes englobantes orientées (OBB) et la classification d'images. Une autre caractéristique importante de YOLOv8 est qu'il est disponible en cinq variantes de modèles différents - Nano, Small, Medium, Large et X - vous pouvez ainsi choisir le juste équilibre entre vitesse et précision en fonction de vos besoins.

Grâce à sa polyvalence et à ses performances élevées, YOLOv8 peut être utilisé dans de nombreuses applications du monde réel, telles que les systèmes de sécurité, les villes intelligentes, les soins de santé et l'automatisation industrielle.

__wf_reserved_inherit
Fig 1. Gestion du stationnement dans les villes intelligentes avec YOLOv8.

Principales caractéristiques de YOLOv8

Voici un aperçu de certaines des autres caractéristiques clés de YOLOv8 :

  • Architecture de détection améliorée : YOLOv8 utilise un backbone CSPDarknet amélioré. Ce backbone est optimisé pour l’extraction de caractéristiques, c’est-à-dire le processus d’identification et de capture des modèles ou des détails importants des images d’entrée qui aident le modèle à faire des prédictions précises.

  • Tête de détection : Elle utilise une conception découplée sans ancrage, ce qui signifie qu'elle ne s'appuie pas sur des formes de boîtes englobantes prédéfinies (ancres) et qu'elle apprend plutôt à prédire directement les emplacements des objets. En raison de la configuration découplée, les tâches de classification de ce qu'est l'objet et de prédiction de son emplacement (régression) sont traitées séparément, ce qui contribue à améliorer la précision et à accélérer l'entraînement.

  • Équilibre la précision et la vitesse : Ce modèle atteint une précision impressionnante tout en maintenant des temps d'inférence rapides, ce qui le rend adapté aux environnements cloud et edge.

  • Facile d'utilisation : YOLOv8 est conçu pour être facile à prendre en main - vous pouvez commencer à faire des prédictions et à voir des résultats en quelques minutes seulement en utilisant le package Python Ultralytics.

YOLOv9 se concentre sur l'efficacité computationnelle

YOLOv9 a été lancé le 21 février 2024 par Chien-Yao Wang et Hong-Yuan Mark Liao de l’Institute of Information Science, Academia Sinica, Taiwan. Il prend en charge des tâches telles que la détection d'objets et la segmentation d'instances

Ce modèle s'appuie sur Ultralytics YOLOv5 et introduit deux innovations majeures : Programmable Gradient Information (PGI) et Generalized Efficient Layer Aggregation Network (GELAN). 

PGI aide YOLOv9 à conserver les informations importantes lors du traitement des données à travers ses couches, ce qui conduit à des résultats plus précis. Pendant ce temps, GELAN améliore la façon dont le modèle utilise ses couches, augmentant ainsi les performances et l'efficacité computationnelle. Grâce à ces améliorations, YOLOv9 peut gérer les tâches en temps réel sur les appareils périphériques et les applications mobiles, où les ressources informatiques sont souvent limitées.

__wf_reserved_inherit
Fig. 2. Comprendre comment GELAN améliore la précision de YOLOv9.

Principales caractéristiques de YOLOv9

Voici un aperçu de certaines des autres caractéristiques clés de YOLOv8 :

  • Haute précision et efficacité : YOLOv9 offre une grande précision de détection sans consommer beaucoup de puissance de calcul, ce qui en fait un excellent choix lorsque les ressources sont limitées.
  • Modèles légers : Les variantes de modèles légers de YOLOv9 sont optimisées pour les déploiements périphériques et mobiles. 
  • Facile à utiliser : YOLOv9 est pris en charge par le package Ultralytics Python, il est donc simple à configurer et à exécuter dans différents environnements, que vous utilisiez du code ou la ligne de commande.

YOLOv10 permet la détection d'objets sans NMS

YOLOv10 a été introduit le 23 mai 2024 par des chercheurs de l'université de Tsinghua et se concentre sur la détection d'objets en temps réel. Il s'attaque aux limitations des versions antérieures de YOLO en supprimant le besoin de suppression non maximale (NMS), une étape de post-traitement utilisée pour éliminer les détections en double, et en affinant la conception globale du modèle. Il en résulte une détection d'objets plus rapide et plus efficace, tout en conservant une précision de pointe.

Un élément essentiel qui rend cela possible est une approche d'entraînement appelée affectations cohérentes de double étiquette. Elle combine deux stratégies : l'une qui permet à plusieurs prédictions d'apprendre du même objet (un-à-plusieurs) et l'autre qui se concentre sur le choix de la meilleure prédiction unique (un-à-un). Étant donné que les deux stratégies suivent les mêmes règles de correspondance, le modèle apprend à éviter les doublons de lui-même, de sorte que NMS n'est pas nécessaire.

__wf_reserved_inherit
Fig 3. YOLOv10 utilise des affectations de double étiquette cohérentes pour l'entraînement sans NMS.

L'architecture de YOLOv10 utilise également un backbone CSPNet amélioré pour apprendre les caractéristiques plus efficacement et un neck PAN (Path Aggregation Network) qui combine les informations provenant de différentes couches, ce qui le rend plus performant pour détecter les petits et les grands objets. Ces améliorations permettent d'utiliser YOLOv10 pour des applications réelles dans la fabrication, la vente au détail et la conduite autonome.

Principales caractéristiques de YOLOv10

Voici quelques-unes des autres caractéristiques remarquables de YOLOv10 :

  • Convolutions à grand noyau : Le modèle utilise des convolutions à grand noyau pour capturer plus de contexte à partir de zones plus larges de l'image, ce qui l'aide à mieux comprendre la scène globale.
  • Modules d'auto-attention partielle : Le modèle intègre des modules d'auto-attention partielle pour se concentrer sur les parties les plus importantes de l'image sans utiliser trop de puissance de calcul, ce qui améliore efficacement les performances.
  • Variante de modèle unique : Outre les tailles habituelles de YOLOv10 (Nano, Small, Medium, Large et X), il existe également une version spéciale appelée YOLOv10b (Balanced). Il s'agit d'un modèle plus large, ce qui signifie qu'il traite plus de caractéristiques à chaque couche, ce qui contribue à améliorer la précision tout en équilibrant la vitesse et la taille.
  • Facile d'utilisation : YOLOv10 est compatible avec le package Python Ultralytics, ce qui le rend facile à utiliser.

Ultralytics YOLO11 : Vitesse et précision améliorées

Cette année, le 30 septembre, Ultralytics a officiellement lancé YOLO11, l'un des derniers modèles de la série YOLO, lors de son événement hybride annuel, YOLO Vision 2024 (YV24).

Cette version a introduit des améliorations significatives par rapport aux versions précédentes. YOLO11 est plus rapide, plus précis et très efficace. Il prend en charge toute la gamme de tâches de vision par ordinateur que les utilisateurs de YOLOv8 connaissent bien, notamment la détection d'objets, la segmentation d'instances et la classification d'images. Il maintient également la compatibilité avec les flux de travail YOLOv8, ce qui permet aux utilisateurs de passer facilement à la nouvelle version.

De plus, YOLO11 est conçu pour répondre à un large éventail de besoins informatiques, des appareils périphériques légers aux puissants systèmes cloud. Le modèle est disponible en versions open source et entreprise, ce qui le rend adaptable à différents cas d'utilisation.

C'est une excellente option pour les tâches de précision comme l'imagerie médicale et la détection par satellite, ainsi que pour des applications plus larges dans les véhicules autonomes, l'agriculture et les soins de santé.

__wf_reserved_inherit
Fig 4. Utilisation d'Ultralytics YOLO11 pour détecter, compter et suivre le trafic.

Principales caractéristiques de YOLO11

Voici quelques-unes des autres caractéristiques uniques de YOLO11 :

  • Détection rapide et efficace : YOLO11 dispose d'une tête de détection conçue pour une latence minimale, en se concentrant sur la vitesse dans les couches de prédiction finales sans compromettre les performances.
  • Amélioration de l'extraction des caractéristiques : Une architecture dorsale et de cou optimisée améliore l'extraction des caractéristiques, conduisant à des prédictions plus précises. 
  • Déploiement transparent sur toutes les plateformes : YOLO11 est optimisé pour fonctionner efficacement sur les appareils edge, les plateformes cloud et les GPU NVIDIA, assurant ainsi une adaptabilité dans différents environnements.

Benchmarking des modèles YOLO sur le jeu de données COCO

Lors de l'exploration de différents modèles, il n'est pas toujours facile de les comparer simplement en regardant leurs caractéristiques. C'est là qu'intervient l'évaluation comparative. En exécutant tous les modèles sur le même jeu de données, nous pouvons mesurer et comparer objectivement leurs performances. Examinons les performances de chaque modèle sur le jeu de données COCO.

Lors de la comparaison des modèles YOLO, chaque nouvelle version apporte des améliorations notables en termes de précision, de vitesse et de flexibilité. En particulier, YOLO11m fait un bond en avant ici car il utilise 22 % moins de paramètres que YOLOv8m, ce qui signifie qu'il est plus léger et plus rapide à exécuter. De plus, malgré sa plus petite taille, il atteint une précision moyenne (mAP) plus élevée sur le jeu de données COCO. Cette métrique mesure la qualité de la détection et de la localisation des objets par le modèle, de sorte qu'une mAP plus élevée signifie des prédictions plus précises. 

__wf_reserved_inherit
Fig 5. Évaluation comparative de YOLO11 et d'autres modèles YOLO sur l'ensemble de données COCO.

Test et comparaison de modèles YOLO sur une vidéo

Voyons comment ces modèles se comportent dans une situation réelle.

Pour comparer YOLOv8, YOLOv9, YOLOv10 et YOLO11, les quatre ont été exécutés sur la même vidéo de trafic en utilisant un score de confiance de 0,3 (le modèle n'affiche les détections que lorsqu'il est sûr à au moins 30 % d'avoir correctement identifié un objet) et une taille d'image de 640 pour une évaluation équitable. Les résultats de la détection et du suivi d'objets ont mis en évidence les principales différences en termes de précision de la détection, de vitesse et de précision. 

Dès la première image, YOLO11 a détecté de gros véhicules comme des camions que YOLOv10 avait manqués. YOLOv8 et YOLOv9 ont montré des performances correctes, mais variables en fonction des conditions d'éclairage et de la taille des objets. Les véhicules plus petits et éloignés sont restés un défi pour tous les modèles, bien que YOLO11 ait montré des améliorations notables dans ces détections également.

__wf_reserved_inherit
Fig 6. Comparaison de YOLOv8, YOLOv9, YOLOv10 et YOLO11.

En termes de vitesse, tous les modèles fonctionnaient entre 10 et 20 millisecondes par image, assez rapidement pour gérer des tâches en temps réel à plus de 50 FPS. D'une part, YOLOv8 et YOLOv9 ont fourni des détections stables et fiables tout au long de la vidéo. Il est intéressant de noter que YOLOv10, conçu pour une latence plus faible, était plus rapide mais a montré quelques incohérences dans la détection de certains types d'objets. 

YOLO11, quant à lui, s'est distingué par sa précision, offrant un équilibre solide entre vitesse et exactitude. Bien qu'aucun des modèles n'ait fonctionné parfaitement dans chaque image, la comparaison côte à côte a clairement démontré que YOLO11 offrait les meilleures performances globales. 

Quel modèle YOLO est le meilleur pour les tâches de vision par ordinateur ?

La sélection d'un modèle pour un projet dépend de ses exigences spécifiques. Par exemple, certaines applications peuvent privilégier la vitesse, tandis que d'autres peuvent nécessiter une plus grande précision ou être confrontées à des contraintes de déploiement qui influencent la décision. 

Un autre facteur important est le type de tâches de vision par ordinateur que vous devez traiter. Si vous recherchez une plus grande flexibilité pour différentes tâches, YOLOv8 et YOLO11 sont de bonnes options.

Le choix entre YOLOv8 et YOLO11 dépend vraiment de vos besoins. YOLOv8 est une option solide si vous débutez dans la vision par ordinateur et que vous accordez de l'importance à une communauté plus large, à davantage de tutoriels et à de vastes intégrations tierces

D'autre part, si vous recherchez des performances de pointe avec une meilleure précision et une plus grande vitesse, YOLO11 est le meilleur choix, bien qu'il soit livré avec une communauté plus petite et moins d'intégrations en raison de sa sortie plus récente.

Principaux points à retenir

De Ultralytics YOLOv8 à Ultralytics YOLO11, l'évolution de la série de modèles YOLO reflète une volonté constante de créer des modèles de vision par ordinateur plus intelligents. Chaque version de YOLO apporte des améliorations significatives en termes de vitesse, de précision et d'exactitude. 

À mesure que la vision artificielle continue de progresser, ces modèles offrent des solutions fiables aux défis du monde réel, de la détection d'objets aux systèmes autonomes. Le développement continu des modèles YOLO montre le chemin parcouru par le domaine et tout ce que nous pouvons attendre à l'avenir.

Pour en savoir plus sur l'IA, consultez notre dépôt GitHub et échangez avec notre communauté. Découvrez les avancées dans divers secteurs, de l'IA de vision dans la fabrication à la vision par ordinateur dans le secteur de la santé. Consultez nos options de licence pour démarrer vos projets d'IA de vision dès aujourd'hui.

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement
Lien copié dans le presse-papiers