Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Les avantages duYOLO11 d'Ultralytics , un détecteur sans ancrage

Abirami Vina

5 min de lecture

5 décembre 2024

Comprendre comment Ultralytics YOLO11 prend en charge la détection d'objets sans ancrage et les avantages que ce modèle d'architecture apporte à diverses applications.

Si nous revenons sur l'histoire des modèles de Vision IA, le concept de détection d'objets - une tâche fondamentale de vision par ordinateur qui consiste à identifier et à localiser des objets dans une image ou une vidéo - existe depuis les années 1960. Cependant, la principale raison de son importance dans les innovations de pointe actuelles est que les techniques de détection d'objets et les architectures de modèles ont progressé et se sont rapidement améliorées depuis lors. 

Dans un article précédent, nous avons évoqué l'évolution de la détection d'objets et le chemin qui a conduit aux modèles Ultralytics YOLO . Aujourd'hui, nous allons nous concentrer sur une étape plus spécifique de ce parcours : le passage des détecteurs basés sur l'ancrage aux détecteurs sans ancrage. 

Les détecteurs basés sur des ancres s'appuient sur des boîtes prédéfinies, appelées "ancres", pour prédire où se trouvent les objets dans une image. En revanche, les détecteurs sans ancres ignorent ces boîtes prédéfinies et prédisent plutôt directement les emplacements des objets.

Si ce changement peut sembler simple et logique, il a en réalité permis d'améliorer considérablement la précision et l'efficacité de la détection d'objets. Dans cet article, nous allons comprendre comment les détecteurs sans ancrage ont remodelé la vision par ordinateur grâce à des avancées telles que Ultralytics YOLO11.

Que sont les détecteurs basés sur des ancres ?

Les détecteurs basés sur des ancres utilisent des boîtes prédéfinies, appelées ancres, pour aider à localiser les objets dans une image. Considérez ces ancres comme une grille de boîtes de différentes tailles et formes placées sur l'image. Le modèle ajuste ensuite ces boîtes pour qu'elles correspondent aux objets qu'il détecte. Par exemple, si le modèle identifie une voiture, il modifiera la boîte d'ancrage pour qu'elle corresponde plus précisément à la position et à la taille de la voiture.

Chaque ancre est associée à un objet possible dans l'image et, au cours de l'entraînement, le modèle apprend à ajuster les boîtes d'ancrage pour mieux correspondre à l'emplacement, à la taille et au rapport d'aspect de l'objet. Cela permet au modèle de detect objets à différentes échelles et orientations. Toutefois, la sélection du bon ensemble de boîtes d'ancrage peut prendre beaucoup de temps et le processus d'ajustement peut être sujet à des erreurs.

__wf_reserved_inherit
Fig 1. Qu'est-ce qu'une Anchor Box (boîte d'ancrage) ?

Bien que les détecteurs basés sur les ancres, comme YOLOv4, aient donné de bons résultats dans de nombreuses applications, ils présentent certains inconvénients. Par exemple, les boîtes d'ancrage ne s'alignent pas toujours bien avec des objets de formes ou de tailles différentes, ce qui complique la detect objets de petite taille ou de forme irrégulière. Le processus de sélection et d'ajustement de la taille des boîtes d'ancrage peut également prendre du temps et nécessiter beaucoup d'efforts manuels. En outre, les modèles basés sur les ancres ont souvent du mal à détecter les objets occultés ou qui se chevauchent, car les boîtes prédéfinies ne s'adaptent pas toujours bien à ces scénarios plus complexes.

Le passage à la détection d'objets sans ancres

Les détecteurs sans ancres ont commencé à attirer l'attention en 2018 avec des modèles comme CornerNet et CenterNet, qui ont adopté une nouvelle approche de la détection d'objets en éliminant le besoin de boîtes d'ancrage prédéfinies. Contrairement aux modèles traditionnels qui s'appuient sur des boîtes d'ancrage de différentes tailles et formes pour prédire où se trouvent les objets, les modèles sans ancres prédisent directement les emplacements des objets. Ils se concentrent sur les points clés ou les caractéristiques de l'objet, comme le centre, ce qui simplifie le processus de détection et le rend plus rapide et plus précis.

Voici comment fonctionnent généralement les modèles sans ancres :

  • Détection de points clés : Au lieu d'utiliser des boîtes prédéfinies, certains modèles identifient des points importants sur un objet, comme le centre ou des coins spécifiques. Ces points clés aident les modèles à déterminer où se trouve l'objet et quelle est sa taille.
  • Centre prédiction : Certains modèles se concentrent sur la prédiction du centre d’un objet. Une fois le centre localisé, le modèle peut prédire la taille et la position de l’objet entier à partir de là.
  • Régression de carte thermique : De nombreux modèles sans ancrage utilisent des cartes thermiques, où chaque pixel représente un emplacement possible d'un objet. Des valeurs de carte thermique plus fortes indiquent une plus grande confiance qu'un objet est présent à cet endroit.
__wf_reserved_inherit
Fig 2. Détection basée sur des ancres vs. détection sans ancres.

Comme les modèles sans ancrage ne reposent pas sur des boîtes d'ancrage, leur conception est plus simple. Cela signifie qu'ils sont plus efficaces en termes de calcul. Comme ils n'ont pas à traiter de multiples boîtes d'ancrage, ils peuvent detect objets plus rapidement - un avantage important dans les applications en temps réel telles que la conduite autonome et la vidéosurveillance. 

Les modèles sans ancrage sont également beaucoup plus efficaces pour traiter les objets de petite taille, irréguliers ou occultés. Étant donné qu'ils se concentrent sur la détection des points clés plutôt que d'essayer de s'adapter à des boîtes d'ancrage, ils sont beaucoup plus flexibles. Ils peuvent ainsi detect objets avec précision dans des environnements encombrés ou complexes où les modèles basés sur les ancres risquent d'échouer.

Ultralytics YOLO11: Un détecteur sans ancrage

Conçus à l'origine pour la rapidité et l'efficacité, les modèles YOLO sont progressivement passés des méthodes basées sur l'ancrage à la détection sans ancrage, rendant les modèles tels que YOLO11 plus rapides, plus flexibles et mieux adaptés à un large éventail d'applications en temps réel.

Voici un bref aperçu de l'évolution de la conception sans ancrage dans les différentes versions du YOLO :

  • Ultralytics YOLOv5u: Introduction de la tête Ultralytics sans ancrage, qui supprime le besoin de boîtes d'ancrage prédéfinies. Au lieu de cela, le modèle prédit directement l'emplacement des objets dans une image, ce qui simplifie le processus et améliore la flexibilité et la rapidité.
  • YOLOv6: Une nouvelle méthode appelée Anchor-Aided Training (AAT) a été utilisée, dans laquelle les ancres ne sont utilisées que pendant la formation. Cela a permis au modèle de bénéficier de la structure des méthodes basées sur les ancres pendant l'entraînement, tout en utilisant la détection sans ancres pendant l'exécution pour une meilleure vitesse et adaptabilité.
  • Ultralytics YOLOv8: Passage complet à la détection sans ancrage en utilisant la tête Ultralytics Anchor-Free Split. Cela a rendu le modèle plus rapide et plus précis, en particulier pour les objets de petite taille ou de forme étrange qui ne s'adaptent pas bien aux boîtes d'ancrage.
  • Ultralytics YOLO11: S'appuie sur l'approche sans ancrage de YOLOv8et optimise encore davantage la détection en éliminant totalement les boîtes d'ancrage. Il en résulte une détection plus rapide et plus précise pour les applications en temps réel telles que la surveillance du comportement des animaux et l'analyse de la vente au détail.
__wf_reserved_inherit
Fig. 3. Comparaison entre Ultralytics YOLOv8 et Ultralytics YOLO11.

Applications concrètes de YOLO11

Les véhicules autonomes constituent un bon exemple des avantages de la détection sans ancrage à l'aide de YOLO11 . Dans les voitures à conduite autonome, la détection rapide et précise des piétons, des autres véhicules et des obstacles est cruciale pour la sécurité. L'approche sans ancrage de YOLO11 simplifie le processus de détection en prédisant directement les points clés des objets, comme le centre d'un piéton ou les limites d'un autre véhicule, plutôt que de s'appuyer sur des boîtes d'ancrage prédéfinies. 

__wf_reserved_inherit
Fig. 4. Avantages de la détection sans ancrage dans YOLO11 (image de l'auteur).

YOLO11 n'a pas besoin d'ajuster ou d'adapter une grille d'ancrages à chaque objet, ce qui peut s'avérer lent et coûteux en termes de calcul. Au lieu de cela, il se concentre sur des caractéristiques clés, ce qui le rend plus rapide et plus efficace. Par exemple, lorsqu'un piéton se trouve sur la trajectoire d'un véhicule, YOLO11 peut rapidement identifier son emplacement en repérant des points clés, même si la personne est partiellement cachée ou en mouvement. La capacité à s'adapter à des formes et des tailles variées sans boîtes d'ancrage permet à YOLO11 de detect objets de manière plus fiable et à des vitesses plus élevées, ce qui est essentiel pour la prise de décision en temps réel dans les systèmes de conduite autonome.

D'autres applications où les capacités de YOLO11sans ancrage se distinguent vraiment sont les suivantes :

  • Commerce de détail et gestion des stocks: YOLO11 facilite le suivi des produits en rayon, même lorsqu'ils sont empilés ou partiellement bloqués. Cela permet un suivi plus rapide et plus précis des stocks et réduit les erreurs.
  • Imagerie médicale: YOLO11 est également efficace dans le domaine de la santé, où il peut detect tumeurs ou d'autres anomalies dans les scanners médicaux. Sa capacité à travailler avec des objets de forme irrégulière permet d'améliorer la précision du diagnostic de conditions complexes.
  • Surveillance de la faune: Dans le cadre de la recherche sur la faune, YOLO11 peut track animaux dans des forêts denses ou sur des terrains difficiles, aidant ainsi les chercheurs à surveiller leur comportement ou à protéger les espèces menacées.
  • Sports analytiques: YOLO11 peut être utilisé pour track joueurs, les mouvements du ballon ou d'autres éléments en temps réel lors d'événements sportifs afin de fournir des informations précieuses aux équipes, aux entraîneurs et aux diffuseurs.

Éléments à prendre en compte lorsque vous travaillez avec des modèles sans ancres

Si les modèles sans ancrage tels que YOLO11 offrent de nombreux avantages, ils présentent néanmoins certaines limites. L'une des principales considérations pratiques à prendre en compte est que même les modèles sans ancrage peuvent rencontrer des difficultés en cas d'occlusions ou d'objets se chevauchant fortement. La raison en est que la vision par ordinateur vise à reproduire la vision humaine et que, de même que nous avons parfois du mal à identifier les objets occultés, les modèles d'IA peuvent être confrontés à des difficultés similaires.

Un autre facteur intéressant est lié au traitement des prédictions du modèle. Bien que l'architecture des modèles sans ancrage soit plus simple que celle des modèles basés sur l'ancrage, un raffinement supplémentaire devient nécessaire dans certains cas. Par exemple, des techniques de post-traitement telles que la suppression non maximaleNMS peuvent être nécessaires pour nettoyer les prédictions qui se chevauchent ou pour améliorer la précision dans les scènes encombrées.

Ancrage sur l'avenir de l'IA avec YOLO11

Le passage de la détection basée sur l'ancrage à la détection sans ancrage a constitué une avancée significative dans la détection d'objets. Avec des modèles sans ancrage comme YOLO11, le processus est simplifié, ce qui permet d'améliorer à la fois la précision et la rapidité.

Grâce à YOLO11, nous avons pu constater que la détection d'objets sans ancrage excelle dans les applications en temps réel telles que les voitures autonomes, la vidéosurveillance et l'imagerie médicale, où la rapidité et la précision de la détection sont cruciales. Cette approche permet à YOLO11 de s'adapter plus facilement aux différentes tailles d'objets et aux scènes complexes, offrant ainsi de meilleures performances dans divers environnements.

À mesure que la vision par ordinateur continue d'évoluer, la détection d'objets ne fera que devenir plus rapide, plus flexible et plus efficace.

Explorez notre dépôt GitHub et rejoignez notre communauté engagée pour rester informé de tout ce qui concerne l'IA. Découvrez comment la Vision AI a un impact sur des secteurs tels que la fabrication et l'agriculture.

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement