Comment utiliser Ultralytics YOLO11 pour la classification d'images ?

Abirami Vina

4 min lire

11 novembre 2024

Découvrez comment le nouveau modèle Ultralytics YOLO11 améliore la classification des images, offrant une plus grande précision pour les tâches dans l'agriculture, le commerce de détail et la surveillance de la faune et de la flore.

Supposons qu'un robot regarde deux chats, l'un noir et l'autre blanc, et qu'il doive déterminer lequel est l'autre. Pour ce faire, il peut utiliser la classification d'images, une tâche de vision par ordinateur qui permet d'identifier et de catégoriser des objets ou des scènes dans une image. En fait, grâce aux progrès récents de l'intelligence artificielle (IA), la classification d'images peut être utilisée dans une grande variété d'applications allant de la surveillance des animaux à la fabrication et à l'agriculture avec la détection des maladies des cultures.

L'une des dernières avancées en matière de classification d'images est le modèle YOLO11 d'Ultralytics. Lancé lors de l'événement hybride annuel d'Ultralytics, YOLO Vision 2024 (YV24), YOLO11 est conçu pour s'attaquer avec facilité et précision à une grande variété de tâches d'IA Vision, y compris la classification d'images.

Dans cet article, nous allons explorer les principes fondamentaux de la classification d'images, discuter des applications du monde réel et vous montrer comment vous pouvez utiliser YOLO11 pour la classification d'images à travers le package Ultralytics Python. Nous verrons également comment vous pouvez tester les capacités de YOLO11 sur le HUB Ultralytics en quelques étapes simples. C'est parti !

__wf_reserved_inherit
Fig. 1. Exemple d'utilisation d'Ultralytics YOLO11 pour classer un chat persan.

Qu'est-ce que la classification d'images ?

La classification des images consiste à attribuer une étiquette à une image sur la base de modèles appris à partir d'images précédemment étiquetées. En analysant soigneusement les pixels d'une image, un modèle de vision par ordinateur peut trouver la meilleure correspondance pour l'image. Des modèles fiables comme YOLO11 peuvent gérer ce processus de manière transparente. L'architecture du modèle de YOLO11 permet de traiter des images ou des trames vidéo presque instantanément, ce qui le rend idéal pour les applications nécessitant une classification rapide et précise des images.

Pour bien comprendre la portée de la classification d'images, il convient de la distinguer d'autres tâches telles que la détection d'objets. Alors que la classification d'images étiquette une image entière, la détection d'objets identifie et localise chaque objet dans l'image. 

__wf_reserved_inherit
Fig. 2. Comparaison entre la classification d'images, la détection d'objets et la segmentation d'images.

Considérons l'image d'une girafe. En classification d'images, le modèle pourrait étiqueter l'image entière comme étant simplement une girafe sur la base de son contenu global. Cependant, avec la détection d'objets, le modèle ne se contente pas d'identifier la girafe ; il place également une boîte englobante autour de la girafe, en précisant son emplacement exact dans l'image.

Imaginez maintenant que la girafe se tienne près d'un arbre dans une savane avec d'autres animaux. Un modèle de classification d'images pourrait qualifier l'ensemble de la scène de savane ou de faune. Cependant, avec la détection d'objets, le modèle identifierait chaque élément individuellement, en reconnaissant la girafe, l'arbre et les autres animaux, chacun avec ses propres boîtes de délimitation.

Applications de classification d'images YOLO11

La précision et les performances du modèle YOLO11 d'Ultralytics pour la classification d'images le rendent utile dans un grand nombre d'industries. Explorons quelques-unes des applications clés de YOLO11 en matière de classification d'images.

Classification des images YOLO11 dans l'agriculture

La classification des images peut contribuer à rationaliser de nombreuses fonctions dans l'industrie agricole. En particulier, grâce à des modèles de classification d'images tels que YOLO11, les agriculteurs peuvent surveiller en permanence la santé de leurs cultures, détecter les maladies graves et identifier les infestations de ravageurs avec une grande précision. 

Voici comment cela fonctionne :

  • Capture d'images: Les dispositifs de l'Internet des objets (IdO) tels que les caméras et les drones peuvent être déployés pour capturer des images en temps réel des cultures sous différents angles et à différents endroits dans les champs.
  • Traitement: En fonction des ressources et de la connectivité disponibles, les images peuvent être traitées sur place grâce à l'informatique de pointe ou téléchargées dans le nuage pour une analyse plus intensive.
  • Classification des images avec YOLO11: le modèle YOLO11 peut analyser ces images pour classer les différents états des cultures. Les classes les plus courantes peuvent être saines, malades, infestées de ravageurs ou déficientes en nutriments, ce qui permet d'identifier les problèmes spécifiques affectant différentes zones du champ.
  • Génération d'informations: Sur la base des classifications, YOLO11 fournit des informations sur les indicateurs de santé des cultures, aidant les agriculteurs à détecter les signes précoces de maladie, à identifier les foyers de ravageurs ou à repérer les carences en nutriments.
  • Une prise de décision éclairée: Grâce à ces informations, les agriculteurs peuvent prendre des décisions ciblées en matière d'irrigation, de fertilisation et de lutte contre les parasites, en n'utilisant les ressources que là où elles sont le plus nécessaires.
__wf_reserved_inherit
Fig. 3. Exemple de différentes classes de feuilles, de saines à infectées.

YOLO11 classification d'images dans le commerce de détail

La classification d'images peut améliorer considérablement l'expérience d'achat des détaillants, en la rendant plus personnalisée et plus conviviale. Les détaillants peuvent utiliser des modèles de vision artificielle formés sur mesure pour reconnaître les produits de leur inventaire et intégrer cette capacité dans leurs applications mobiles ou leurs sites web. Les clients peuvent alors rechercher des produits en téléchargeant simplement une photo, ce qui rend les achats plus rapides et plus pratiques.

Lorsqu'un client télécharge une image dans un système de recherche visuelle, plusieurs choses se produisent en coulisses avant que les résultats de la recherche ne s'affichent. 

Tout d'abord, la détection d'objets peut être utilisée pour identifier les principaux éléments de l'image, par exemple un vêtement ou un meuble et le séparer de l'arrière-plan. Ensuite, la classification de l'image peut être utilisée pour catégoriser davantage chaque élément, en reconnaissant s'il s'agit d'une veste, d'une chemise, d'un canapé ou d'une table. 

Grâce à ces informations, le système peut retrouver des produits similaires disponibles à l'achat, ce qui est particulièrement utile pour trouver des articles uniques ou à la mode qu'il est difficile de décrire avec des mots. La même technologie peut également contribuer à rationaliser d'autres tâches du commerce de détail, comme la gestion des stocks, en reconnaissant et en classant automatiquement les articles.

__wf_reserved_inherit
Fig. 4. Une plateforme de recherche visuelle basée sur la classification des images en action.

Surveillance de la faune et de la flore grâce à la classification des images YOLO11

Traditionnellement, le suivi des animaux dans la nature est une tâche fastidieuse qui implique de nombreuses personnes triant et analysant manuellement des milliers de photos. Grâce à des modes de vision par ordinateur comme YOLO11, les chercheurs peuvent surveiller automatiquement les animaux à un rythme plus rapide. Des caméras peuvent être placées dans des habitats naturels pour prendre des photos. Le modèle de vision artificielle peut ensuite être utilisé pour analyser ces photos et classer les animaux qu'elles contiennent (s'il y en a). Un tel système peut aider les chercheurs à étudier et à suivre les populations animales, leurs schémas de migration, etc.

Les modèles d'IA et de vision par ordinateur tels que YOLO11 peuvent également être utiles dans ce domaine en rationalisant le processus de classification des espèces menacées. En identifiant les espèces potentielles ou les catégories de races auxquelles un animal peut appartenir, ces modèles peuvent fournir des données essentielles aux chercheurs. Par exemple, l'université de Tasmanie (UTAS) a mis au point un système de classification d'images pour surveiller différentes espèces sauvages de Tasmanie. Les prédictions des modèles peuvent alors aider les scientifiques et les chercheurs à surveiller l'activité et le comportement des animaux, qui peuvent signaler des menaces telles que le braconnage ou la perte d'habitat

__wf_reserved_inherit
Fig. 5. YOLO11 prédit les races possibles d'un chien.

Essai de classification d'images avec le modèle YOLO11

Maintenant que nous avons expliqué ce qu'est la classification d'images et exploré certaines de ses applications, nous allons voir comment vous pouvez essayer la classification d'images avec le nouveau modèle YOLO11. Voyons comment vous pouvez essayer la classification d'images avec le nouveau modèle YOLO11. Il y a deux façons simples de commencer : en utilisant le package Ultralytics Python ou à travers Ultralytics HUB. Nous verrons les deux options.

Effectuer des déductions avec YOLO11

Pour commencer à utiliser le package Ultralytics Python, il suffit de l'installer à l'aide de pip, conda ou Docker. Si vous rencontrez des problèmes, consultez notre Guide des problèmes courants pour obtenir des conseils de dépannage utiles.

Une fois le paquet installé, vous pouvez utiliser le code suivant pour charger une variante du modèle de classification d'images YOLO11 et exécuter une inférence sur une image. L'exécution d'une inférence consiste à utiliser un modèle entraîné pour faire des prédictions sur de nouvelles données inédites. Vous pouvez essayer avec une image de votre choix !

__wf_reserved_inherit
Fig. 6. Exécution d'inférences à l'aide du modèle YOLO11.

Entraînement d'un modèle de classification YOLO11 personnalisé

Vous pouvez également utiliser le même paquetage Python pour entraîner un modèle de classification YOLO11 personnalisé. L'entraînement personnalisé vous permet d'affiner un modèle YOLO11 en fonction de vos besoins spécifiques. Par exemple, si vous développez une application pour classer les différentes races de chats, vous pouvez entraîner un modèle YOLO11 spécialement à cette fin.

Le code ci-dessous montre comment charger et entraîner un modèle de classification d'images YOLO11. Il vous permet de transférer des poids pré-entraînés, en utilisant les connaissances d'un modèle existant pour améliorer les performances de votre propre modèle. Vous pouvez spécifier un ensemble de données, comme l'ensemble de données "fashion-mnist", qui est un ensemble bien connu d'images en niveaux de gris d'articles vestimentaires (chemises, pantalons, chaussures, etc.). L'entraînement du modèle sur cet ensemble de données lui permet d'apprendre à reconnaître différentes catégories de vêtements. Vous pouvez remplacer "fashion-mnist" par n'importe quel ensemble de données correspondant à votre projet, comme les races de chats ou les types de plantes.

__wf_reserved_inherit
Fig. 7. Entraînement personnalisé d'un modèle YOLO11 pour la classification d'images.

Essayez YOLO11 sur Ultralytics HUB

Bien que l'utilisation du package Ultralytics soit simple, elle nécessite quelques connaissances en Python. Si vous recherchez une option plus conviviale pour les débutants, vous pouvez utiliser le HUB Ultralytics, une plateforme conçue pour rendre la formation et le déploiement de différents modèles YOLO simples et accessibles. Pour commencer, vous devez créer un compte.

Une fois connecté, accédez à la section "Modèles" et sélectionnez le modèle YOLO11 pour la classification des images. Plusieurs tailles de modèles sont disponibles : nano, petit, moyen, grand et très grand. Après avoir choisi un modèle, vous pouvez télécharger une image dans la section "Aperçu", où les prédictions apparaîtront sur le côté gauche de la page une fois l'image traitée.

__wf_reserved_inherit
Fig. 8. Utilisation d'Ultralytics HUB pour effectuer une inférence.

Principaux enseignements

YOLO11 offre de puissantes capacités de classification d'images qui ouvrent de nouvelles possibilités dans divers secteurs d'activité. Qu'il s'agisse d'améliorer la surveillance des cultures dans l'agriculture, d'améliorer la recherche de produits dans le commerce de détail ou de soutenir la conservation de la faune, la vitesse et la précision de YOLO11 en font l'outil idéal pour diverses applications. Avec des options de formation personnalisée via le package Ultralytics Python ou une installation conviviale sans code sur Ultralytics HUB, les utilisateurs peuvent facilement incorporer YOLO11 dans leurs flux de travail. Alors que de plus en plus d'industries adoptent des solutions d'IA, YOLO11 offre un outil flexible et performant qui soutient l'innovation et les avancées pratiques.

Pour en savoir plus, visitez notre dépôt GitHub et participez à la vie de notre communauté. Explorez les applications de l'IA dans les voitures auto-conduites et les soins de santé sur nos pages de solutions. 🚀

Construisons ensemble le futur
de l'IA !

Commencez votre voyage avec l'avenir de l'apprentissage automatique

Commencer gratuitement
Lien copié dans le presse-papiers