Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Comment utiliser Ultralytics YOLO11 pour la classification d'images ?

Abirami Vina

4 min de lecture

11 novembre 2024

Découvrez comment le nouveau modèle Ultralytics YOLO11 améliore la classification des images, offrant une plus grande précision pour les tâches dans l'agriculture, le commerce de détail et la surveillance de la faune et de la flore.

Supposons qu'un robot regarde deux chats, un noir et un blanc, et qu'il doive déterminer lequel est lequel. Pour ce faire, il peut utiliser la classification d'images, une tâche de vision par ordinateur qui permet d'identifier et de catégoriser des objets ou des scènes dans une image. En fait, grâce aux récentes avancées de l'intelligence artificielle (IA), la classification d'images peut être utilisée dans une grande variété d'applications allant de la surveillance des animaux à la fabrication et à l'agriculture avec la détection des maladies des cultures.

Le modèleYOLO11 d'Ultralytics constitue l'une des dernières avancées en matière de classification d'images. Lancé lors de l'événement hybride annuel d'Ultralytics, YOLO Vision 2024 (YV24), YOLO11 est conçu pour s'attaquer avec facilité et précision à une grande variété de tâches d'IA de vision, y compris la classification d'images.

Dans cet article, nous allons explorer les principes fondamentaux de la classification des images, discuter des applications du monde réel et vous montrer comment vous pouvez utiliser YOLO11 pour la classification d'images via le packageUltralytics Python . Nous verrons également comment vous pouvez tester les capacités de YOLO11 sur le HUBUltralytics en quelques étapes simples. C'est parti !

__wf_reserved_inherit
Fig. 1. Exemple d'utilisation d'Ultralytics YOLO11 pour classify un chat persan.

Qu'est-ce que la classification d'images ?

La classification des images consiste à attribuer une étiquette à une image sur la base de modèles appris à partir d'images précédemment étiquetées. En analysant soigneusement les pixels d'une image, un modèle de vision par ordinateur peut trouver la meilleure correspondance pour l'image. Des modèles fiables comme YOLO11 peuvent gérer ce processus de manière transparente. L'architecture du modèle de YOLO11permet de traiter des images ou des trames vidéo presque instantanément, ce qui le rend idéal pour les applications nécessitant une classification rapide et précise des images.

Pour bien comprendre la portée de la classification d'images, il est utile de la distinguer d'autres tâches comme la détection d'objets. Alors que la classification d'images étiquette une image entière, la détection d'objets identifie et localise chaque objet dans l'image. 

__wf_reserved_inherit
Fig. 2. Une comparaison de la classification d'images, de la détection d'objets et de la segmentation d'images.

Prenons l'exemple d'une image de girafe. En classification d'images, le modèle peut simplement étiqueter l'image entière comme une girafe en se basant sur son contenu global. Cependant, avec la détection d'objets, le modèle ne se contente pas d'identifier la girafe ; il place également un cadre de délimitation autour de la girafe,Localisant son emplacement exact dans l'image.

Imaginez maintenant la girafe se tenant près d'un arbre dans une savane avec d'autres animaux. Un modèle de classification d'images pourrait étiqueter toute la scène comme une savane ou simplement comme de la faune. Cependant, avec la détection d'objets, le modèle identifierait chaque élément individuellement, reconnaissant la girafe, l'arbre et les autres animaux, chacun avec ses propres boîtes englobantes.

Applications de classification d'images YOLO11

La précision et les performances du modèleYOLO11 d'Ultralytics pour la classification d'images le rendent utile dans un grand nombre d'industries. Explorons quelques-unes des applications clés de YOLO11 en matière de classification d'images.

Classification des images YOLO11 dans l'agriculture

La classification des images peut contribuer à rationaliser de nombreuses fonctions dans l'industrie agricole. En particulier, grâce à des modèles de classification d'images tels que YOLO11, les agriculteurs peuvent surveiller en permanence la santé de leurs cultures, detect maladies graves et identifier les infestations de ravageurs avec une grande précision. 

Voici un aperçu du fonctionnement de ceci :

  • Capture d'images : Les appareils de l'Internet des objets (IoT) tels que les caméras et les drones peuvent être déployés pour capturer des images en temps réel des cultures sous différents angles et à différents endroits dans les champs.
  • Traitement : Selon les ressources et la connectivité disponibles, les images peuvent être traitées sur place grâce à l'informatique de périphérie ou téléchargées vers le nuage pour une analyse plus approfondie.
  • Classification des images avec YOLO11: le modèle YOLO11 peut analyser ces images pour classify différents états des cultures. Les classes les plus courantes peuvent être saines, malades, infestées de ravageurs ou déficientes en nutriments, ce qui permet d'identifier les problèmes spécifiques affectant différentes zones du champ.
  • Génération d'informations: Sur la base des classifications, YOLO11 fournit des informations sur les indicateurs de santé des cultures, aidant les agriculteurs à detect signes précoces de maladie, à identifier les foyers de ravageurs ou à repérer les carences en nutriments.
  • Prise de décision éclairée : Grâce à ces informations, les agriculteurs peuvent prendre des décisions ciblées en matière d'irrigation, de fertilisation et de lutte antiparasitaire, en appliquant les ressources uniquement là où elles sont le plus nécessaires.
__wf_reserved_inherit
Fig 3. Un exemple de différentes classes de feuilles, de saines à infectées.

YOLO11 classification d'images dans le commerce de détail

La classification d'images peut améliorer considérablement l'expérience d'achat au détail, la rendant plus personnalisée et conviviale. Les détaillants peuvent utiliser des modèles de vision par ordinateur entraînés sur mesure pour reconnaître les produits de leur inventaire et intégrer cette capacité dans leurs applications mobiles ou leurs sites web. Les clients peuvent alors rechercher des produits simplement en téléchargeant une photo, ce qui rend les achats plus rapides et plus pratiques.

Une fois qu'un client télécharge une image dans un système de recherche visuelle, plusieurs opérations se déroulent en arrière-plan avant que les résultats de la recherche ne s'affichent. 

Premièrement, la détection d'objets peut être utilisée pour identifier les principaux éléments de l'image, comme identifier un vêtement ou un meuble et le séparer de l'arrière-plan. Ensuite, la classification d'images peut être utilisée pour catégoriser davantage chaque élément, en reconnaissant s'il s'agit d'une veste, d'une chemise, d'un canapé ou d'une table. 

Grâce à ces informations, le système peut afficher des produits similaires disponibles à l'achat, ce qui est particulièrement utile pour trouver des articles uniques ou tendance difficiles à décrire avec des mots seuls. La même technologie peut également aider à rationaliser d'autres tâches de vente au détail, comme la gestion des stocks, en reconnaissant et en catégorisant automatiquement les articles.

__wf_reserved_inherit
Fig. 4. Une plateforme de recherche visuelle basée sur la classification d'images en action.

Surveillance de la faune et de la flore grâce à la classification des images YOLO11

Traditionnellement, le suivi des animaux dans la nature est une tâche fastidieuse qui implique de nombreuses personnes triant et analysant manuellement des milliers de photos. Grâce à des modes de vision par ordinateur comme YOLO11, les chercheurs peuvent surveiller automatiquement les animaux à un rythme plus rapide. Des caméras peuvent être placées dans des habitats naturels pour prendre des photos. Le modèle de vision artificielle peut ensuite être utilisé pour analyser ces photos et classify animaux qu'elles contiennent (s'il y en a). Un tel système peut aider les chercheurs à étudier et track les populations animales, leurs schémas de migration, etc.

Les modèles d'IA et de vision par ordinateur tels que YOLO11 peuvent également être utiles dans ce domaine en rationalisant le processus de classification des espèces menacées. En identifiant les espèces potentielles ou les catégories de races auxquelles un animal peut appartenir, ces modèles peuvent fournir des données essentielles aux chercheurs. Par exemple, l'université de Tasmanie (UTAS) a mis au point un système de classification d'images pour surveiller différentes espèces sauvages de Tasmanie. Les prédictions des modèles peuvent alors aider les scientifiques et les chercheurs à surveiller l'activité et le comportement des animaux, qui peuvent signaler des menaces telles que le braconnage ou la perte d'habitat

__wf_reserved_inherit
Fig. 5. YOLO11 prédit les races possibles d'un chien.

Essai de classification d'images avec le modèle YOLO11

Maintenant que nous avons expliqué ce qu'est la classification d'images et exploré certaines de ses applications, nous allons voir comment vous pouvez essayer la classification d'images avec le nouveau modèle YOLO11. Voyons comment vous pouvez essayer la classification d'images avec le nouveau modèle YOLO11 . Il y a deux façons simples de commencer : en utilisant le packageUltralytics Python ou à travers Ultralytics HUB. Nous verrons les deux options.

Effectuer des déductions avec YOLO11

Pour commencer à utiliser le package Ultralytics Python , il suffit de l'installer à l'aide de pip, conda ou Docker. Si vous rencontrez des problèmes, consultez notre Guide des problèmes courants pour obtenir des conseils de dépannage utiles.

Une fois le paquet installé, vous pouvez utiliser le code suivant pour charger une variante du modèle de classification d'images YOLO11 et exécuter une inférence sur une image. L'exécution d'une inférence consiste à utiliser un modèle entraîné pour faire des prédictions sur de nouvelles données inédites. Vous pouvez essayer avec une image de votre choix !

__wf_reserved_inherit
Fig. 6. Exécution d'inférences à l'aide du modèle YOLO11 .

Entraînement d'un modèle de classification YOLO11 personnalisé

Vous pouvez également utiliser le même paquetage Python pour entraîner un modèle de classification YOLO11 personnalisé. L'entraînement personnalisé vous permet d'affiner un modèle YOLO11 en fonction de vos besoins spécifiques. Par exemple, si vous développez une application pour classify différentes races de chats, vous pouvez entraîner un modèle YOLO11 spécialement à cette fin.

Le code ci-dessous montre comment charger et entraîner un modèle de classification d'images YOLO11 . Il vous permet de transférer des poids pré-entraînés, en utilisant les connaissances d'un modèle existant pour améliorer les performances de votre propre modèle. Vous pouvez spécifier un ensemble de données, comme l'ensemble de données "fashion-mnist", qui est un ensemble bien connu d'images en niveaux de gris d'articles vestimentaires (chemises, pantalons, chaussures, etc.). L'entraînement du modèle sur cet ensemble de données lui permet d'apprendre à reconnaître différentes catégories de vêtements. Vous pouvez remplacer "fashion-mnist" par n'importe quel ensemble de données correspondant à votre projet, comme les races de chats ou les types de plantes.

__wf_reserved_inherit
Fig. 7. Entraînement personnalisé d'un modèle YOLO11 pour la classification d'images.

Essayez YOLO11 sur Ultralytics HUB

Bien que l'utilisation du package Ultralytics soit simple, elle nécessite quelques connaissances en Python. Si vous recherchez une option plus conviviale pour les débutants, vous pouvez utiliser le HUB Ultralytics , une plateforme conçue pour rendre la formation et le déploiement de différents modèles YOLO simples et accessibles. Pour commencer, vous devez créer un compte.

Une fois connecté, accédez à la section "Modèles" et sélectionnez le modèle YOLO11 pour la classification des images. Plusieurs tailles de modèles sont disponibles : nano, petit, moyen, grand et très grand. Après avoir choisi un modèle, vous pouvez télécharger une image dans la section "Aperçu", où les prédictions apparaîtront sur le côté gauche de la page une fois l'image traitée.

__wf_reserved_inherit
Fig. 8. Utilisation d'Ultralytics HUB pour effectuer une inférence.

Principaux points à retenir

YOLO11 offre de puissantes capacités de classification d'images qui ouvrent de nouvelles possibilités dans divers secteurs d'activité. Qu'il s'agisse d'améliorer la surveillance des cultures dans l'agriculture, d'améliorer la recherche de produits dans le commerce de détail ou de soutenir la conservation de la faune, la vitesse et la précision de YOLO11en font l'outil idéal pour diverses applications. Avec des options de formation personnalisée via le package Ultralytics Python ou une installation conviviale sans code sur Ultralytics HUB, les utilisateurs peuvent facilement incorporer YOLO11 dans leurs flux de travail. Alors que de plus en plus d'industries adoptent des solutions d'IA, YOLO11 offre un outil flexible et performant qui soutient l'innovation et les avancées pratiques.

Pour en savoir plus, visitez notre dépôt GitHub et échangez avec notre communauté. Explorez les applications de l'IA dans les voitures autonomes et les soins de santé sur nos pages de solutions. 🚀

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement