Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Comment utiliser Ultralytics YOLO11 pour la classification d'images

Abirami Vina

4 min de lecture

11 novembre 2024

Découvrez comment le nouveau modèle Ultralytics YOLO11 améliore la classification d'images, offrant une meilleure précision pour les tâches dans l'agriculture, la vente au détail et la surveillance de la faune.

Supposons qu'un robot regarde deux chats, un noir et un blanc, et qu'il doive déterminer lequel est lequel. Pour ce faire, il peut utiliser la classification d'images, une tâche de vision par ordinateur qui permet d'identifier et de catégoriser des objets ou des scènes dans une image. En fait, grâce aux récentes avancées de l'intelligence artificielle (IA), la classification d'images peut être utilisée dans une grande variété d'applications allant de la surveillance des animaux à la fabrication et à l'agriculture avec la détection des maladies des cultures.

L'une des dernières avancées en matière de classification d'images est le modèle Ultralytics YOLO11. Lancé lors de l'événement hybride annuel d'Ultralytics, YOLO Vision 2024 (YV24), YOLO11 est conçu pour s'attaquer à une grande variété de tâches de Vision IA, y compris la classification d'images, avec facilité et précision.

Dans cet article, nous explorerons les principes fondamentaux de la classification d'images, nous discuterons des applications concrètes et nous vous montrerons comment utiliser YOLO11 pour la classification d'images via le package Ultralytics Python. Nous verrons également comment vous pouvez tester les capacités de YOLO11 sur Ultralytics HUB en quelques étapes simples. Commençons !

__wf_reserved_inherit
Fig. 1. Un exemple d'utilisation d'Ultralytics YOLO11 pour classifier un chat persan.

Qu'est-ce que la classification d'images ?

La classification d'images fonctionne en attribuant une étiquette ou un tag à une image en fonction des motifs appris à partir d'images précédemment étiquetées. En analysant attentivement les pixels d'une image, un modèle de vision par ordinateur peut trouver la meilleure correspondance pour l'image. Des modèles fiables comme YOLO11 peuvent gérer ce processus de manière transparente. L'architecture du modèle YOLO11 permet de traiter des images ou des trames vidéo presque instantanément, ce qui le rend idéal pour les applications nécessitant une classification d'images rapide et précise.

Pour bien comprendre la portée de la classification d'images, il est utile de la distinguer d'autres tâches comme la détection d'objets. Alors que la classification d'images étiquette une image entière, la détection d'objets identifie et localise chaque objet dans l'image. 

__wf_reserved_inherit
Fig. 2. Une comparaison de la classification d'images, de la détection d'objets et de la segmentation d'images.

Prenons l'exemple d'une image de girafe. En classification d'images, le modèle peut simplement étiqueter l'image entière comme une girafe en se basant sur son contenu global. Cependant, avec la détection d'objets, le modèle ne se contente pas d'identifier la girafe ; il place également un cadre de délimitation autour de la girafe,Localisant son emplacement exact dans l'image.

Imaginez maintenant la girafe se tenant près d'un arbre dans une savane avec d'autres animaux. Un modèle de classification d'images pourrait étiqueter toute la scène comme une savane ou simplement comme de la faune. Cependant, avec la détection d'objets, le modèle identifierait chaque élément individuellement, reconnaissant la girafe, l'arbre et les autres animaux, chacun avec ses propres boîtes englobantes.

Applications de classification d'images YOLO11

La précision et les performances du modèle Ultralytics YOLO11 pour la classification d'images le rendent utile dans un large éventail d'industries. Explorons quelques-unes des principales applications de YOLO11 dans la classification d'images.

Classification d'images YOLO11 dans l'agriculture

La classification d'images peut aider à rationaliser de nombreuses fonctions dans l'agriculture et l'industrie agricole. Plus précisément, en utilisant des modèles de classification d'images comme YOLO11, les agriculteurs peuvent surveiller en permanence la santé de leurs cultures, détecter les maladies graves et identifier toute infestation de parasites avec une grande précision. 

Voici un aperçu du fonctionnement de ceci :

  • Capture d'images : Les appareils de l'Internet des objets (IoT) tels que les caméras et les drones peuvent être déployés pour capturer des images en temps réel des cultures sous différents angles et à différents endroits dans les champs.
  • Traitement : Selon les ressources et la connectivité disponibles, les images peuvent être traitées sur place grâce à l'informatique de périphérie ou téléchargées vers le nuage pour une analyse plus approfondie.
  • Classification d'images avec YOLO11 : Le modèle YOLO11 peut analyser ces images pour classer diverses conditions de culture. Les classes courantes peuvent inclure sain, malade, infesté de parasites ou déficient en nutriments, ce qui permet deLocaliser les problèmes spécifiques affectant différentes zones du champ.
  • Génération d'informations : Sur la base des classifications, YOLO11 fournit des informations sur les indicateurs de santé des cultures, aidant les agriculteurs à détecter les premiers signes de maladie, à identifier les points chauds de ravageurs ou à repérer les carences en nutriments.
  • Prise de décision éclairée : Grâce à ces informations, les agriculteurs peuvent prendre des décisions ciblées en matière d'irrigation, de fertilisation et de lutte antiparasitaire, en appliquant les ressources uniquement là où elles sont le plus nécessaires.
__wf_reserved_inherit
Fig 3. Un exemple de différentes classes de feuilles, de saines à infectées.

Classification d'images YOLO11 dans le commerce de détail

La classification d'images peut améliorer considérablement l'expérience d'achat au détail, la rendant plus personnalisée et conviviale. Les détaillants peuvent utiliser des modèles de vision par ordinateur entraînés sur mesure pour reconnaître les produits de leur inventaire et intégrer cette capacité dans leurs applications mobiles ou leurs sites web. Les clients peuvent alors rechercher des produits simplement en téléchargeant une photo, ce qui rend les achats plus rapides et plus pratiques.

Une fois qu'un client télécharge une image dans un système de recherche visuelle, plusieurs opérations se déroulent en arrière-plan avant que les résultats de la recherche ne s'affichent. 

Premièrement, la détection d'objets peut être utilisée pour identifier les principaux éléments de l'image, comme identifier un vêtement ou un meuble et le séparer de l'arrière-plan. Ensuite, la classification d'images peut être utilisée pour catégoriser davantage chaque élément, en reconnaissant s'il s'agit d'une veste, d'une chemise, d'un canapé ou d'une table. 

Grâce à ces informations, le système peut afficher des produits similaires disponibles à l'achat, ce qui est particulièrement utile pour trouver des articles uniques ou tendance difficiles à décrire avec des mots seuls. La même technologie peut également aider à rationaliser d'autres tâches de vente au détail, comme la gestion des stocks, en reconnaissant et en catégorisant automatiquement les articles.

__wf_reserved_inherit
Fig. 4. Une plateforme de recherche visuelle basée sur la classification d'images en action.

Surveillance de la faune avec la classification d'images YOLO11

Traditionnellement, la surveillance des animaux dans la nature est une tâche fastidieuse qui implique de nombreuses personnes triant et analysant manuellement des milliers de photos. Avec les modes de vision par ordinateur comme YOLO11, les chercheurs peuvent surveiller automatiquement les animaux à un rythme plus rapide. Des caméras peuvent être placées dans les habitats naturels pour prendre des photos. Le modèle de vision IA peut ensuite être utilisé pour analyser ces photos et classer les animaux qu'elles contiennent (le cas échéant). Un tel système peut aider les chercheurs à étudier et à suivre les populations animales, leurs schémas de migration, etc.

Une autre façon dont l'IA et les modèles de vision par ordinateur comme YOLO11 peuvent aider dans ce domaine est de rationaliser le processus de classification des espèces menacées. En identifiant les espèces potentielles ou les catégories de races auxquelles un animal peut appartenir, ces modèles peuvent fournir des données essentielles aux chercheurs. Par exemple, l'Université de Tasmanie (UTAS) a développé un système basé sur la classification d'images pour surveiller différentes espèces de la faune tasmanienne. Les prédictions des modèles peuvent ensuite aider les scientifiques et les chercheurs à surveiller l'activité et le comportement des animaux, ce qui peut signaler des menaces telles que le braconnage ou la perte d'habitat

__wf_reserved_inherit
Fig. 5. YOLO11 prédit les races possibles auxquelles un chien pourrait appartenir.

Essai de la classification d'images avec le modèle YOLO11

Maintenant que nous avons expliqué ce qu'est la classification d'images et exploré certaines de ses applications, regardons comment vous pouvez essayer la classification d'images avec le nouveau modèle YOLO11. Il existe deux façons simples de commencer : en utilisant le package Python Ultralytics ou via Ultralytics HUB. Nous allons passer en revue les deux options.

Exécution d'inférences en utilisant YOLO11

Pour commencer avec le paquet Python Ultralytics, il suffit de l'installer en utilisant pip, conda ou Docker. Si vous rencontrez des problèmes, consultez notre Guide des problèmes courants pour obtenir des conseils de dépannage utiles.

Une fois le paquet installé, vous pouvez utiliser le code suivant pour charger une variante du modèle de classification d'images YOLO11 et exécuter une inférence sur une image. Exécuter une inférence signifie utiliser un modèle entraîné pour faire des prédictions sur de nouvelles données non vues. Vous pouvez l'essayer avec une image de votre choix !

__wf_reserved_inherit
Fig. 6. Exécution d'inférences à l'aide du modèle YOLO11.

Entraînement d'un modèle de classification YOLO11 personnalisé

Vous pouvez également utiliser le même package Python pour entraîner un modèle de classification YOLO11 personnalisé. L'entraînement personnalisé vous permet de personnaliser un modèle YOLO11 pour vos besoins spécifiques. Par exemple, si vous développez une application pour classer différentes races de chats, vous pouvez entraîner un modèle YOLO11 personnalisé uniquement à cette fin.

Le code ci-dessous montre comment charger et entraîner un modèle de classification d'images YOLO11. Il vous permet de transférer des poids pré-entraînés, en utilisant les connaissances d'un modèle existant pour améliorer les performances de votre propre modèle. Vous pouvez spécifier un ensemble de données, comme l'ensemble de données "fashion-mnist", qui est un ensemble bien connu d'images en niveaux de gris d'articles vestimentaires (chemises, pantalons, chaussures, etc.). L'entraînement du modèle sur cet ensemble de données lui apprend à reconnaître différentes catégories de vêtements. Vous pouvez remplacer "fashion-mnist" par n'importe quel ensemble de données qui correspond à votre projet, comme les races de chats ou les types de plantes.

__wf_reserved_inherit
Fig. 7. Entraînement personnalisé d'un modèle YOLO11 pour la classification d'images.

Essayez YOLO11 sur Ultralytics HUB

Bien que l'utilisation du paquet Ultralytics soit simple, elle nécessite une certaine connaissance de Python. Si vous recherchez une option plus conviviale pour les débutants, vous pouvez utiliser Ultralytics HUB, une plateforme conçue pour rendre l'entraînement et le déploiement de différents modèles YOLO simples et accessibles. Pour commencer, vous devrez créer un compte.

Une fois connecté, accédez à la section "Models" et sélectionnez le modèle YOLO11 pour la classification d'images. Vous verrez une gamme de tailles de modèles disponibles : nano, small, medium, large et extra-large. Après avoir choisi un modèle, vous pouvez télécharger une image dans la section "Preview", où les prédictions apparaîtront sur le côté gauche de la page une fois l'image traitée.

__wf_reserved_inherit
Fig. 8. Utilisation d'Ultralytics HUB pour exécuter une inférence.

Principaux points à retenir

YOLO11 offre de puissantes capacités de classification d'images qui ouvrent de nouvelles possibilités dans divers secteurs. De l'amélioration de la surveillance des cultures dans l'agriculture et de l'amélioration des recherches de produits dans le commerce de détail au soutien de la conservation de la faune, la vitesse et la précision de YOLO11 le rendent idéal pour diverses applications. Grâce aux options de formation personnalisée via le package Python Ultralytics ou à une configuration conviviale sans code sur Ultralytics HUB, les utilisateurs peuvent facilement intégrer YOLO11 dans leurs flux de travail. Alors que de plus en plus de secteurs adoptent les solutions d'IA, YOLO11 offre un outil flexible et performant qui soutient l'innovation et les avancées pratiques.

Pour en savoir plus, visitez notre dépôt GitHub et échangez avec notre communauté. Explorez les applications de l'IA dans les voitures autonomes et les soins de santé sur nos pages de solutions. 🚀

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement
Lien copié dans le presse-papiers