Découvre la puissance de la classification des images dans l'IA, de la santé au commerce de détail, avec Ultralytics YOLO modèles et des outils de déploiement faciles.
La classification des images est une tâche fondamentale de la vision par ordinateur qui consiste à attribuer une étiquette ou une catégorie à l'ensemble d'une image. Ce processus permet aux machines d'identifier et de classer le sujet principal ou la scène représentée dans une image, ce qui permet une large gamme d'applications dans divers secteurs. Les modèles de classification d'images sont formés pour reconnaître les modèles et les caractéristiques des images, ce qui leur permet de classer avec précision de nouvelles images inédites en se basant sur les connaissances acquises.
La classification des images repose sur plusieurs concepts clés de l'apprentissage automatique et de l'apprentissage profond. À la base, la classification d'images implique généralement l'entraînement d'un réseau neuronal convolutif (CNN), un type de réseau neuronal particulièrement bien adapté aux données d'images. Les CNN peuvent apprendre automatiquement des représentations hiérarchiques des images grâce à des couches de filtres qui détectent des motifs de plus en plus complexes. Pendant l'apprentissage, le modèle est alimenté par un grand ensemble de données d'images étiquetées, et il ajuste ses paramètres internes pour minimiser la différence entre ses étiquettes prédites et les vraies étiquettes. Ce processus fait souvent appel à des techniques telles que l'augmentation des données, qui augmente artificiellement la taille de l'ensemble de données d'apprentissage en appliquant des transformations telles que des rotations, des retournements et des recadrages à des images existantes.
Bien que la classification d'images et la détection d'objets soient toutes deux des tâches cruciales de la vision par ordinateur, elles ont des objectifs différents. La classification d'images attribue une étiquette unique à l'ensemble d'une image, identifiant le sujet principal ou la scène. Par exemple, un modèle de classification d'images peut étiqueter une image comme "chat", "chien" ou "voiture". En revanche, la détection d'objets permet non seulement d'identifier la présence de plusieurs objets dans une image, mais aussi de les localiser à l'aide de boîtes de délimitation. Un modèle de détection d'objets peut identifier et localiser plusieurs objets dans une image, comme un chat, un chien et une voiture, chacun avec sa propre boîte de délimitation. Ultralytics Les modèlesYOLO sont capables d'effectuer à la fois des tâches de classification d'images et de détection d'objets, offrant ainsi des solutions polyvalentes pour diverses applications de vision par ordinateur. Tu peux en savoir plus sur l'évolution de ces modèles dans L'évolution de la détection d'objets et des modèles Ultralytics YOLO .
La classification des images a de nombreuses applications dans le monde réel, dans un large éventail de secteurs :
La formation d'un modèle de classification d'images comporte plusieurs étapes, notamment la collecte des données, le prétraitement, la formation du modèle et l'évaluation. Des ensembles de données étiquetées de haute qualité sont essentiels pour former des modèles précis. Une fois formés, les modèles peuvent être déployés à l'aide de diverses plateformes et outils. Ultralytics HUB fournit une plateforme conviviale pour la formation et le déploiement de modèles, y compris pour la classification d'images. Ultralytics YOLO modèles, y compris ceux de classification d'images. Ultralytics HUB simplifie le processus, permettant aux utilisateurs de gérer facilement les ensembles de données, de former des modèles et de les déployer pour des applications réelles. Tu peux en savoir plus sur l'utilisation de Ultralytics YOLO11 pour la classification d'images dans ce guide sur l'utilisation de YOLO11 pour la classification d'images. En outre, tu peux explorer les principes fondamentaux de la classification d'images et ses applications dans cette introduction à la classification d'images.
Reconnaissance d'images: Un terme plus large qui englobe à la fois la classification des images et la détection des objets, impliquant l'identification et la compréhension des objets et des scènes dans les images. En savoir plus sur la reconnaissance d'images.
Segmentation d'image: Implique la partition d'une image en plusieurs segments ou régions, chacun représentant un objet différent ou une partie d'un objet. Contrairement à la classification des images, qui attribue une seule étiquette à l'ensemble de l'image, la segmentation des images fournit une analyse plus détaillée en classant chaque pixel de l'image. En savoir plus sur la segmentation d'image.