Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Classification d'images

Découvrez la classification d'images avec Ultralytics YOLO: formez des modèles personnalisés pour la santé, l'agriculture, la vente au détail, etc. à l'aide d'outils de pointe.

La classification d'images est une tâche fondamentale en vision par ordinateur (CV) dans laquelle un modèle d'apprentissage automatique analyse une image entière et lui attribue une seule étiquette parmi un ensemble prédéfini de catégories. Elle répond essentiellement à la question « Quel est le sujet principal de cette image ? ». En tant que composante essentielle de l' intelligence artificielle (IA), ce processus permet aux systèmes automatisés d'organiser, de catégoriser et d'interpréter des données visuelles à grande échelle. Bien que cela puisse sembler simple à l'œil nu, permettre aux ordinateurs de reconnaître des modèles nécessite des algorithmes sophistiqués d' apprentissage automatique (ML) pour combler le fossé entre les pixels bruts et les concepts significatifs.

Le mécanisme derrière la classification

La classification moderne des images repose largement sur les architectures d'apprentissage profond (DL) connues sous le nom de réseaux neuronaux convolutifs (CNN). Ces réseaux sont conçus pour imiter la manière dont le cortex visuel biologique traite les informations. Grâce à un processus appelé extraction de caractéristiques, le modèle apprend à identifier des attributs de bas niveau tels que les contours et les textures dans les premières couches, pour finalement les combiner afin de reconnaître des formes et des objets complexes dans les couches plus profondes.

Pour créer un classificateur, les développeurs utilisent l' apprentissage supervisé, en alimentant le modèle avec de grandes quantités de données d'entraînement contenant des exemples étiquetés. Les grands ensembles de données publics comme ImageNet ont contribué à améliorer la précision de ces systèmes. Pendant la phase d'inférence, le modèle génère un score de probabilité pour chaque catégorie, souvent en utilisant une fonction softmax pour déterminer la classe la plus probable .

Classification vs autres tâches visuelles

Il est important de distinguer la classification d'images des capacités connexes de la vision par ordinateur, car le choix de la technique dépend du problème spécifique :

  • Classification vs détection d'objets: La classification attribue une seule étiquette à l'ensemble de l'image. En revanche, la détection d'objets identifie l'emplacement de plusieurs objets dans une scène en dessinant un cadre autour de chacun d'eux.
  • Classification vs. Segmentation d'image: Alors que la classification examine le contexte global, la segmentation offre une précision au niveau du pixel. La segmentation sémantique classe chaque pixel individuellement, permettant ainsi une délimitation exacte entre les objets et l'arrière-plan.

Applications concrètes

La classification d'images alimente un large éventail d' applications d'IA dans le monde réel, dans divers secteurs :

Diagnostic médical

Dans le domaine médical, les modèles de classification aident les radiologues en analysant les scans diagnostiques. Les outils d'analyse d'images médicales peuvent rapidement classer les radiographies ou les IRM comme « normales » ou « anormales », ou identifier des conditions spécifiques telles que la détection de tumeurs, permettant ainsi un triage et un diagnostic plus rapides des patients.

Contrôle qualité dans la fabrication

Factories utilize automated visual inspection to maintain product standards. Cameras on assembly lines capture images of components, and classification models instantly label them as "pass" or "fail" based on visible defects. This automated quality control ensures only non-defective items reach the packaging stage.

Agriculture intelligente

Les agriculteurs exploitent l'IA dans l'agriculture pour surveiller la santé des cultures. En classant les images prises par des drones ou des smartphones, les systèmes peuvent identifier les signes de maladie, de carence en nutriments ou d'infestation parasitaire, permettant ainsi des interventions agricoles de précision ciblées.

Mise en œuvre de la classification avec YOLO26

Le framework Ultralytics , bien que réputé pour la détection, offre des performances de pointe pour les tâches de classification d'images. Son architecture est optimisée pour la vitesse et la précision, ce qui le rend adapté aux applications en temps réel.

Voici un exemple concis illustrant comment charger un modèle pré-entraîné et classify image à l'aide de la fonction ultralytics Paquet Python :

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")

Pour les équipes qui cherchent à rationaliser leur flux de travail, Ultralytics simplifie l'ensemble du pipeline. Elle permet aux utilisateurs de gérer des ensembles de données de classification, d'effectuer des formations basées sur le cloud et de déployer des modèles dans divers formats tels que ONNX ou TensorRT sans infrastructure de codage étendue.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant