Image Classification

Explore les fondamentaux de la classification d'images, des CNN aux utilisations concrètes de l'IA. Apprends à entraîner et déployer des classifieurs de pointe avec Ultralytics YOLO26.

La classification d'images est une tâche fondamentale en computer vision (CV) où un modèle de machine learning analyse une image entière et lui attribue une étiquette unique parmi un ensemble prédéfini de catégories. Essentiellement, elle répond à la question : « Quel est le sujet principal de cette image ? » En tant que composant essentiel de l'artificial intelligence (AI), ce processus permet aux systèmes automatisés d'organiser, de catégoriser et d'interpréter des données visuelles à grande échelle. Bien que cela puisse paraître simple à l'œil humain, permettre aux ordinateurs de reconnaître des modèles nécessite des algorithmes de machine learning (ML) sophistiqués pour combler l'écart entre les pixels bruts et les concepts significatifs.

Link to this sectionLe mécanisme derrière la classification#

La classification d'images moderne repose fortement sur des architectures de deep learning (DL) appelées Convolutional Neural Networks (CNNs). Ces réseaux sont conçus pour imiter la façon dont le cortex visuel biologique traite l'information. Grâce à un processus appelé feature extraction, le modèle apprend à identifier des attributs de bas niveau comme les bords et les textures dans les premières couches, pour finalement les combiner afin de reconnaître des formes et des objets complexes dans les couches plus profondes.

Pour construire un classificateur, les développeurs utilisent le supervised learning, en alimentant le modèle avec de vastes quantités de training data contenant des exemples étiquetés. De grands jeux de données publics comme ImageNet ont joué un rôle déterminant dans l'amélioration de la précision de ces systèmes. Pendant la phase d'inférence, le modèle génère un score de probabilité pour chaque catégorie, utilisant souvent une softmax function pour déterminer la classe la plus probable.

Link to this sectionClassification vs autres tâches de vision#

Il est important de distinguer la classification d'images des capacités de computer vision associées, car le choix de la technique dépend du problème spécifique :

Classification vs Object Detection : La classification attribue une étiquette à l'image entière. En revanche, l'object detection identifie l'emplacement de plusieurs objets au sein d'une scène en dessinant une bounding box autour de chacun d'eux.
Classification vs Image Segmentation : Alors que la classification examine le contexte global, la segmentation offre une précision au niveau du pixel. La semantic segmentation classifie chaque pixel individuel, permettant une délimitation exacte des frontières entre les objets et l'arrière-plan.

Link to this sectionApplications concrètes#

La classification d'images alimente un large éventail d'real-world AI applications à travers diverses industries :

Link to this sectionDiagnostics de santé#

Dans le domaine médical, les modèles de classification assistent les radiologues en analysant les scanners diagnostiques. Les outils de medical image analysis peuvent catégoriser rapidement des radiographies ou des IRM comme « normaux » ou « anormaux », ou identifier des conditions spécifiques comme la tumor detection, permettant un triage et un diagnostic plus rapides des patients.

Link to this sectionContrôle qualité dans la fabrication#

Les usines utilisent l'inspection visuelle automatisée pour maintenir les normes de produits. Les caméras sur les lignes d'assemblage capturent des images de composants, et les modèles de classification les étiquettent instantanément comme « réussi » ou « échoué » en fonction des défauts visibles. Ce quality control automatisé garantit que seuls les articles sans défaut atteignent l'étape de l'emballage.

Link to this sectionAgriculture intelligente#

Les agriculteurs exploitent l'AI in agriculture pour surveiller la santé des cultures. En classifiant des images prises par des drones ou des smartphones, les systèmes peuvent identifier des signes de maladie, de carence nutritionnelle ou d'infestation parasitaire, permettant des interventions ciblées de precision agriculture.

Link to this sectionImplémentation de la classification avec YOLO26#

Le framework Ultralytics YOLO26, bien que célèbre pour la détection, offre des performances de pointe pour les image classification tasks. Son architecture est optimisée pour la vitesse et la précision, ce qui la rend adaptée aux applications en temps réel.

Voici un exemple concis de la manière de charger un modèle pré-entraîné et de classifier une image en utilisant le package Python ultralytics :

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")

Pour les équipes cherchant à rationaliser leur workflow, l'Ultralytics Platform simplifie l'ensemble du pipeline. Elle permet aux utilisateurs de gérer des classification datasets, d'effectuer un entraînement basé sur le cloud et de déployer des modèles vers divers formats comme ONNX ou TensorRT sans infrastructure de codage complexe.