Découvrez la classification d'images avec Ultralytics YOLO: formez des modèles personnalisés pour la santé, l'agriculture, la vente au détail, etc. à l'aide d'outils de pointe.
La classification d'images est une tâche fondamentale en vision par ordinateur (CV) dans laquelle un modèle d'apprentissage automatique analyse une image entière et lui attribue une seule étiquette parmi un ensemble prédéfini de catégories. Elle répond essentiellement à la question « Quel est le sujet principal de cette image ? ». En tant que composante essentielle de l' intelligence artificielle (IA), ce processus permet aux systèmes automatisés d'organiser, de catégoriser et d'interpréter des données visuelles à grande échelle. Bien que cela puisse sembler simple à l'œil nu, permettre aux ordinateurs de reconnaître des modèles nécessite des algorithmes sophistiqués d' apprentissage automatique (ML) pour combler le fossé entre les pixels bruts et les concepts significatifs.
La classification moderne des images repose largement sur les architectures d'apprentissage profond (DL) connues sous le nom de réseaux neuronaux convolutifs (CNN). Ces réseaux sont conçus pour imiter la manière dont le cortex visuel biologique traite les informations. Grâce à un processus appelé extraction de caractéristiques, le modèle apprend à identifier des attributs de bas niveau tels que les contours et les textures dans les premières couches, pour finalement les combiner afin de reconnaître des formes et des objets complexes dans les couches plus profondes.
Pour créer un classificateur, les développeurs utilisent l' apprentissage supervisé, en alimentant le modèle avec de grandes quantités de données d'entraînement contenant des exemples étiquetés. Les grands ensembles de données publics comme ImageNet ont contribué à améliorer la précision de ces systèmes. Pendant la phase d'inférence, le modèle génère un score de probabilité pour chaque catégorie, souvent en utilisant une fonction softmax pour déterminer la classe la plus probable .
Il est important de distinguer la classification d'images des capacités connexes de la vision par ordinateur, car le choix de la technique dépend du problème spécifique :
La classification d'images alimente un large éventail d' applications d'IA dans le monde réel, dans divers secteurs :
Dans le domaine médical, les modèles de classification aident les radiologues en analysant les scans diagnostiques. Les outils d'analyse d'images médicales peuvent rapidement classer les radiographies ou les IRM comme « normales » ou « anormales », ou identifier des conditions spécifiques telles que la détection de tumeurs, permettant ainsi un triage et un diagnostic plus rapides des patients.
Factories utilize automated visual inspection to maintain product standards. Cameras on assembly lines capture images of components, and classification models instantly label them as "pass" or "fail" based on visible defects. This automated quality control ensures only non-defective items reach the packaging stage.
Les agriculteurs exploitent l'IA dans l'agriculture pour surveiller la santé des cultures. En classant les images prises par des drones ou des smartphones, les systèmes peuvent identifier les signes de maladie, de carence en nutriments ou d'infestation parasitaire, permettant ainsi des interventions agricoles de précision ciblées.
Le framework Ultralytics , bien que réputé pour la détection, offre des performances de pointe pour les tâches de classification d'images. Son architecture est optimisée pour la vitesse et la précision, ce qui le rend adapté aux applications en temps réel.
Voici un exemple concis illustrant comment charger un modèle pré-entraîné et classify image à l'aide de la fonction
ultralytics Paquet Python :
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")
# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")
Pour les équipes qui cherchent à rationaliser leur flux de travail, Ultralytics simplifie l'ensemble du pipeline. Elle permet aux utilisateurs de gérer des ensembles de données de classification, d'effectuer des formations basées sur le cloud et de déployer des modèles dans divers formats tels que ONNX ou TensorRT sans infrastructure de codage étendue.