ImageNet

Explore ImageNet, le jeu de données pilier du deep learning. Apprends comment il alimente Ultralytics YOLO26 via le transfert learning pour une classification d'images de haute précision.

ImageNet est une base de données visuelle monumentale conçue pour la recherche sur les logiciels de reconnaissance visuelle d'objets et est largement considérée comme le catalyseur qui a déclenché la révolution moderne du deep learning. Organisé selon la hiérarchie WordNet, ImageNet couvre des millions d'images étiquetées dans des milliers de catégories, fournissant l'échelle massive de données nécessaire pour entraîner des réseaux de neurones sophistiqués. Pour les chercheurs et les développeurs en computer vision, ImageNet sert d'étalon de référence pour évaluer la performance des algorithmes, en particulier dans des tâches comme la classification d'images et la localisation d'objets.

Link to this sectionLe challenge ImageNet et l'essor des CNN#

Le jeu de données a acquis une renommée mondiale grâce au ImageNet Large Scale Visual Recognition Challenge (ILSVRC), une compétition annuelle organisée entre 2010 et 2017. Ce concours exigeait des algorithmes qu'ils classent des images dans l'une des 1 000 catégories avec une grande précision. Un tournant historique s'est produit en 2012 lorsqu'une architecture de réseau de neurones convolutif (CNN) connue sous le nom d'AlexNet a atteint un taux d'erreur nettement inférieur à celui de ses concurrents. Cette victoire a démontré la supériorité des réseaux de neurones profonds sur les méthodes traditionnelles d' extraction de caractéristiques, lançant ainsi l'ère actuelle de l'IA. Aujourd'hui, des architectures de pointe comme Ultralytics YOLO26 continuent de s'appuyer sur les principes fondamentaux établis lors de ces défis.

Link to this sectionLe rôle du pré-entraînement et du transfer learning#

L'une des contributions les plus significatives d'ImageNet est son rôle dans le transfer learning. Entraîner un réseau de neurones profond à partir de zéro nécessite des ressources informatiques énormes et de vastes quantités de données d'entraînement. Pour contourner cela, les développeurs utilisent souvent des "modèles pré-entraînés"—des réseaux qui ont déjà appris à extraire des représentations riches de caractéristiques à partir d'ImageNet.

Lorsqu'un modèle est pré-entraîné sur ImageNet, il apprend à identifier des éléments visuels fondamentaux comme les bords, les textures et les formes. Ces poids de modèle appris peuvent ensuite être affinés sur un jeu de données plus petit et spécifique pour une tâche différente. Ce processus accélère considérablement les cycles de développement et améliore les performances, surtout lors de l'utilisation d'outils comme la plateforme Ultralytics pour l'entraînement de modèles personnalisés.

Link to this sectionApplications concrètes#

L'influence d'ImageNet s'étend bien au-delà de la recherche universitaire vers des systèmes d'IA pratiques et quotidiens :

Caisse automatique de vente au détail : Les systèmes qui identifient automatiquement les produits ou les articles à une borne de caisse automatique reposent sur des capacités de classification perfectionnées sur des jeux de données massifs comme ImageNet. En distinguant les articles visuellement similaires (par exemple, différents types de pommes), ces systèmes optimisent l'IA dans le commerce de détail.
Modération de contenu : Les plateformes de médias sociaux utilisent la reconnaissance visuelle pour scanner automatiquement des millions d'images téléchargées afin de détecter tout contenu inapproprié. La capacité fondamentale à reconnaître des objets et des scènes est souvent dérivée de backbones initialement entraînés sur les catégories d'ImageNet.

Link to this sectionImageNet vs COCO vs CIFAR-10#

Bien qu'ImageNet soit l'étalon-or pour la classification, il est important de le distinguer d'autres jeux de données populaires :

ImageNet vs COCO : Le jeu de données COCO (Common Objects in Context) est la référence principale pour la détection d'objets et la segmentation. Tandis qu'ImageNet se concentre sur "ce qu'il y a" dans l'image (classification), COCO se concentre sur "où" se trouvent les objets et leurs frontières précises.
ImageNet vs CIFAR-10 : CIFAR-10 est un jeu de données beaucoup plus petit composé de minuscules images de 32x32 pixels. Il est souvent utilisé pour le prototypage rapide ou à des fins éducatives, alors qu'ImageNet représente un défi de niveau professionnel à haute résolution pour les modèles prêts pour la production.

Link to this sectionUtiliser des modèles pré-entraînés ImageNet#

Les frameworks d'IA modernes permettent aux utilisateurs de tirer parti sans effort du pré-entraînement ImageNet. L'exemple ci-dessous montre comment charger un modèle de classification YOLO26, qui est pré-entraîné sur ImageNet, pour classifier une image.

from ultralytics import YOLO

# Load a YOLO26 classification model pre-trained on ImageNet
model = YOLO("yolo26n-cls.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top prediction class name
print(f"Top Class: {results[0].names[results[0].probs.top1]}")

Ce snippet utilise le modèle yolo26n-cls.pt, qui a appris les 1 000 catégories d'ImageNet, lui permettant de reconnaître instantanément le contenu de l'image d'entrée sans aucun entraînement supplémentaire.

ImageNet

Link to this sectionLe challenge ImageNet et l'essor des CNN#

Link to this sectionLe rôle du pré-entraînement et du transfer learning#

Link to this sectionApplications concrètes#

Link to this sectionImageNet vs COCO vs CIFAR-10#

Link to this sectionUtiliser des modèles pré-entraînés ImageNet#

Explore solutions

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

Construisons ensemble le futur de l'IA !