深層学習の基礎となるデータセット、ImageNetを探ります。転移学習を介してImageNetがUltralytics YOLO26の高精度な画像classifyをいかに強化するのかを学びましょう。
ImageNetは、視覚オブジェクト認識ソフトウェア研究での使用のために設計された記念碑的な視覚データベースであり、現代のディープラーニング革命のきっかけとなった触媒として広く認識されています。WordNet階層に従って整理されており、ImageNetは何百万ものラベル付き画像を数千のカテゴリにわたって網羅し、洗練されたニューラルネットワークを学習させるために必要な大規模なデータを提供します。コンピュータービジョンの研究者や開発者にとって、ImageNetは、特に画像分類やオブジェクトローカリゼーションのようなタスクにおいて、アルゴリズムの性能を評価するための標準ベンチマークとして機能します。
このデータセットは、2010年から2017年の間に開催された年次コンペティションであるImageNet Large Scale Visual Recognition Challenge (ILSVRC)を通じて世界的な名声を得ました。このコンテストでは、アルゴリズムに画像を1,000のカテゴリのいずれかに高いaccuracyでclassifyすることが求められました。2012年には、AlexNetとして知られる畳み込みニューラルネットワーク (CNN)アーキテクチャが競合他社よりも劇的に低いエラー率を達成し、歴史的な転換点が訪れました。この勝利は、深層ニューラルネットワークが従来特徴抽出方法よりも優れていることを示し、現在のAI時代を効果的に幕開けさせました。今日、Ultralytics YOLO26のような最先端のアーキテクチャは、これらの課題中に確立された基礎原則の上に構築され続けています。
ImageNetの最も重要な貢献の1つは、転移学習におけるその役割です。ディープニューラルネットワークをゼロからトレーニングするには、膨大な計算リソースと大量のトレーニングデータが必要です。これを回避するため、開発者はImageNetから豊富な特徴表現を抽出することをすでに学習した「事前学習済みモデル」をよく利用します。
モデルがImageNetで事前学習されると、エッジ、テクスチャ、形状などの基本的な視覚要素を識別するよう学習します。これらの学習済みモデルウェイトは、その後、異なるタスクのために、より小規模な特定のデータセットでファインチューニングできます。このプロセスにより、開発サイクルが劇的に加速され、パフォーマンスが向上します。特に、カスタムモデルトレーニングのためにUltralytics Platformのようなツールを使用する場合に顕著です。
ImageNetの影響は、学術研究をはるかに超え、実用的で日常的なAIシステムにまで及んでいます。
ImageNetは分類におけるゴールドスタンダードですが、他の一般的なデータセットと区別することが重要です。
現代のAIフレームワークは、ユーザーがImageNet事前学習を簡単に活用できるようにします。以下の例は、ImageNetで事前学習されたYOLO26分類モデルをロードして画像をclassifyする方法を示しています。
from ultralytics import YOLO
# Load a YOLO26 classification model pre-trained on ImageNet
model = YOLO("yolo26n-cls.pt")
# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the top prediction class name
print(f"Top Class: {results[0].names[results[0].probs.top1]}")
このスニペットは、次のものを使用しています。 yolo26n-cls.pt モデルは1,000のImageNetカテゴリを学習しており、追加のトレーニングなしで入力画像の内容を即座に認識できます。

未来の機械学習で、新たな一歩を踏み出しましょう。