YOLO Vision Shenzhen
深セン
今すぐ参加
用語集

ImageNet

深層学習の基礎となるデータセット、ImageNetを探ります。転移学習を介してImageNetがUltralytics YOLO26の高精度な画像classifyをいかに強化するのかを学びましょう。

ImageNetは、視覚オブジェクト認識ソフトウェア研究での使用のために設計された記念碑的な視覚データベースであり、現代のディープラーニング革命のきっかけとなった触媒として広く認識されています。WordNet階層に従って整理されており、ImageNetは何百万ものラベル付き画像を数千のカテゴリにわたって網羅し、洗練されたニューラルネットワークを学習させるために必要な大規模なデータを提供します。コンピュータービジョンの研究者や開発者にとって、ImageNetは、特に画像分類やオブジェクトローカリゼーションのようなタスクにおいて、アルゴリズムの性能を評価するための標準ベンチマークとして機能します。

ImageNetチャレンジとCNNの台頭

このデータセットは、2010年から2017年の間に開催された年次コンペティションであるImageNet Large Scale Visual Recognition Challenge (ILSVRC)を通じて世界的な名声を得ました。このコンテストでは、アルゴリズムに画像を1,000のカテゴリのいずれかに高いaccuracyでclassifyすることが求められました。2012年には、AlexNetとして知られる畳み込みニューラルネットワーク (CNN)アーキテクチャが競合他社よりも劇的に低いエラー率を達成し、歴史的な転換点が訪れました。この勝利は、深層ニューラルネットワークが従来特徴抽出方法よりも優れていることを示し、現在のAI時代を効果的に幕開けさせました。今日、Ultralytics YOLO26のような最先端のアーキテクチャは、これらの課題中に確立された基礎原則の上に構築され続けています。

事前学習と転移学習の役割

ImageNetの最も重要な貢献の1つは、転移学習におけるその役割です。ディープニューラルネットワークをゼロからトレーニングするには、膨大な計算リソースと大量のトレーニングデータが必要です。これを回避するため、開発者はImageNetから豊富な特徴表現を抽出することをすでに学習した「事前学習済みモデル」をよく利用します。

モデルがImageNetで事前学習されると、エッジ、テクスチャ、形状などの基本的な視覚要素を識別するよう学習します。これらの学習済みモデルウェイトは、その後、異なるタスクのために、より小規模な特定のデータセットでファインチューニングできます。このプロセスにより、開発サイクルが劇的に加速され、パフォーマンスが向上します。特に、カスタムモデルトレーニングのためにUltralytics Platformのようなツールを使用する場合に顕著です。

実際のアプリケーション

ImageNetの影響は、学術研究をはるかに超え、実用的で日常的なAIシステムにまで及んでいます。

  • 自動小売チェックアウト: セルフレジで農産物や商品を自動的に識別するシステムは、ImageNetのような大規模データセットで磨かれた分類能力に依存しています。視覚的に類似した商品(例:異なる種類のリンゴ)を区別することで、これらのシステムは小売業におけるAIを効率化します。
  • コンテンツモデレーション: ソーシャルメディアプラットフォームは、視覚認識を使用して、アップロードされた何百万もの画像を自動的にスキャンし、不適切なコンテンツを検出します。オブジェクトやシーンを認識する中核的な能力は、ImageNetカテゴリで元々トレーニングされたbackbonesから派生していることが多いです。

ImageNet vs. COCO vs. CIFAR-10

ImageNetは分類におけるゴールドスタンダードですが、他の一般的なデータセットと区別することが重要です。

  • ImageNet vs. COCO: COCO (Common Objects in Context)データセットは、物体検出segmentationの主要なベンチマークです。ImageNetが画像に「何が」あるか(classify)に焦点を当てるのに対し、COCOは物体が「どこに」あり、その正確な境界に焦点を当てます。
  • ImageNet vs. CIFAR-10: CIFAR-10は、32x32ピクセルの小さな画像で構成されるはるかに小さなデータセットです。これは迅速なプロトタイピングや教育目的でよく使用されますが、ImageNetは製品レベルのモデルにとってプロフェッショナルグレードの高解像度な課題を表します。

ImageNet 訓練済みモデルの使用

現代のAIフレームワークは、ユーザーがImageNet事前学習を簡単に活用できるようにします。以下の例は、ImageNetで事前学習されたYOLO26分類モデルをロードして画像をclassifyする方法を示しています。

from ultralytics import YOLO

# Load a YOLO26 classification model pre-trained on ImageNet
model = YOLO("yolo26n-cls.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top prediction class name
print(f"Top Class: {results[0].names[results[0].probs.top1]}")

このスニペットは、次のものを使用しています。 yolo26n-cls.pt モデルは1,000のImageNetカテゴリを学習しており、追加のトレーニングなしで入力画像の内容を即座に認識できます。

共にAIの未来を築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。