YOLO Vision Shenzhen
深セン
今すぐ参加
用語集

転移学習

少ないデータで高精度AIをトレーニングするための転移学習を探ります。Ultralytics YOLO26の事前学習済み重みを活用して、コンピュータービジョンプロジェクトを加速する方法を学びましょう。

転移学習は、特定のタスクのために開発されたモデルを、2番目の関連タスクのモデルの出発点として再利用する機械学習 (ML)における強力な手法です。膨大なデータセットとかなりの計算能力を必要とするニューラルネットワークをゼロからトレーニングする代わりに、開発者はAIがすでに獲得した知識を活用します。このアプローチは人間の学習方法を模倣しており、例えば、ピアノの弾き方を知っていると、音楽理論の基礎的な理解と指の器用さが転用されるため、オルガンを学ぶのがはるかに簡単になります。ディープラーニングの文脈では、これはモデルがはるかに少ないデータと時間で新しい問題に対して高い精度を達成できることを意味します。

転移学習の仕組み

転移学習の有効性は、特徴抽出の階層的な性質にあります。深層学習モデル、特にコンピュータービジョンで使用されるものは、層ごとにパターンを認識することを学習します。バックボーンの初期層は、エッジ、曲線、テクスチャなどの単純で普遍的な特徴を検出します。これらの低レベルの特徴は、ほとんどすべての視覚タスクに適用可能です。

このプロセスは通常、2つの主要なフェーズを含みます。

  1. 事前学習: モデルは、一般的な視覚表現を学習するために、ImageNetのような大規模なベンチマークデータセットでトレーニングされます。これにより、既に視覚構造を理解している一連のモデルウェイトが生成されます。
  2. 適応: 事前訓練済みモデルは、その後、特定のニッチなタスクに適応されます。これは多くの場合、初期層を「凍結」(重みを固定)し、より小さなカスタムデータセットで最終層、または検出ヘッドのみを再訓練することによって行われます。

実際のアプリケーション

転移学習は、大手テクノロジー企業のリソースなしで特殊なソリューションを構築できるようにすることで、AIを民主化しました。

  • 医療分野におけるAI: 特定の疾患ごとに何百万ものアノテーション付き医用画像を収集することは困難です。しかし、研究者は日常のオブジェクトで事前学習されたモデルを医用画像解析に適用することができます。モデルは、形状や異常をdetectする能力を転移させ、X線やMRIスキャンで腫瘍を高精度で識別します。
  • 製造業におけるAI: 産業現場では、外観検査システムは新しい製品ラインに迅速に適応する必要があります。汎用的な欠陥detectモデルは、スマートマニュファクチャリングのワークフローを活用してダウンタイムを最小限に抑えつつ、マイクロチップのような特定の新しい部品の欠陥を検出するために迅速に更新できます。

他の概念との関係

転移学習を密接に関連する用語と区別することは有用です。

  • vs. Fine-Tuning: ファインチューニングは、転移学習を実装する特定の方法です。転移学習が知識の再利用という包括的な概念であるのに対し、ファインチューニングは、モデルの一部を凍結解除し、より低い学習率で新しいデータに対してそれらをトレーニングする機械的なプロセスを指します。
  • ゼロショット学習 転移学習は新たなタスク向けにラベル付きデータを用いた学習段階を必要とする。これに対し、ゼロショット学習は、モデルがこれまで見たことのないclassify とするもので、多くの場合、視覚的例ではなく意味的記述に依存する。

実例

以下の通りである。 Python このスニペットは、〜を使用して転移学習を示しています。 ultralytics ライブラリ。私たちは、 YOLO26 COCOデータセットから派生した事前学習済み重みが付属しています。新しいデータセットでトレーニングを開始すると、モデルは事前学習済みの特徴を新しいタスクに自動的に転移します。

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (transferring weights from COCO)
model = YOLO("yolo26n.pt")

# Train the model on a new, smaller dataset to adapt its knowledge
# This leverages the pre-learned backbone for faster convergence
results = model.train(data="coco8.yaml", epochs=5)

データセットの管理とクラウドでのこれらのトレーニング実行のために、Ultralytics Platformのようなツールはプロセスを効率化し、チームがデータのアノテーションと転移学習モデルの効率的なデプロイで協力できるようにします。

学術理論についてさらに深く掘り下げるには、Stanford CS231nのノートが優れた概要を提供し、PyTorch転移学習チュートリアルは実装に関する広範な技術詳細を提供します。

共にAIの未来を築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。