転移学習を活用し、少ないデータで高精度AIを訓練する方法を探求しましょう。Ultralytics 事前学習済み重みを活用して、コンピュータビジョンプロジェクトを加速させる手法を学びます。
転移学習は機械学習(ML)における強力な手法であり、特定のタスク向けに開発されたモデルを、関連する別のタスクのモデル構築の出発点として再利用する。大規模なデータセットと膨大な計算能力を必要とするニューラルネットワークのゼロからの学習に代え、開発者はAIが既に獲得した知識を活用する。 この手法は人間の学習プロセスを模倣している。例えばピアノの演奏方法を理解していれば、音楽理論の基礎知識と指の器用さが転移されるため、オルガンの習得が格段に容易になる。深層学習の文脈では、これによりモデルが新たな課題において、はるかに少ないデータ量と時間で高い精度を達成できることを意味する。
転移学習の有効性は、特徴抽出の階層的性質に由来する。深層学習モデル、特にコンピュータビジョンで用いられるものは、層ごとにパターンを認識することを学習する。バックボーンの初期層は、エッジ、曲線、テクスチャといったdetect 普遍的な特徴detect 。これらの低レベル特徴は、ほぼあらゆる視覚的タスクに適用可能である。
このプロセスは通常、主に二つの段階から構成される:
転移学習は、ビッグテック企業並みのリソースがなくても専門的なソリューションを構築できるようにすることで、AIを民主化した。
転移学習を、密接に関連する用語と区別することは有益である:
以下の通りである。 Python スニペットは、転移学習を以下の方法で実現する
ultralytics ライブラリ。私たちは読み込みます YOLO26 モデルは、COCO 導出された事前学習済み重みを備えています。新しいデータセットで学習を開始すると、モデルは事前学習された特徴を自動的に新しいタスクに転移させます。
from ultralytics import YOLO
# Load a pre-trained YOLO26 model (transferring weights from COCO)
model = YOLO("yolo26n.pt")
# Train the model on a new, smaller dataset to adapt its knowledge
# This leverages the pre-learned backbone for faster convergence
results = model.train(data="coco8.yaml", epochs=5)
クラウド上でデータセットを管理し、これらのトレーニング実行を効率化するには、 Ultralytics のようなツールがプロセスを合理化し、チームが データの注釈付けや転移学習モデルのデプロイを効率的に共同作業できるようにします。
学術理論についてさらに深く掘り下げたい場合は、 スタンフォード大学のCS231n講義ノートが優れた概説を提供しています。 一方、PyTorch 学習チュートリアルは 実装に関する詳細な技術情報を豊富に提供しています。