YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024

Few-shot Learning、Zero-shot Learning、Transfer Learning について

Abirami Vina

5分で読めます

2025年1月29日

コンピュータビジョンにおける Few-shot Learning(少量サンプル学習)、Zero-shot Learning(ゼロショット学習)、Transfer Learning(転移学習)の違いと、これらのパラダイムがAIモデルのトレーニングをどのように形作るかを探ります。

人工知能(AI)システムは、顔認識、画像分類、自動車の運転などの複雑なタスクを、最小限の人的入力で処理できます。これは、データを学習し、パターンを認識し、それらのパターンを使用して予測や意思決定を行うことによって実現されます。AIの進歩に伴い、AIモデルが驚くほど効率的に学習、適応、タスクを実行できる、ますます洗練された方法が見られるようになっています。

たとえば、コンピュータビジョンは、機械が世界からの視覚情報を解釈し理解できるようにすることに焦点を当てたAIの分野です。従来のコンピュータビジョンモデルの開発は、トレーニングのために注釈が付けられた大規模なデータセットに大きく依存しています。このようなデータを収集してラベル付けするには、時間とコストがかかる場合があります。 

これらの課題に対処するために、研究者たちは、限られた例から学習するFew-shot Learning(FSL)、未知のオブジェクトを識別するZero-shot Learning(ZSL)、事前トレーニングされたモデルからの知識を新しいタスクに適用するTransfer Learning(TL)などの革新的なアプローチを導入しました。

この記事では、これらの学習パラダイムがどのように機能するかを探り、主な違いを強調し、実際のアプリケーションを見ていきます。それでは始めましょう!

学習パラダイムの概要

コンピュータビジョンにおける Few-shot Learning、Zero-shot Learning、Transfer Learning とは何か、そしてそれらがどのように機能するかを探りましょう。 

Few-shot Learning(少量サンプル学習)

Few-shot Learningは、システムがごく少数の例を使用して新しいオブジェクトを認識することを学習する方法です。たとえば、モデルにペンギン、ペリカン、およびパフィンの写真をいくつか表示すると(この小さなグループは「サポートセット」と呼ばれます)、これらの鳥がどのように見えるかを学習します。 

後で、モデルにペンギンのような新しい写真を表示すると、この新しい写真をサポートセットの写真と比較し、最も近い一致を選択します。大量のデータを収集することが困難な場合、この方法は、システムがわずかな例だけで学習および適応できるため、有益です。

__wf_reserved_inherit
図1. Few-shot learningの仕組みの概要。

Zero-shot learning

Zero-shot learningは、機械が一度も見たことのないものを、その例なしに認識する方法です。記述などのセマンティック情報を使用して、関連付けを支援します。

たとえば、機械が「小さくてふわふわ」、「大きな野生の猫」、「長い顔」などの特徴を理解することで、猫、ライオン、馬などの動物について学習した場合、この知識を使用して、トラのような新しい動物を識別できます。たとえトラを見たことがなくても、「暗い縞模様のあるライオンのような動物」のような記述を使用して、正しく識別できます。これにより、機械は多くの例を必要とせずに、より簡単に学習し、適応できます。

__wf_reserved_inherit
図2. Zero-shot learningは、記述を使用して新しいオブジェクトを識別します。

転移学習

転移学習は、モデルが1つのタスクから学習したことを利用して、類似の新しいタスクを解決するのに役立つ学習パラダイムです。この手法は、オブジェクト検出、画像分類、パターン認識などのコンピュータービジョンタスクに特に役立ちます。 

たとえば、コンピュータービジョンでは、事前トレーニング済みのモデルは、動物などの一般的なオブジェクトを認識し、転移学習によって微調整して、さまざまな犬種などの特定のオブジェクトを識別できます。以前のタスクからの知識を再利用することにより、転移学習により、より小さなデータセットでコンピュータービジョンモデルを簡単にトレーニングできるようになり、時間と労力を節約できます。

__wf_reserved_inherit
図3。転移学習の仕組みの概要。

どのようなモデルが転移学習をサポートしているのか疑問に思われるかもしれません。Ultralytics YOLO11は、その良い例となるコンピュータビジョンモデルです。これは、大規模な汎用データセットで事前学習された最先端の物体検出モデルです。その後、特定のタスクのために、より小規模な特殊なデータセットで微調整およびカスタムトレーニングできます。

学習パラダイムの比較

Few-shot学習、Zero-shot学習、転移学習について説明したので、それらを比較して、どのように異なるかを見てみましょう。

__wf_reserved_inherit
図4. Few-shot、Zero-shot、転移学習の主な違い(画像は著者による)。

Few-shot学習は、ラベル付けされたデータが少量しかない場合に役立ちます。AIモデルがほんのわずかな例から学習することを可能にします。一方、Zero-shot学習は、ラベル付けされたデータを必要としません。代わりに、記述やコンテキストを使用して、システムが新しいタスクを処理できるようにします。一方、転移学習は、事前学習済みのモデルからの知識を利用して、最小限の追加データで新しいタスクに迅速に適応できるようにするという、異なるアプローチを取ります。各手法には、取り組んでいるデータの種類とタスクに応じて、独自の強みがあります。

さまざまな学習パラダイムの現実世界の応用

これらの学習パラダイムはすでに多くの分野で変化をもたらしており、革新的なソリューションで複雑な問題を解決しています。それらが現実世界でどのように応用できるかを詳しく見てみましょう。

Few-shot学習による希少疾患の診断

Few-shot learning(少量データ学習)は、特に医療画像において、ヘルスケア分野に革新をもたらします。大量のデータを必要とせずに、わずかな例や説明から、医師がまれな疾患を診断するのに役立ちます。これは、データが限られている場合に特に役立ちます。なぜなら、まれな疾患に関する大規模なデータセットの収集は困難な場合が多いからです。

例えば、SHEPHERDは、few-shot learningと生物医学知識グラフを使用して、まれな遺伝性疾患を診断します。症状や検査結果などの患者情報を、既知の遺伝子と疾患のネットワークにマッピングします。これにより、データが限られている場合でも、可能性の高い遺伝的原因を特定し、類似の症例を見つけるのに役立ちます。 

__wf_reserved_inherit
図5. Shepherdモデルは、最小限のデータを使用してまれな疾患を診断します。

ゼロショット学習による植物病害検出の改善

農業においては、植物病害の迅速な特定が不可欠です。なぜなら、検出の遅れは、広範囲な作物の被害、収量の減少、および重大な経済的損失につながる可能性があるからです。従来の方法は、大規模なデータセットと専門家の知識に依存することが多いですが、特に遠隔地や資源が限られた地域では、必ずしも利用できるとは限りません。そこで、ゼロショット学習のようなAIの進歩が役立ちます。

農家がトマトとジャガイモを栽培していて、葉の黄変や褐色の斑点のような症状に気づいたとしましょう。ゼロショット学習は、大規模なデータセットを必要とせずに、疫病のような病気を特定するのに役立ちます。症状の説明を使用することで、モデルは以前に見たことのない病気を分類できます。このアプローチは、高速でスケーラブルであり、農家はさまざまな植物の問題を検出できます。これにより、作物の健康状態をより効率的に監視し、タイムリーな対策を講じ、損失を減らすことができます。

__wf_reserved_inherit
図6.  ゼロショット学習を使用して植物病害を特定する。

自動運転車と転移学習

自動運転車は、安全に走行するために、さまざまな環境に適応する必要があります。転移学習は、以前の知識を利用して、トレーニングを最初からやり直すことなく、新しい条件に迅速に適応するのに役立ちます。車両が視覚情報を解釈するのに役立つコンピュータビジョンと組み合わせることで、これらのテクノロジーは、さまざまな地形や気象条件でのスムーズなナビゲーションを可能にし、自動運転をより効率的かつ信頼性の高いものにします。

この実例として、Ultralytics YOLO11を使用して駐車スペースを監視する駐車場管理システムがあります。事前トレーニング済みのオブジェクト検出モデルであるYOLO11は、転移学習を使用して、空いている駐車スペースと使用中の駐車スペースをリアルタイムで識別できるように微調整できます。駐車場画像のより小さなデータセットでモデルをトレーニングすることにより、空いているスペース、満車スペース、さらには予約エリアを正確に検出することを学習します。

__wf_reserved_inherit
図7. Ultralytics YOLO11を使用した駐車場管理。

他のテクノロジーと統合されたこのシステムは、ドライバーを最寄りの利用可能なスポットに誘導し、検索時間と交通渋滞を軽減するのに役立ちます。転移学習は、YOLO11の既存のオブジェクト検出機能を基盤とすることで、これを可能にし、最初からやり直すことなく、駐車場管理の特定のニーズに適応できるようにします。このアプローチは、時間とリソースを節約しながら、駐車場の運用を改善し、全体的なユーザーエクスペリエンスを向上させる、非常に効率的でスケーラブルなソリューションを生み出します。

学習パラダイムにおける新たなトレンド

コンピュータビジョンの学習パラダイムの未来は、よりインテリジェントで持続可能なVision AIシステムを開発する方向に進んでいます。特に、注目されているトレンドの1つが、Few-shot学習、Zero-shot学習、転移学習を組み合わせたハイブリッドアプローチの利用です。これらの手法の強みを組み合わせることで、モデルは最小限のデータで新しいタスクを学習し、その知識をさまざまな分野に応用できます。

興味深い例としては、適応された深層埋め込みを使用して、以前のタスクからの知識と少量の新しいデータを使用してモデルを微調整し、限られたデータセットでの作業を容易にすることが挙げられます。 

同様に、X-shot学習は、さまざまな量のデータを持つタスクを処理するように設計されています。これは、モデルが限られたラベルまたはノイズの多いラベルから学習する弱い教師あり学習と、利用可能な事前事例がほとんどまたはまったくない場合でも、モデルが迅速に適応できるようにするための明確な指示を使用します。これらのハイブリッドアプローチは、さまざまな学習方法を統合することで、AIシステムがより効果的に課題に取り組むのに役立つことを示しています。

主なポイント

Few-shot学習、Zero-shot学習、および転移学習は、それぞれコンピュータビジョンにおける特定の課題に対処し、さまざまなタスクに適しています。適切なアプローチは、特定のアプリケーションと利用可能なデータ量によって異なります。たとえば、Few-shot学習は限られたデータでうまく機能し、Zero-shot学習は見えないクラスやなじみのないクラスを処理するのに最適です。

今後を見据えると、ビジョン、言語、オーディオを統合するハイブリッドモデルを作成するためにこれらの方法を組み合わせることが、重要な焦点になる可能性があります。これらの進歩は、AIシステムをより柔軟で効率的、かつ複雑な問題に取り組むことができるようにすることを目指しており、この分野におけるイノベーションの新たな可能性を開きます。

私たちのコミュニティに参加し、GitHubリポジトリをチェックして、AIについてもっと学びましょう。自動運転車におけるAI農業におけるコンピュータビジョンがどのように未来を再構築しているかをご覧ください。開始するには、利用可能なYOLOライセンスオプションを確認してください!

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる
クリップボードにコピーしました