YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

Few-Shot Learning(少量サンプル学習)

Few-shot learningが、最小限のデータでAIが適応できるようにし、医療診断や野生生物保護などの分野を変革する様子をご覧ください。

Few-Shot Learning(FSL)は、ほんの一握りの例から新しい概念に一般化できるモデルの構築に焦点を当てた機械学習のサブフィールドです。従来の深層学習モデル、特にコンピュータビジョンでは、高いパフォーマンスを達成するために、大量のラベル付きトレーニングデータが必要になることがよくあります。FSLは、データ収集とラベリングが高価で時間がかかる、または単に不可能なアプリケーションにとって非常に貴重である、少ないデータ状況で効果的に学習できるモデルを作成することにより、データ不足の課題に対処します。

Few-Shot Learning(少量サンプル学習)の仕組み

FSLの基本的な考え方は、大規模で多様なデータセットからの事前知識を活用して、新しい関連タスクを迅速に学習することです。モデルは、特定のカテゴリを直接分類することを学習する代わりに、データのもっと一般的な表現を学習するか、データポイントを比較する方法を学習します。一般的なアプローチには、以下が含まれます。

  • メトリックベース学習:これらの手法は、少数のラベル付き「サポート」画像とラベルなしの「クエリ」画像を比較するための距離関数または類似性メトリックを学習します。次に、クエリ画像に最も類似したサポート画像のクラスが割り当てられます。このアプローチの一般的な例には、2つの画像が同じクラスからのものかどうかを判断するように学習するSiamese Networksや、メトリックスペース内の各クラスのプロトタイプ表現を学習するPrototypical Networksなどがあります。
  • 最適化ベースの学習: メタ学習(または「学習の学習」)と関連付けられることが多く、このアプローチでは、モデルの最適化プロセス自体を訓練します。目標は、わずか数回の勾配降下ステップで、新しいタスクにパラメータを迅速に適応させることができるモデルを開発することです。この分野で影響力のあるアルゴリズムは、Model-Agnostic Meta-Learning (MAML)です。
  • メモリベース学習:これらのモデルは、利用可能な少数の例から情報を保存するために、外部メモリコンポーネントを使用します。新しい例が提示されると、モデルは予測を行うためにメモリから関連情報を取得します。これは、k近傍法(k-NN)アルゴリズムの動作と概念的に似ています。

Few-Shot Learning vs. 関連概念

FSLを、限られたデータを扱う他の学習パラダイムと区別することが重要です。

  • Zero-Shot Learning (ZSL): ZSLはFSLよりも極端であり、高レベルのセマンティックな記述または属性のみを使用して、トレーニング中に見たことのないクラスをモデルが認識する必要があります。FSLは少なくとも1つの例を必要としますが、ZSLは必要ありません。
  • One-Shot Learning(OSL): OSLはFSLの特定のバリアントであり、モデルには新しいクラスごとに正確に1つのラベル付きの例が提供されます。これは、Few-Shotフレームワークの中で最も困難なシナリオを表しています。
  • 転移学習: FSLは転移学習の一形態ですが、2つは同一ではありません。従来の転移学習では、ImageNetのような大規模なデータセットで事前トレーニングされたモデルを取得し、より小さい新しいデータセットでファインチューニングすることがよくあります。FSLは、新しいデータセットが非常に小さい(例えば、クラスあたり10個未満の例)シナリオのために特別に設計されています。Ultralytics YOLO11のようなモデルが、モデルトレーニングのドキュメントで転移学習のために事前トレーニングされた重みを使用する方法を調べることができます。

実際のアプリケーション

FSLは、特にデータが乏しい特殊な分野で役立ちます。

  1. 医療画像における希少疾患の診断: 希少疾患の場合、モデルトレーニングのために何千もの患者スキャンを収集することは、多くの場合実現可能ではありません。FSLを使用すると、一般的な医療画像の大きなデータセットで事前トレーニングされたモデルを、ほんの一握りの確認された症例を使用して、希少疾患の兆候を識別するように適合させることができます。これにより、医療画像分析用の診断ツールの開発が加速されます。
  2. 産業用欠陥検出:製造業では、新しい製品ラインには、固有のまれな欠陥がある場合があります。数千の欠陥例を収集するために生産を一時停止する代わりに、物体検出用のFSLモデルをいくつかのサンプルで迅速にトレーニングして、品質管理を自動化し、効率を向上させ、無駄を削減できます。Ultralytics HUBのようなプラットフォームは、このような特殊なデータセットを管理し、モデルのデプロイを加速するのに役立ちます。

課題と今後の方向性

FSLはその有望さにもかかわらず、いくつかの重要な課題に直面しています。主なハードルは過学習を防ぐことです。モデルは汎化を学習する代わりに、少数の例を簡単に記憶してしまう可能性があるためです。また、モデルの性能は、提供されるサポート例の質や代表性に大きく左右される可能性があります。

スタンフォード大学Google AIMeta AIなどの機関が主導する継続的な研究は、より堅牢なメタ学習アルゴリズムを作成し、事前トレーニングのために教師なしまたは自己教師あり学習テクニックをより有効に活用することに焦点を当てています。これらのアプローチを組み合わせることで、より柔軟でデータ効率の高いAIシステムを構築し、データ制約のある環境で可能なことの限界を押し広げることを目指しています。PyTorchTensorFlowのような高度なフレームワークは、研究者がこれらの最先端の手法を探求するために必要なツールを提供します。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました