YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

One-Shot Learning

One-Shot Learningのパワーをご覧ください。これは、現実世界のアプリケーションのために、最小限のデータからモデルが一般化を可能にする革新的なAI技術です。

One-Shot Learning(OSL)は、機械学習(ML)における分類タスクの一つで、モデルはたった一つの例から新しいオブジェクトクラスを認識するように訓練されます。大量のトレーニングデータを必要とする従来の深層学習モデルとは異なり、OSLは単一のインスタンスから新しい概念を学習する人間の能力を模倣することを目指しています。これにより、データ収集が高価、困難、または不可能なシナリオで特に価値が高まります。その中心的なアイデアは、オブジェクトを直接分類することを学習するのではなく、2つの画像が同じクラスに属するかどうかを判断できる類似性関数を学習することです。

One-Shot Learningの仕組み

特定のクラスを識別するようにモデルをトレーニングする代わりに、OSLモデルは通常、2つの入力画像が同じか異なるかを判断するという別のタスクでトレーニングされます。これに使用される一般的なアーキテクチャは、同じ重みを共有する2つの同一のニューラルネットワークで構成されるSiamese Networkです。各ネットワークは、2つの入力画像のいずれかを処理して、画像のコンパクトな数値表現である埋め込みを作成します。

次に、モデルはこれらの2つの埋め込みを比較して、類似度スコアを計算します。モデルのトレーニング中、ネットワークは同じクラスの画像に対して類似した埋め込みを生成し、異なるクラスの画像に対しては類似しない埋め込みを生成するように学習します。トレーニング後、モデルは既知の各クラスからの単一の「ショット」または例と比較することにより、新しい画像を分類できます。新しい画像は、最も高い類似度スコアを持つクラスに割り当てられます。このアプローチは、ロバストな表現を構築するために、優れた特徴抽出に大きく依存しています。

他の学習パラダイムとの関係

OSLは、ローデータシナリオ向けに設計された、より広範な学習手法ファミリーの一部です。

  • フューショット学習(FSL): OSL の一般化であり、モデルはクラスごとにわずかな数の例(たとえば、2〜5)から学習します。FSL は OSL よりも多くの情報を提供し、多くの場合、より優れたパフォーマンスにつながります。
  • ゼロショット学習(ZSL): モデルがトレーニング中に一度も見たことのないクラスを認識しなければならない、より困難なパラダイムです。通常、視覚的な特徴と高度な意味記述の間のマッピングを学習することによって実現します。
  • メタ学習:「学習の学習」とも呼ばれ、新しいタスクをより効率的に解決できるように、さまざまな学習タスクでモデルをトレーニングするアプローチです。多くのOSLおよびFSLテクニックは、UC BerkeleyのBAIRなどの研究機関の研究で説明されているように、メタ学習の原則に基づいています。
  • 転移学習:これには、大規模なデータセット(ImageNetなど)で事前学習されたモデルを使用し、それをより小さく、特定のデータセットでファインチューニングすることが含まれます。関連性がありますが、OSLは、広範なファインチューニングなしに、単一の例から学習することに焦点を当てています。

実際のアプリケーション

One-Shot Learningは、データが不足している状況で非常に効果的です。

  1. 顔認識: セキュリティシステムは、1枚の写真を見せるだけでOSLを使用して人物を識別できます。システムは、独自の顔の署名(埋め込み)を作成することを学習し、さまざまな角度や照明条件でその人物を認識できます。これは、スマートフォンのロック解除から安全な建物へのアクセスまで、さまざまなアプリケーションで使用されています。初期の重要な論文であるFacebook AIによるDeepFaceは、このタスクに対する深層ネットワークの能力を実証しました。
  2. 創薬: 薬理学では、効果的な薬になる可能性のある新しい分子を特定することは、コストのかかるプロセスです。OSLを使用して、望ましい特性を持つ単一の既知の例に基づいて、新しい分子の特性を予測するモデルを構築できます。これにより、創薬のためのグラフベースの深層学習に関する研究で議論されているように、スクリーニングプロセスが加速されます。

課題と今後の方向性

OSLの主な課題は、汎化です。モデルは、特定の機能に過剰適合することなく、単一の例からクラスの本質を学習する必要があります。したがって、単一の例の品質が非常に重要です。Papers with Codeで紹介されている研究など、現在進行中の研究は、より堅牢な特徴表現と高度なメタ学習戦略の開発に焦点を当てています。Ultralytics HUBのような汎用ビジョンプラットフォームにOSL機能を統合すると、データが限られた環境での使用が劇的に拡大する可能性があります。モデルがより強力になるにつれて、これらの厳しい条件下で適切なパフォーマンス指標を使用して評価することも、重要な研究分野です。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました