用語集

一発学習

最小限のデータからモデルを汎化し、実世界での応用を可能にする画期的なAI技術、ワンショット学習の威力をご覧ください。

ワンショット学習(OSL)とは、機械学習(ML)の分類タスクの一つで、たった一つの例から新しいオブジェクトクラスを認識するようにモデルを学習させるものである。膨大な量の学習データを必要とする従来のディープラーニングモデルとは異なり、OSLは単一のインスタンスから新しい概念を学習する人間の能力を模倣することを目的としている。そのため、データ収集が高価、困難、または不可能なシナリオにおいて、OSLは特に価値がある。核となる考え方は、物体を直接分類することを学習するのではなく、2つの画像が同じクラスに属するかどうかを判断できる類似性関数を学習することである。

一発学習の仕組み

特定のクラスを識別するためにモデルを訓練する代わりに、OSLモデルは通常、2つの入力画像が同じか異なるかを判断するという別のタスクで訓練される。このために使われる一般的なアーキテクチャはシャムネットワークで、同じ重みを共有する2つの同じニューラルネットワークで構成される。各ネットワークは2つの入力画像の一方を処理し、エンベッディング(画像のコンパクトな数値表現)を作成する。

その後、モデルはこれら2つの埋め込みを比較し、類似度スコアを計算する。モデルの学習中、ネットワークは、同じクラスの画像に対しては類似した埋め込みを生成し、異なるクラスの画像に対しては非類似の埋め込みを生成するように学習します。一度学習されると、モデルは新しい画像を、既知の各クラスの単一「ショット」または例と比較することで分類することができます。新しい画像は、最も高い類似度スコアを持つクラスに割り当てられます。このアプローチは、ロバストな表現を構築するために、優れた特徴抽出に大きく依存している。

他の学習パラダイムとの関係

OSLは、低データシナリオのために設計された、より広範な学習手法ファミリーの一部である:

  • フューショット・ラーニング(FSL):OSLを一般化したもので、モデルは1クラスにつき1例ではなく、少数の例(例えば2~5例)から学習する。FSLはOSLよりも多くの情報を提供し、しばしばより良いパフォーマンスをもたらす。
  • ゼロショット・ラーニング (ZSL):視覚的特徴と高レベルの意味記述との間のマッピングを学習することによって、モデルが学習中に一度も見たことのないクラスを認識しなければならない。
  • メタラーニング:しばしば「学習するための学習」と呼ばれるこのアプローチは、新しいタスクをより効率的に解決できるように、多種多様な学習タスクでモデルを訓練する。多くのOSLやFSL技術は、カリフォルニア大学バークレー校のBAIRのような機関の研究によって説明されているように、メタ学習の原則に基づいている。
  • トランスファー・ラーニング:これは、(ImageNetのような)大規模なデータセットで事前に訓練されたモデルを使用し、それをより小規模で特定のデータセットで微調整することを含む。関連性はあるが、OSLは大規模な微調整を行わずに単一の例から学習することに重点を置いている。

実世界での応用

ワンショット学習は、データが乏しい状況で非常に効果的である。

  1. 顔認識:セキュリティ・システムはOSLを使って、たった一枚の写真を見せられただけで、その人物を識別することができる。システムは、ユニークな顔のシグネチャー(埋め込み)を作成するために学習し、その後、さまざまな角度や照明条件からその人を認識することができます。これは、スマートフォンのロック解除から建物への安全なアクセスまで、さまざまな用途で使用されている。フェイスブックAIによるDeepFaceという初期の影響力のある論文は、このタスクに対するディープネットワークの力を実証した。
  2. 創薬:薬理学では、効果的な薬となりうる新しい分子を同定することは、コストのかかるプロセスである。OSLは、望ましい特性を持つ1つの既知の例に基づいて、新しい分子の特性を予測するモデルを構築するために使用することができる。これは、医薬品開発のためのグラフベースのディープラーニングに関する研究で議論されているように、スクリーニングプロセスを加速する。

課題と今後の方向性

OSLの主な課題は汎化である。モデルは、特定の特徴に過剰適合することなく、単一の例からクラスの核となるエッセンスを学習しなければならない。そのため、単一の例の品質は非常に重要である。Papers with Codeで強調されているような現在進行中の研究は、よりロバストな特徴表現と高度なメタ学習戦略の開発に焦点を当てている。OSL 機能をUltralytics HUB のような汎用ビジョンプラットフォームに統合することで、データが限られた環境での利用が劇的に拡大する可能性がある。モデルがより強力になるにつれて、このような厳しい条件下で適切な性能指標を用いて評価することも、重要な研究分野となります。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク