最小限のデータからモデルを汎化し、実世界での応用を可能にする画期的なAI技術、ワンショット学習の威力をご覧ください。
ワンショット学習(OSL)とは、機械学習(ML)の分類タスクの一つで、たった一つの例から新しいオブジェクトクラスを認識するようにモデルを学習させるものである。膨大な量の学習データを必要とする従来のディープラーニングモデルとは異なり、OSLは単一のインスタンスから新しい概念を学習する人間の能力を模倣することを目的としている。そのため、データ収集が高価、困難、または不可能なシナリオにおいて、OSLは特に価値がある。核となる考え方は、物体を直接分類することを学習するのではなく、2つの画像が同じクラスに属するかどうかを判断できる類似性関数を学習することである。
特定のクラスを識別するためにモデルを訓練する代わりに、OSLモデルは通常、2つの入力画像が同じか異なるかを判断するという別のタスクで訓練される。このために使われる一般的なアーキテクチャはシャムネットワークで、同じ重みを共有する2つの同じニューラルネットワークで構成される。各ネットワークは2つの入力画像の一方を処理し、エンベッディング(画像のコンパクトな数値表現)を作成する。
その後、モデルはこれら2つの埋め込みを比較し、類似度スコアを計算する。モデルの学習中、ネットワークは、同じクラスの画像に対しては類似した埋め込みを生成し、異なるクラスの画像に対しては非類似の埋め込みを生成するように学習します。一度学習されると、モデルは新しい画像を、既知の各クラスの単一「ショット」または例と比較することで分類することができます。新しい画像は、最も高い類似度スコアを持つクラスに割り当てられます。このアプローチは、ロバストな表現を構築するために、優れた特徴抽出に大きく依存している。
OSLは、低データシナリオのために設計された、より広範な学習手法ファミリーの一部である:
ワンショット学習は、データが乏しい状況で非常に効果的である。
OSLの主な課題は汎化である。モデルは、特定の特徴に過剰適合することなく、単一の例からクラスの核となるエッセンスを学習しなければならない。そのため、単一の例の品質は非常に重要である。Papers with Codeで強調されているような現在進行中の研究は、よりロバストな特徴表現と高度なメタ学習戦略の開発に焦点を当てている。OSL 機能をUltralytics HUB のような汎用ビジョンプラットフォームに統合することで、データが限られた環境での利用が劇的に拡大する可能性がある。モデルがより強力になるにつれて、このような厳しい条件下で適切な性能指標を用いて評価することも、重要な研究分野となります。