Yolo 深圳
深セン
今すぐ参加
用語集

Few-Shot Learning(少量サンプル学習)

Few-shot learningが、最小限のデータでAIが適応できるようにし、医療診断や野生生物保護などの分野を変革する様子をご覧ください。

数ショット学習(FSL)は、機械学習(ML)の専門的なサブフィールドである。 機械学習(ML)の専門的な下位分野である。 人工知能モデルを訓練し、ごく少数のラベル付けされた例のみを用いて、新しい概念を分類、detect、理解することに重点を置く、機械学習(ML)の専門的な下位分野である。 ラベル付けされた例。従来の ディープラーニング(DL)では、モデルが高い精度を達成するためには、クラスごとに数千枚の画像 を必要とする。しかしFSLは、限られた経験から素早く汎化する人間の能力を模倣している。 子供がたった1、2枚の写真を見てキリンを認識できるのと同じだ。この能力は この能力は、大量の学習データを取得することが この能力は、大量の学習データを取得することが高価で、時間がかかり、あるいは事実上不可能なアプリケーションにとって極めて重要である。 事実上不可能である。

数撃ちゃ当たる学習の中核メカニズム

FSLの第一の目標は、事前知識を活用することで、膨大なデータセットへの依存を減らすことである。ゼロから新しいパターンを学習する代わりに ゼロから新しいパターンを学習するのではなく、ベースとなるデータセットから学習した情報を利用して、新しいタスクに利用できる数少ない例を解釈する。 を解釈する。これは多くの場合、異なるアプローチによって達成される:

  • メタ学習:しばしば「学習するための学習」と表現される。 メタ学習は、新しいタスクに素早く適応できるようにモデルを訓練する。 モデルを学習させる。モデル無視メタ学習(MAML)のようなアルゴリズムは、モデルの内部パラメータを最適化する。 モデルの内部パラメータを最適化することで、新しいタスクに対して数回の勾配ステップを行うだけで、良好なパフォーマンスが得られるようにする。
  • メトリック・ベースの学習:このアプローチでは、入力データを特徴空間にマッピングする。 にマッピングする。以下のような手法がある。 プロトタイプ・ネットワークは、各クラスの平均的な表現(プロトタイプ)を計算する。 各クラスの平均表現(プロトタイプ)を計算し、これらのプロトタイプとの距離に基づいて新しいクエリーサンプルをclassify する。 洗練された k-Nearest Neighbors (k-NN)分類器に似ている。
  • データの拡張:サンプルが乏しい場合、研究者はしばしばデータセットを人為的に拡張する。 高度なデータ補強技術は 限られたサンプルにモデルがオーバーフィットするのを防ぐのに役立つ。 モデルが限られたサンプルにオーバーフィットするのを防ぐのに役立ちます。

YOLO11数ショット学習の実装

実用的なコンピュータビジョン(CV)シナリオでは、FSL は転移学習によって実装されることが多い。のようなロバストモデルを YOLO11のような膨大なデータセットから豊富な特徴表現 のような膨大なデータセットから COCO, のような膨大なデータセットから豊富な特徴表現を学習済みである。事前に学習された重みは、強力な特徴抽出器として機能する。 として機能し、少ないサンプル数でモデルを新しいクラスに収束させることができる。

次のPython コードは、このコンセプトを適用する方法を示しています。 ultralytics パッケージ以下のように 事前に訓練されたモデルをロードし、小さなデータセットで短時間の訓練を行うことで、実質的に数ショット適応を行うことができる。 適応を行う。

from ultralytics import YOLO

# Load a pre-trained YOLO11 model to leverage learned feature representations
model = YOLO("yolo11n.pt")

# Fine-tune the model on a small dataset (e.g., 'coco8.yaml' has only 4 images per batch)
# The model adapts its existing knowledge to the new few-shot task
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# The model can now detect objects from the small dataset with high efficiency

フューショットと関連概念の区別

FSLがAIの中でどのような位置づけにあるのかを理解するためには、類似の学習パラダイムと区別することが役に立つ:

  • ゼロショット学習(ZSL) FSLが少なくとも小さな例集合(「サポート集合」)を必要とするのに対して、ZSLは特定のターゲットクラスに対する推論学習時に視覚的な例を全く必要としない。 を全く必要としない。その代わりに、ZSLは意味的な記述や属性(例えばテキスト)に依存する。 属性(例えば、テキスト埋め込み)に依存する。
  • 一発学習これは これはFSLの極端なケースで、モデルは正確に1つのラベル付き例から新しいクラスを学習しなければならない。これは顔認識システムにおける標準的な 顔認識システムの標準的なベンチマークである。 これは顔認識システムにおける標準的なベンチマークである。
  • トランスファー・ラーニングFSLは 転移学習の特殊な応用である。標準的な転移学習では、微調整のために数百枚の画像を使用する。 一方、FSLは、非常に少ないデータ領域(例えば、1クラスあたり5~10画像)のシナリオを明確 FSLは、非常に少ないデータ領域(例えば、1クラスあたり5~10画像)を持つシナリオを明示的に対象としている。

実際のアプリケーション

Few-Shotラーニングは、もともとデータが乏しかったり、明確な異常が稀であったりする業界において、その可能性を解き放つ。

医療診断

医用画像解析において 稀な病態のために何千ものラベル付きスキャンを得ることはしばしば不可能である。FSLは以下を可能にする AIモデルは、まれな腫瘍タイプ を特定することができる。例えば スタンフォード医科大学のような機関では、このような技術を積極的に研究し、AI診断ツールの民主化を目指している。 診断ツールを普及させている。

製造品質管理

製造業における最新のAIは 品質を保証するために欠陥の検出に頼っている。しかし、特定の欠陥は100万個に1回しか発生しないかもしれない。大規模な「欠陥」データセットを収集するために 大規模な「欠陥」データセットを収集するために何カ月も待つ代わりに、エンジニアはFSLを使用して、わずか数例で物体検出システムを訓練する。 オブジェクト検出システムを、新しい欠陥のわずか数例 これにより、更新された品質保証プロトコルを即座に展開することができる。

ロボット工学と適応

ダイナミックな環境で動作するロボットは、しばしば見たことのない物体に遭遇する。FSL.を使うことで、ロボティクス・システムは ロボティクス・システムは、数回デモンストレーションを見せられただけで、新しい道具の把持や操作を学習することができる。 を学習することができます。この能力は、倉庫や物流における柔軟な自動化に不可欠である。 この能力は、ボストン・ダイナミクスのような企業が注力している、倉庫管理や物流における柔軟な自動化に不可欠である。

課題と今後の展望

FSLは、その有望性にもかかわらず、信頼性に関する課題に直面している。モデルは提供された特定の少数の例 サポートセットが代表的でない場合、性能は著しく低下する。現在の研究の焦点は 埋め込みのロバスト性を改善することと より良い不確実性推定手法の開発。次のようなフレームワークがあります。 PyTorchTensorFlowなどのフレームワークは進化を続けており、研究者にデータ効率学習の限界を押し広げるツールを提供している。 データ効率学習の限界を押し広げるツールを研究者に提供している。次のようなモデルが YOLO26 のようなモデルがリリースに近づくにつれ、最小限のデータ入力から学習する能力がさらに高まることが期待される。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加