Yolo 深圳
深セン
今すぐ参加
用語集

ゼロショット学習

ゼロショット学習:未知のデータをclassify するモデルを可能にし、物体検出やNLPなどに革命をもたらす最先端のAIアプローチをご覧ください。

ゼロショット学習(ZSL)は、機械学習(ML)における強力なパラダイムである。 機械学習(ML)における強力なパラダイムである。 機械学習(ML)における強力なパラダイムである。 認識または検出することができる。従来の 従来の教師あり学習では、モデルは次のような学習が必要である。 従来の教師あり学習では、モデルは識別する必要のある特定のカテゴリーごとに、何千ものラベル付き画像で学習しなければならない。ZSLはこの制約を 補助的な情報(典型的にはテキスト記述、属性、または意味的埋め込み)を活用することで、この制約を排除する。 の間のギャップを埋める クラス間のギャップを埋める。この機能により 人工知能(AI)システムは この機能により、人工知能(AI)システムは、より柔軟でスケーラブルになり、動的な環境にも対応できるようになる。 可能性のあるすべてのオブジェクトについて網羅的なデータを収集することは現実的ではありません。

ゼロ・ショット・ラーニングの仕組み

ZSLの核となるメカニズムは、共有された意味空間を使って、馴染みのある概念から馴染みのない概念へと知識を伝達することである。 意味空間を共有する。ピクセルのパターンを記憶することのみによって「猫」を認識することを学習する代わりに、モデルは次のように学習する。 は、視覚的特徴と意味的属性(例えば、「三毛」、「ひげ」、「4つ」)の関係を学習する。 「ひげ」、「4本足」など)。 自然言語処理(NLP)に由来する。

このプロセスは多くの場合 画像表現とテキスト表現を整合させるマルチモーダルモデルに頼ることが多い モデルに依存することが多い。例えば 例えば、OpenAIのCLIPのような基礎研究は、モデルがどのように自然言語監視から視覚的概念を学習できるかを示している を学習する方法を示している。ZSLモデルは、希少な鳥類のような未知のオブジェクトに遭遇すると、視覚的特徴を抽出し、それを意味の辞書と比較する。 視覚的特徴を抽出し、意味ベクトルの辞書と比較します。視覚的特徴が 視覚的特徴が新しいクラスの意味的記述と一致すれば、モデルはそれを正しくclassify ことができ、効果的に「ゼロショット」予測を実行する。 「ゼロ・ショット」予測を行う。

関連概念との区別

ZSLを完全に理解するためには、次のような類似の学習戦略と区別することが役に立つ。 コンピュータビジョン(CV)で使用される同様の学習ストラテジーと区別することが有用である:

  • フューショット・ラーニング(FSL)一方 ZSLがターゲット・クラスの例を必要としないのに対して、FSLはモデルに適応するための非常に小さなサポート・セット (通常1~5例)を提供する。ZSLは、視覚的な例ではなく、意味的な推論に完全に依存するため、より困難である。 ZSLは、視覚的な例ではなく、完全に意味推論に依存するため、より困難である。
  • 一発学習FSLのサブセット。 FSLのサブセットで、モデルは正確に1つのラベル付き例から学習する。ZSLが根本的に異なるのは、新しいカテゴリの画像を1枚も使わずに学習することである。 ZSLは、新しいカテゴリの画像が1枚もなくても動作するので、根本的に異なる。
  • 転移学習この広義の あるタスクから別のタスクへ知識を伝達することを指す。ZSLは特定のタイプの転移学習である。 新しいデータで微調整を行うことなく、未知のクラスに知識を伝達するために意味属性を使用する。 新しいデータで微調整を行う必要がない

実際のアプリケーション

ゼロショット・ラーニングは、システムが最初のトレーニングを越えて汎化できるようにすることで、様々な業界のイノベーションを促進している。 を可能にすることで、さまざまな業界のイノベーションを推進しています。

  1. オープン語彙オブジェクト検出:YOLO-Worldのような最新のアーキテクチャは YOLOな最新のアーキテクチャは、ZSLを利用して、ユーザーが定義したテキストプロンプトに基づいてオブジェクトをdetect 。 検出する。これにより オブジェクト検出を可能にする。 膨大なビデオアーカイブから特定のアイテムを検索するような、事前にクラスの固定リストを定義することが不可能なシナリオでのオブジェクト検出を可能にする。 Google 他の機関の研究者たちは、このオープン・ボキャブラリーを積極的に改良している。 このようなオープン・ボキャブラリー機能を積極的に改良している。
  2. 医療診断医療診断 医療におけるAIでは、希少疾患のラベル付きデータを入手することは 希少疾患のラベル付きデータを入手することは困難であり、コストもかかる。ZSLモデルは、一般的な病態と、稀な症状に関する医学教科書(Publobの論文など)の記述に基づいて学習させることができる。 (PubMedの論文など)から学習させることができる。 システムは、膨大な陽性症例のデータセットを必要とすることなく、X線やMRIスキャンで潜在的な希少異常にフラグを立てることができる。 症例
  3. 野生動物の保護農業と生態学におけるAI 農業と生態学のAIにとって めったに撮影されない絶滅危惧種を特定することは非常に重要です。ZSLは、自然保護活動家がこれらの動物をdetect することを可能にする。 のような生物学的データベースで定義された属性ベースの記述(例えば、特定の毛皮のパターンや角の形状)を使用して、これらの動物を検出することができます。 生命の百科事典

Ultralyticsゼロショット検出

Ultralytics YOLOモデルは、ゼロ・ショットを体現している。 学習を実践している。モデルを再トレーニングすることなく、実行時に動的にカスタムクラスを定義することができます。これは を接続することで実現します。 YOLO11検出バックボーンと CLIPベースのテキストエンコーダと接続することで実現される。

次のPython 例は、YOLO、標準的なCOCOデータセットに含まれないオブジェクトをdetect する方法を示している。 COCO データセットに含まれないオブジェクトを検出する方法を示す。 ultralytics パッケージで提供される。

from ultralytics import YOLOWorld

# Load a pre-trained YOLO-World model
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes for Zero-Shot detection using text prompts
# The model will now look for these specific descriptions
model.set_classes(["blue backpack", "red apple", "person wearing sunglasses"])

# Run inference on an image to detect the new zero-shot classes
results = model.predict("path/to/image.jpg")

# Show the results
results[0].show()

課題と今後の展望

ZSLは計り知れない可能性を秘めているが、ドメインシフト問題などの課題に直面している。 トレーニング中に学習された意味属性が、未知のクラスの視覚的外観に完全に対応するわけではないという問題である。 さらに、ZSLモデルはバイアスに悩まされることがある。 一般化ゼロショット学習)。

スタンフォード大学のAIラボやEEEE Computer Societyのような組織による研究は、このような限界に取り組み続けている。 IEEE Computer Societyのような組織による研究は、これらの限界に取り組み続けている。そして 基礎モデルがより強固になれば、ZSLは コンピュータビジョンツールの標準機能になることが期待されている。 コンピュータ・ビジョン・ツールの標準機能になることが期待されている。 データのラベリング作業への依存を減らし、高度なAI機能へのアクセスを民主化する。 高度なAI能力へのアクセスを民主化する。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加