ゼロショット学習:未知のデータをclassify するモデルを可能にし、物体検出やNLPなどに革命をもたらす最先端のAIアプローチをご覧ください。
ゼロショット学習(ZSL)は、機械学習(ML)における強力なパラダイムである。 機械学習(ML)における強力なパラダイムである。 機械学習(ML)における強力なパラダイムである。 を認識または検出することができる。従来の 従来の教師あり学習では、モデルは次のような学習が必要である。 従来の教師あり学習では、モデルは識別する必要のある特定のカテゴリーごとに、何千ものラベル付き画像で学習しなければならない。ZSLはこの制約を 補助的な情報(典型的にはテキスト記述、属性、または意味的埋め込み)を活用することで、この制約を排除する。 の間のギャップを埋める。 クラス間のギャップを埋める。この機能により 人工知能(AI)システムは この機能により、人工知能(AI)システムは、より柔軟でスケーラブルになり、動的な環境にも対応できるようになる。 可能性のあるすべてのオブジェクトについて網羅的なデータを収集することは現実的ではありません。
ZSLの核となるメカニズムは、共有された意味空間を使って、馴染みのある概念から馴染みのない概念へと知識を伝達することである。 意味空間を共有する。ピクセルのパターンを記憶することのみによって「猫」を認識することを学習する代わりに、モデルは次のように学習する。 は、視覚的特徴と意味的属性(例えば、「三毛」、「ひげ」、「4つ」)の関係を学習する。 「ひげ」、「4本足」など)。 自然言語処理(NLP)に由来する。
このプロセスは多くの場合 画像表現とテキスト表現を整合させるマルチモーダルモデルに頼ることが多い。 モデルに依存することが多い。例えば 例えば、OpenAIのCLIPのような基礎研究は、モデルがどのように自然言語監視から視覚的概念を学習できるかを示している。 を学習する方法を示している。ZSLモデルは、希少な鳥類のような未知のオブジェクトに遭遇すると、視覚的特徴を抽出し、それを意味の辞書と比較する。 視覚的特徴を抽出し、意味ベクトルの辞書と比較します。視覚的特徴が 視覚的特徴が新しいクラスの意味的記述と一致すれば、モデルはそれを正しくclassify ことができ、効果的に「ゼロショット」予測を実行する。 「ゼロ・ショット」予測を行う。
ZSLを完全に理解するためには、次のような類似の学習戦略と区別することが役に立つ。 コンピュータビジョン(CV)で使用される同様の学習ストラテジーと区別することが有用である:
ゼロショット・ラーニングは、システムが最初のトレーニングを越えて汎化できるようにすることで、様々な業界のイノベーションを促進している。 を可能にすることで、さまざまな業界のイノベーションを推進しています。
Ultralytics YOLOモデルは、ゼロ・ショットを体現している。 学習を実践している。モデルを再トレーニングすることなく、実行時に動的にカスタムクラスを定義することができます。これは を接続することで実現します。 YOLO11検出バックボーンと CLIPベースのテキストエンコーダと接続することで実現される。
次のPython 例は、YOLO、標準的なCOCOデータセットに含まれないオブジェクトをdetect する方法を示している。
COCO データセットに含まれないオブジェクトを検出する方法を示す。 ultralytics パッケージで提供される。
from ultralytics import YOLOWorld
# Load a pre-trained YOLO-World model
model = YOLOWorld("yolov8s-world.pt")
# Define custom classes for Zero-Shot detection using text prompts
# The model will now look for these specific descriptions
model.set_classes(["blue backpack", "red apple", "person wearing sunglasses"])
# Run inference on an image to detect the new zero-shot classes
results = model.predict("path/to/image.jpg")
# Show the results
results[0].show()
ZSLは計り知れない可能性を秘めているが、ドメインシフト問題などの課題に直面している。 トレーニング中に学習された意味属性が、未知のクラスの視覚的外観に完全に対応するわけではないという問題である。 さらに、ZSLモデルはバイアスに悩まされることがある。 一般化ゼロショット学習)。
スタンフォード大学のAIラボやEEEE Computer Societyのような組織による研究は、このような限界に取り組み続けている。 IEEE Computer Societyのような組織による研究は、これらの限界に取り組み続けている。そして 基礎モデルがより強固になれば、ZSLは コンピュータビジョンツールの標準機能になることが期待されている。 コンピュータ・ビジョン・ツールの標準機能になることが期待されている。 データのラベリング作業への依存を減らし、高度なAI機能へのアクセスを民主化する。 高度なAI能力へのアクセスを民主化する。

