Yolo 深圳
深セン
今すぐ参加
用語集

プロンプトエンリッチメント

プロンプトエンリッチメントがAI精度向上のために入力拡張を自動化する仕組みを探求しましょう。[YOLO26](ultralytics)のような大規模言語モデル(LLM)やビジョンモデルを最適化し、より良い結果を得る方法を学びます。

プロンプトエンリッチメントとは、ユーザーの初期入力を人工知能(AI)モデルに送信する前に、関連する文脈、具体的な指示、または補足データを付加する自動化されたプロセスである。この技術は、人間と機械の相互作用を最適化するインテリジェントなミドルウェア層として機能し、大規模言語モデル(LLM)やコンピュータビジョンシステムが包括的なクエリを受け取ることを保証する。 ユーザーが省略しがちな詳細情報(過去の嗜好、位置データ、技術的制約など)を注入することで、プロンプト強化はモデルの出力精度とパーソナライゼーションを大幅に向上させます。これにより、ユーザーが詳細な指示作成の専門家である必要がなくなります。

濃縮のメカニズム

プロンプトエンリッチメントの中核機能は、曖昧な人間の意図と、モデルの最適性能に必要とされる精密でデータ豊富な入力との間のギャップを埋めることである。クエリを受信すると、システムはそれを分析し、ナレッジグラフまたは構造化データベースから必要な背景情報を取得する。この取得データはプログラム的にフォーマットされ、元のプロンプトに追加される。

例えば、 自然言語処理(NLP) ワークフローにおいて、「状況は?」といった単純な質問は文脈的に不十分です。 エンリッチメントシステムは アクティブなセッションを特定し、トランザクションデータベースから最新の注文番号を取得し、 プロンプトを次のように書き換えます: 「ユーザーは現在配送中の注文番号998について質問しています。このステータスに基づいて配送状況の更新情報を提供してください。」 このプロセスでは、 ベクトルデータベースを活用して意味的に関連する文脈を迅速に検索し、 それを挿入することが多い。

実際のアプリケーション

プロンプトの強化は、様々な産業分野で堅牢な 生成AIアプリケーションを展開し、 テキストベースとビジョンベースの両システムを強化するために不可欠である:

  1. コンテキスト認識型カスタマーサポート:自動化されたヘルプデスクでは、 チャットボットがエンリッチメント機能を用いて顧客の購入履歴や技術環境を把握します。 ユーザーに端末バージョンを尋ねる代わりに、システムがアカウントメタデータからこれを取得し、 プロンプトに挿入します。これによりAIエージェントは即座に端末固有のトラブルシューティング手順を提供でき、 顧客体験を大幅に向上させます。
  2. 動的コンピュータビジョン構成:セキュリティ運用において、ユーザーは単に「ナイトモード」設定を切り替えるだけで済む。 バックエンドでは、プロンプト強化技術がこの高レベルな意図を、YOLOオープンボキャブラリ検出器向けの具体的なオブジェクトクラスに変換する。システムはプロンプトを強化し、「懐中電灯」「不審な動き」「不審者」を特定的にスキャンできるようにし、モデルがオブジェクト検出の焦点を動的に適応させることを可能にする。

例:動的クラス拡張

以下の通りである。 Python 例は、プロンプトエンリッチメントの概念を 使用する ultralytics パッケージ。ここでは、ユーザーの高レベルな意図がプログラム的に拡張され、 モデルがスキャンする具体的な記述的クラスのリストへと変換される。

from ultralytics import YOLO


def run_enriched_inference(user_mode):
    """Enriches a simple user mode into specific detection prompts."""
    # Load a YOLO-World model capable of open-vocabulary detection
    model = YOLO("yolov8s-world.pt")

    # Enrichment Logic: Map simple user intent to detailed class prompts
    context_map = {
        "site_safety": ["hard hat", "safety vest", "gloves"],
        "traffic": ["car", "bus", "traffic light", "pedestrian"],
    }

    # Inject the enriched context into the model
    enriched_classes = context_map.get(user_mode, ["object"])
    model.set_classes(enriched_classes)

    # The model now looks for the specific enriched terms
    print(f"Mode: {user_mode} -> Enriched Prompt: {enriched_classes}")


run_enriched_inference("site_safety")

プロンプトエンリッチメントと関連概念

効果的な 機械学習オペレーション(MLOps)を効果的に実施するためには、プロンプト・エンリッチメントを類似の用語と区別することが有効である:

  • 検索拡張生成(RAG): RAGは強化の特定の方法である。これは厳密に、モデルの応答を裏付けるため外部コーパスから関連文書を取得するメカニズムを指す。強化はより広範な概念であり、RAGを含むが、複雑な意味検索を必ずしも行わずに静的セッションデータ、ユーザーメタデータ、またはシステム時刻を注入することもカバーする。
  • プロンプト・エンジニアリングこれは 効果的なプロンプトを設計するための手作業です。エンリッチメントは、プロンプトエンジニアリングの原則を実行時に動的に適用する自動化されたプロセスである。 エンジニアリングの原則を実行時に動的に適用する自動化されたプロセスである。
  • プロンプト・チューニングこれは パラメータ効率的微調整(PEFT) ソフトプロンプト」(学習可能なテンソル)を学習中に最適化する手法。プロンプトの充実 は完全にリアルタイム推論中に行われ リアルタイム推論中に行われ モデルの重みを変更しない。
  • 数撃ちゃ当たる学習これは これは、モデルにタスクを教えるために、プロンプト内で例を提供することを含む。エンリッチメントシステムは、タスクの種類に応じて動的に タスクのタイプに基づいて動的に注入される。

現代のAIシステムにおける妥当性

Ultralytics -4のようなモデルの能力が向上するにつれ、ボトルネックはしばしば入力データの質に移行する。プロンプト強化は、モデルを事実に基づく提供データに根ざすことで、LLMにおける幻覚現象を軽減する。コンピュータビジョン(CV)分野では、 システムに与えるテキストプロンプトを修正するだけで、 再トレーニングなしに新たな環境に即座に適応できる 柔軟なゼロショット学習検出システムを実現します。 この柔軟性は、テキストと画像の両方について推論可能な スケーラブルなマルチモーダルAIソリューション構築に不可欠です。 これらのシステムのグラウンディングに用いるデータセットを管理しようとするユーザーは、情報を効果的に整理・注釈付けるために、 Ultralytics のようなツールに依存することが多い。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加