Yolo 深圳
深セン
今すぐ参加
用語集

プロンプトエンリッチメント

プロンプトエンリッチメントでAIをマスターしましょう!コンテキスト、明確な指示、および例を使用して大規模言語モデルの出力を強化し、正確な結果を得ます。

プロンプト・エンリッチメントとは、ユーザーの最初の入力を、関連するコンテキスト、データ、または指示で自動的に補強するプロセスのことである。 人工知能(AI)モデルに送信する前に 人工知能(AI)モデルに送信する前に、ユーザーの初期入力を関連する文脈やデータ、指示で自動的に補強するプロセスです。これにより ユーザーが省略した可能性のある特定の詳細を注入することで、このテクニックは以下を確実にします。 大規模言語モデル(LLM)とビジョン システムが包括的なクエリを受け取ることを保証し、より正確で、パーソナライズされた、実用的な出力につながります。これは インテリジェントなミドルウェア層として機能する。 インテリジェントなミドルウェア層として機能します。

濃縮のメカニズム

プロンプト・エンリッチメントの核となる機能は、ユーザーの漠然とした意図と、AIが必要とする正確な入力とのギャップを埋めることである。 AIが必要とする正確な入力とのギャップを埋めることである。クエリーを受信すると、システムはユーザーの好みや履歴データ、リアルタイムのセンサー読み取り値などの補足情報を検索する、 過去のデータ、リアルタイムのセンサーの測定値などの補足情報をナレッジグラフやデータベースから取得する。 ナレッジグラフやデータベースから取得する。この検索されたデータは プログラムでフォーマットされ、元のクエリに追加される。

例えば 自然言語処理(NLP)、 のような単純な質問では、モデルとして不十分である。エンリッチメントによって、システムは システムは、ユーザーのアクティブなセッションIDを特定し、ベクターデータベースで最新のトランザクションを検索し 最新のトランザクションを検索し、プロンプトを次のように書き換える: 「ユーザー(ID: 5521)は、現在輸送中のオーダー#998について質問しています。この追跡データに基づいてステータスを更新してください。 この追跡データに基づいてステータスを更新してください。"

実際のアプリケーション

迅速なエンリッチメントは、さまざまな産業で堅牢な生成AIアプリケーションを展開するために不可欠です。 生成的AIアプリケーションを展開するために不可欠です:

  1. コンテキストを考慮したカスタマーサポート:自動ヘルプデスクでは チャットボットは、エンリッチメントを使用して、顧客の購入履歴や技術環境 履歴や技術環境にアクセスします。ユーザーにデバイスのバージョンを尋ねる代わりに、システムはアカウントのメタデータからこれを取得し、プロンプトに注入します。 アカウントメタデータから取得し、プロンプトに注入します。これにより AIエージェントはデバイスに特化した トラブルシューティングのステップを即座に提供できるようになり 顧客体験を大幅に改善する。
  2. ダイナミック・コンピュータービジョン・コンフィギュレーション:警備業務では、ユーザーは単に「ナイトモード」の設定を切り替えるだけでよい。 「ナイトモード」の設定を切り替えるだけかもしれません。舞台裏では、プロンプト・エンリッチメントがこのハイレベルな意図を具体的な オブジェクト・クラスに変換します。 ビジョン言語モデル(VLM) またはオープンボキャブラリ検出器。システムは、特に "懐中電灯"、"不審な動き"、または "未登録者 "を探すためにプロンプトをエンリッチする。 「不審な動き"、"不正な人物 "といった具合に、プロンプトをエンリッチ化し、モデルが動的に物体検出のフォーカスを適応させることを可能にします。 動的に適応させることができる。

例YOLO動的クラス充実化

次のPython 例は、以下のUltralytics YOLO-Worldを使用したプロンプトのエンリッチメントの概念を示しています。 Ultralytics YOLO使用しています。ここでは、ユーザーの単純な "モード "の選択が、プログラムによって特定の記述クラスのリストにエンリッチされ、モデル がスキャンします。

from ultralytics import YOLO


def run_enriched_inference(user_mode):
    """Enriches a simple user mode into specific detection prompts."""
    # Load an open-vocabulary YOLO model
    model = YOLO("yolov8s-world.pt")

    # Enrichment Logic: Map simple user intent to detailed class prompts
    context_map = {
        "site_safety": ["hard hat", "safety vest", "gloves"],
        "traffic": ["car", "bus", "traffic light", "pedestrian"],
    }

    # Inject the enriched context into the model
    enriched_classes = context_map.get(user_mode, ["object"])
    model.set_classes(enriched_classes)

    # The model now looks for the specific enriched terms
    # model.predict("site_image.jpg") # Run inference
    print(f"Mode: {user_mode} -> Enriched Prompt: {enriched_classes}")


# Example usage
run_enriched_inference("site_safety")

プロンプトエンリッチメントと関連概念

効果的な 機械学習オペレーション(MLOps)を効果的に実施するためには、プロンプト・エンリッチメントを類似の用語と区別することが有効である:

  • リトリーバル・アグメンテッド・ジェネレーション(RAG) RAGはエンリッチメントの特殊な手法である。これは厳密には、外部コーパスから関連文書をフェッチし、モデルの応答を基礎づけるメカニズムを指す。 を外部コーパスから取得し、モデルの応答の根拠とするメカニズムのことである。エンリッチメントとは、RAGを含むより広い概念である。 静的なセッションデータ、ユーザーメタデータ、またはシステム時間を注入することである。 意味的な検索を実行する必要はない。
  • プロンプト・エンジニアリングこれは 効果的なプロンプトを設計するための手作業です。エンリッチメントは、プロンプトエンジニアリングの原則を実行時に動的に適用する自動化されたプロセスである。 エンジニアリングの原則を実行時に動的に適用する自動化されたプロセスである。
  • プロンプト・チューニングこれは パラメータ効率的微調整(PEFT) ソフトプロンプト」(学習可能なテンソル)を学習中に最適化する手法。プロンプトの充実 は完全にリアルタイム推論中に行われ リアルタイム推論中に行われ モデルの重みを変更しない。
  • 数撃ちゃ当たる学習これは これは、モデルにタスクを教えるために、プロンプト内で例を提供することを含む。エンリッチメントシステムは、タスクの種類に応じて動的に タスクのタイプに基づいて動的に注入される。

現代のAIシステムにおける妥当性

のようなモデルがある。 Ultralytics YOLO11やGPT-4のような ボトルネックはしばしば入力の質に移行する。プロンプト・エンリッチメントは LLMの幻覚を軽減する。 LLMの幻覚を軽減する。コンピュータビジョン(CV)では コンピュータビジョン(CV)では、柔軟なゼロショット検出システムを可能にする、 ゼロショット検出システムが可能になる。 この柔軟性は、スケーラブルなシステムを構築する上で極めて重要である。この柔軟性は、スケーラブルな マルチモーダルAIソリューションの構築には不可欠である。 この柔軟性は、テキストと画像の両方を推論できる、拡張性のあるマルチモーダルAIソリューションを構築する上で極めて重要である。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加