YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

プロンプトチェイニング

プロンプトチェーニングをご覧ください。大規模言語モデルを使用した複雑なタスクの精度、制御、および精度を高めるステップバイステップのAI技術です。

プロンプトチェイニングは、人工知能(AI)モデルに対する一連のより小さく、相互接続されたプロンプトに分割することにより、複雑なタスクを管理するために使用される強力な手法です。多段階の問題を解決するために単一の巨大なプロンプトに依存する代わりに、あるプロンプトからの出力が次のプロンプトへの入力となるチェーンが作成されます。このモジュール式アプローチは、特に大規模言語モデル(LLM)の、AIシステムの信頼性、透明性、および全体的なパフォーマンスを向上させます。これにより、ロジック、外部ツール、さらには複数の異なるAIモデルを含む洗練されたワークフローの構築が可能になります。

プロンプトチェイニングの仕組み

プロンプトチェイニングは、本質的に、1つまたは複数のAIモデルへの呼び出しのシーケンスを調整します。このプロセスは、論理的な流れに従います。最初のプロンプトがモデルに送信され、その応答が処理され、その応答からの重要な情報が抽出され、シーケンス内の次のプロンプトの構築に使用されます。このサイクルは、最終的な目標が達成されるまで続きます。この方法は、推論して行動できるAIエージェントを構築するために不可欠です。

このアプローチでは、タスク分解が可能になり、チェーン内の各ステップが特定のサブタスクに最適化されます。たとえば、あるプロンプトは情報抽出用に設計され、次のプロンプトはデータ要約用に、そして最後のプロンプトはクリエイティブなテキスト生成用に設計されることがあります。LangChainのようなフレームワークは、状態、プロンプト、および外部ツールの統合を管理することにより、これらのチェーンの開発を簡素化するように特別に設計されています。

実際のアプリケーション

プロンプトチェイニングは用途が広く、機械学習(ML)およびワークフロー自動化において多くの実用的なアプリケーションがあります。

  1. 自動カスタマーサポートエージェント: ユーザーが複雑なサポートチケットを送信します。

    • プロンプト1(分類): LLMは、ユーザーのメッセージを分析して、問題を分類します(例:「請求」、「技術」、「アカウントアクセス」)。
    • プロンプト2(データ検索): 「技術」分類に基づいて、システムは検索拡張生成(RAG)ステップを実行します。新しいプロンプトは、AIに技術知識ベースから関連ドキュメントを検索するように求めます。
    • プロンプト3(回答生成): 検索されたドキュメントは、LLMに情報を合成し、ユーザーに明確なステップバイステップの解決策を生成するように指示する最終プロンプトに入力されます。RAGシステムの仕組みについて詳しく学んでください。
  2. マルチモーダルコンテンツの作成:マーケターは、新製品のソーシャルメディアキャンペーンを作成したいと考えています。

    • プロンプト1(テキスト生成): マーケターが製品の詳細を提供し、プロンプトはLLMに5つのキャッチーなマーケティングスローガンを生成するように求めます。
    • プロンプト2(画像生成): 選択されたスローガンは、テキストから画像へのモデル(Stable Diffusionなど)に向けられた新しいプロンプトのシードとして使用され、対応するビジュアルを作成します。
    • プロンプト3(ビジョン分析): カスタムトレーニングされたUltralytics YOLOモデルなどのコンピュータビジョンモデルを後続のステップで使用して、生成された画像がブランドガイドラインを満たしていることを確認できます(例:正しいロゴが存在することを確認)。このようなモデルは、Ultralytics HUBのようなプラットフォームを介して管理およびデプロイできます。

プロンプトチェイニングと関連概念の比較

プロンプトチェイニングと類似技術を区別すると役立ちます。

  • Prompt Engineering(プロンプトエンジニアリング): これは、効果的なプロンプトを設計するための広範な手法です。プロンプトチェーニングは、複数のプロンプトを順番に構成することに焦点を当てた、プロンプトエンジニアリング内の特定の技術の1つです。

  • Chain-of-Thought(CoT)プロンプト: CoTは、LLMの推論を単一のプロンプト内で改善することを目的としており、「段階的に考える」ように依頼します。対照的に、プロンプトチェイニングは、タスクを複数の異なるプロンプトステップに分割し、異なるモデルまたは各ステップでツールを使用する場合があります。

  • 検索拡張生成(RAG): RAGは、AIが応答を生成する前に外部ソースから情報を取得する手法です。RAGは、多くの場合、より大きなプロンプトチェーン内の1つの特定のステップとして使用され、チェーンメカニズム自体としては使用されません。

  • Prompt Enrichment(プロンプトエンリッチメント): これには、AIに送信されるに、ユーザーの最初のプロンプトにコンテキストを自動的に追加することが含まれます。これは、複数の相互接続されたプロンプトのシーケンシャルな処理を調整するのではなく、単一のプロンプトを強化します。

  • プロンプトチューニング: パラメータ効率的なファイン チューニング(PEFT)手法であり、モデルトレーニング中に「ソフトプロンプト」(埋め込み)を学習します。これは、プロンプトチェイニングのランタイム実行構造とは異なる、モデルのカスタマイズ手法です。

プロンプトチェイニングは、高度なLLMのようなAIモデルとのインタラクションを構造化し、画像分類インスタンスセグメンテーションに使用されるものを含む他のAIシステムと統合するための強力な方法です。これにより、複雑なタスクがより管理しやすくなり、基本的なデータ分析から高度なマルチモーダルAIシステムまで、さまざまな機械学習アプリケーションにおける結果の信頼性が向上します。このようなチェーンのコンポーネントを形成できる特殊なモデルのデプロイメントは、エンドツーエンドプラットフォームによって促進されます。これらの高度なワークフローに統合できるさまざまなコンピュータビジョンタスクを調べることができます。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました