用語集

プロンプト・チェイニング

プロンプト・チェイニング:ラージ・ランゲージ・モデルを使った複雑なタスクの精度、制御、正確さを向上させるステップバイステップのAIテクニックをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

プロンプト連鎖とは、人工知能(AI)において、複雑なタスクを、より単純で相互に連結された一連のプロンプトに分解して管理するために使用される手法である。プロンプト連鎖では、目標を達成するために1つの大きな、扱いにくい可能性のあるプロンプトを使用する代わりに、1つのAIモデル(多くの場合、大規模言語モデルまたはLLM)の応答の出力を、一連の次のプロンプトの入力として供給する。このモジュール式アプローチにより、より高度な制御、精度の向上、より洗練された推論やワークフローを処理できるようになり、複雑なAIタスクがより管理しやすくなる。

プロンプト・チェイニングの仕組み

プロンプト・チェイニングの核となる考え方は、タスクの分割である。AIが1つのステップで正確に解決することが困難な複雑な問題を、より小さく管理しやすいサブタスクに分割する。各サブタスクは、チェーン内の特定のプロンプトによって対処される。AIは最初のプロンプトを処理し、出力を生成し、この出力(またはその処理バージョン)が2番目のプロンプトの入力の一部となり、これが繰り返される。このステップ・バイ・ステップのプロセスにより、AIはタスクを通じてガイドされ、各ステージが前のステージの上に論理的に構築されるようになる。この方法は、単一の、しばしば複雑で信頼性の低いプロンプトを使って問題全体を解決しようとするのとは対照的である。LangChainのようなフレームワークは、一般的にこのようなチェーンを実装するために使用され、このようなマルチステッププロセスのオーケストレーションを簡素化する。プロンプト間の情報の流れは、チェーンの成功の鍵となる。

利点と応用

プロンプト・チェイニングには、高度なAIシステムを開発する上でいくつかの利点がある:

  • 精度と信頼性の向上:タスクを分解することで、各ステップでの複雑さが軽減され、より正確な中間結果と最終結果が得られます。この段階的な改良により、エラーやAIの幻覚の可能性を最小限に抑えます。
  • コントロールとデバッグの強化:チェーン内の各ステップを個別に監視、評価、デバッグできるため、単一のモノリシックなプロンプトのトラブルシューティングと比較して、問題の特定と修正が容易になります。これは、MLOpsのベスト・プラクティスに沿ったものです。
  • 複雑性への対応:単一のプロンプトでは複雑すぎる推論、情報検索、変換の複数の段階を必要とするタスクにAIが取り組むことを可能にする。これは高度なAIエージェントを構築する上で極めて重要である。
  • モジュール性と再利用性:個々のプロンプトまたはサブチェーンは、異なるワークフロー間で再利用できる可能性があり、開発の効率化を促進する。このモジュール性は、ソフトウェアエンジニアリングの基本原則です。

実例:

  1. カスタマーサポートの自動化: A チャットボット はプロンプトチェイニングを使用してユーザーからの問い合わせを処理する。
    • プロンプト1:ユーザーのリクエストを分析し、意図とキーエンティティ(製品名、issueタイプなど)を特定します。
    • プロンプト 2:抽出されたエンティティを使用して、関連するトラブルシューティング記事やFAQをナレッジベースから検索します。
    • プロンプト3:特定のユーザーの問題に基づいて、検索された情報をまとめます。
    • プロンプト4:要約を取り入れた、ユーザーに対する明確で共感的な返答を作成する。
  2. レポーティングのためのビジョンと言語の統合: によって撮影された画像から説明的なレポートを生成する。 セキュリティシステム.

プロンプト・チェイニングと関連コンセプト

プロンプト・チェイニングを類似のテクニックと区別することは有益だ:

  • プロンプト・エンジニアリングプロンプトエンジニアリングとは、AIモデルに効果的なプロンプトを設計するための幅広い手法である。プロンプト連鎖は、プロンプトエンジニアリングの中の特定のテクニックの1つで、複数のプロンプトを連続的に構造化することに重点を置いている。
  • チェーン・オブ・ソート(CoT)プロンプティングCoTは、LLMに "ステップバイステップで考える "よう求めることで、1つのプロンプト内でLLMの推論能力を向上させることを目的としている。逆に、プロンプト・チェーニングは、タスクを複数の明確なプロンプト・ステップに分割し、各ステップで異なるモデルやツールを関与させる可能性がある。
  • 検索拡張生成(RAG)RAGは、AIモデルが応答を生成する前に、外部の知識ソースから関連情報を検索する手法である。RAGは多くの場合、より大きなプロンプトチェーン(例えば、カスタマーサポートの例におけるナレッジベース検索)の中の1つの特定のステップとして使用されます。RAGシステムの詳細については、こちらをご覧ください。
  • プロンプトの充実これは、AIに送信される前に、ユーザーの最初のプロンプトに文脈や詳細を自動的に追加することである。これは1つのプロンプトを強化するもので、チェイニングのように複数のプロンプトを連続して処理することはありません。
  • プロンプトチューニングテキストプロンプトを作成するのではなく、特定の「ソフトプロンプト」(エンベッディング)を学習するPEFT(Parameter-Efficient Fine-Tuning)手法。プロンプト連鎖の実行構造とは異なる、モデルトレーニングの手法である。

プロンプト・チェイニングは、LLMのような高度なAIモデルとのインタラクションを構造化し、さらには画像分類や インスタンス分割に使用されるような他のAIシステムと統合するための強力な手法である。複雑なタスクをより扱いやすくし、基本的なデータ分析から洗練されたマルチモーダルAIシステムまで、さまざまな機械学習アプリケーションにおける結果の信頼性を向上させます。Ultralytics HUBのようなプラットフォームは、そのようなチェーンのコンポーネントを形成するモデルのトレーニングと 展開を容易にします。

すべて読む