用語集

思考の連鎖を促す

思考連鎖プロンプトでAIの推論を強化!複雑なマルチステップタスクの正確性、透明性、コンテキストの保持を強化します。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

思考連鎖(CoT)プロンプトは、複雑な推論タスクを実行する能力を向上させるために、主に大規模言語モデル(LLM)で使用される高度なテクニックです。CoTは、最終的な答えだけを求めるのではなく、論理的に解決に導く中間ステップや「思考の連鎖」を生成するようモデルを促します。このアプローチは人間の問題解決プロセスを模倣しており、算術的、常識的、または記号的推論を必要とする問題にモデルがより効果的に取り組むのを助け、多くの場合、精度を大幅に向上させる。このテクニックは、Google AIの研究で特に強調されている。

思考連鎖型プロンプティングの仕組み

CoTプロンプトは、問題をどのように分解するかを明示的に示すことで、AIモデルをガイドする。主に2つのバリエーションがある:

  1. 数ショットのCoT:プロンプトにはいくつかの例(ショット)があり、それぞれの例は質問、詳細なステップバイステップの推論プロセス(思考の連鎖)、最終的な答えで構成されています。モデルはこれらの例から学習し、実際に聞かれた質問に同様の推論プロセスを適用する。これは推論経路に適用される数ショット学習の一形態である。
  2. ゼロショットCoT:このシンプルなアプローチでは、例を示す必要はない。その代わりに、「ステップバイステップで考えましょう」というような簡単な指示が問題に付け加えられます。このキューは、最終的な答えを出す前に、モデルが推論のプロセスを明確にすることを促します。これは、大規模な事前トレーニングで学習したモデル固有の能力を活用します。

推論のステップを外部化することで、CoTはモデルのプロセスをより透明にし、推論がどこで間違ったかを簡単にデバッグできるようにする。CoTは標準的なプロンプトとは対照的で、直接的な答えを求めることが多く、複数の論理的ステップを必要とするタスクで失敗する可能性がある。

利点と応用

CoTプロンプトの主な利点は、標準的なプロンプトが苦手とする複雑なタスクに対して、LLMの推論能力を強化できることである。主な利点は以下の通り:

  • パフォーマンスの向上:数学的な単語問題、論理的なパズル、複数ステップの質問に答えるなどのタスクの精度が大幅に向上します。
  • 透明性の向上:生成された思考の連鎖は、モデルの推論プロセスに対する洞察を提供し、説明可能なAI(XAI)に貢献する。
  • 複雑性のより良い処理:管理可能な小さなステップに分解する必要がある問題に、モデルが取り組むことができる。

実例:

  1. 複雑な顧客サポート:CoTを使用したAIチャットボットは、複数の部分にまたがる技術的な問題のトラブルシューティングや、複雑な請求に関する問い合わせの説明など、複雑な顧客問題を処理することができます。CoTプロンプトは、まずAIが中核となる問題を特定し、次に関連するポリシーや技術的ステップを呼び出し、必要に応じてユーザー履歴を確認し、最後に顧客のために段階的な解決プランを策定するようガイドします。これは、解決策を直接推測するよりも効果的である。セールスフォース・アインシュタインのようなプラットフォームは、同様の推論を顧客サービスに活用している。
  2. データ分析と解釈:データセットと複雑なクエリ(例えば、「このレポートに基づいて、前四半期の売上減少の主な要因を特定する」)が提示された場合、CoTを使用するLLMは、分析計画の概要を示すことができる。第1に、関連するデータポイントを特定し、第2に、必要な計算や比較を実行し、第3に、発見を統合し、最後に、結論を提示する。この構造化されたアプローチは、AIによって生成されたデータ分析の洞察の信頼性を向上させる。

CoTは、医療画像解析のサポートや金融モデリングなど、信頼性の高い複雑な意思決定を必要とする分野で特に価値があり、以下のようなモデルによって駆動されるコンピュータビジョン(CV)のような分野の進歩を補完する。 Ultralytics YOLO.

関連概念との比較

CoTプロンプトは、自然言語処理(NLP)や機械学習(ML)における他の技術に関連しているが、それとは異なる:

  • プロンプト・エンジニアリングこれは、AIモデルのための効果的な入力(プロンプト)を設計する広範な実践である。CoTは推論を引き出すことに特化した、高度なプロンプトエンジニアリングのテクニックである。他の技法としては、明瞭さ、文脈の提供(プロンプトの充実)、またはフォーマットの指定に重点を置くものがある。
  • プロンプト連鎖プロンプトの連鎖は、複雑なタスクを、より単純で相互に接続されたプロンプトのシーケンスに分割することを含み、1つのプロンプトの出力が次のプロンプトの入力になる。この場合、外部からのオーケストレーション(LangChainのようなフレームワークの使用など)が必要になることが多い。対照的に、CoTは単一のプロンプトと応答の相互作用の中で推論プロセス全体を引き出すことを目的としている。
  • ゼロショット学習これは、明示的に訓練されていないタスクを、例なしで実行するモデルの能力を指す。ゼロショットCoTは、推論をトリガーするために一般的な命令(「ステップバイステップで考えよう」)を使用する、この特定のアプリケーションです。しかし、CoTは、純粋なゼロショット学習とは異なり、タスクに特化した推論例を提供する数ショットの設定で、より良いパフォーマンスを発揮することが多い。

CoTプロンプトは、より有能で解釈可能な人工知能(AI)システムを構築するための重要な一歩です。このようなテクニックを理解し活用することは、洗練されたAIモデルを開発する際に有益であり、Ultralytics HUBのようなプラットフォームを活用してトレーニングとデプロイメントを管理できる可能性があります。自己一貫性(Self-Consistency)のような技術は、複数の推論パスをサンプリングし、最も一貫性のある答えを選択することで、CoTをさらに強化することができます。

すべて読む