Agentic RAG
自律的な推論によってAIを強化するAgentic RAGを探求します。Ultralytics YOLO26とUltralytics Platformがどのようにインテリジェントな検索とビジョンを推進しているかを学びましょう。
Agentic Retrieval-Augmented Generation (Agentic RAG) is an advanced artificial intelligence (AI) architecture that enhances traditional retrieval systems by integrating autonomous AI agents. While standard RAG pipelines operate in a linear "retrieve-and-generate" sequence, Agentic RAG empowers a Large Language Model (LLM) to act as an intelligent orchestrator. This agent can independently analyze a user's prompt, determine if external information is needed, formulate multiple search queries, evaluate the retrieved data, and iteratively refine its research until it compiles a comprehensive and accurate answer. By leveraging function calling and tool use capabilities, these systems dynamically route queries across various databases, APIs, and analytical tools, significantly reducing hallucinations in LLMs when dealing with complex, multi-step problems.
Link to this sectionAgentic RAG システムの仕組み#
Agentic RAG の核心的なイノベーションは、ループして推論する能力にあります。主要な エージェント型AIフレームワーク は、このプロセスを動的かつ自律的なワークフローとして構成します。
- クエリの計画とルーティング: エージェントは複雑な質問を小さく管理しやすいサブタスクに分解し、それぞれを最も適切なツールまたは ベクトルデータベース にルーティングします。
- 反復的な検索: 静的な検索とは異なり、エージェントは取得したドキュメントを確認します。コンテキストが不十分な場合、エージェントは検索戦略を再策定し、再度クエリを実行します。
- ツール統合: エージェントはコードの記述と実行、計算の実行、あるいは 機械学習 (ML) モデルのトリガーを行い、その場で新しいデータを合成できます。
Link to this sectionAgentic RAG と標準的な RAG の比較#
堅牢な生成パイプラインを実装するには、Agentic RAG をその基礎となる概念と区別することが重要です。
- 標準的なRetrieval-Augmented Generation (RAG): 単一パスで動作します。セマンティックな類似性に基づいてドキュメントを取得し、応答を生成します。複数のステップにわたって異なるデータソースを合成する必要がある複雑なロジックには対応できません。
- Agentic RAG: 意思決定とループの概念を導入します。エージェントは検索結果の品質を評価し、生成を完了する前に後続の検索や別のツールをトリガーすることができます。
- マルチモーダルRAG: 多様なデータタイプ(画像、テキスト、動画)の取得に焦点を当てています。Agentic RAG はマルチモーダルRAGパイプラインを制御し、視覚データベースを検索するかテキストドキュメントを検索するかを いつ 行うかを決定できます。
Link to this section実社会での応用#
Agentic RAG は、人間の分析的推論を模倣する詳細な調査や複雑なトラブルシューティングタスクを自動化することで、産業を変革しています。
- 企業向け知識合成: 企業環境では、エージェントは「第3四半期のパフォーマンスを要約し、競合他社の最新の決算と比較せよ」というプロンプトを受け取るかもしれません。エージェントは自律的に社内の財務データベースをクエリし、競合他社の開示資料をリアルタイムでウェブ検索し、計算ツールを使用して数値を分析し、包括的なブリーフ案を作成します。
- 自律品質検査: 製造現場において、エージェントは組み立て不良の根本原因を特定するタスクを担うことができます。エージェントは コンピュータビジョン (CV) モデルをトリガーしてライブカメラ映像を検査し、過去のメンテナンスログを照会し、視覚的およびテキスト的な証拠に基づいて診断レポートを合成します。
Link to this sectionビジョンAIのエージェントワークフローへの統合#
ビジョンモデルは、物理世界と対話する Agentic RAG システムにとって強力な感覚ツールとして機能します。たとえば、エージェントは Ultralytics YOLO26 を使用して、画像やビデオストリームから動的に視覚的なコンテキストを取得し、ユーザーの質問に回答できます。開発者は Ultralytics Platform を使用して、これらのカスタムビジョンツールのデータアノテーションとトレーニングを管理できます。
次の Python 例は、AIエージェントがプログラム的に YOLO26 を呼び出して画像から構造化された観測結果を抽出し、次の推論ステップのための事実に基づいたコンテキストを収集する方法を示しています。
from ultralytics import YOLO
# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")
# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")
# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")非常に高性能なビジョンモデルを推論エンジンに接続することで、Agentic RAG は静的な知識検索と動的な実世界の 空間インテリジェンス とのギャップを埋めます。自律型システムの進化する状況に関するより深い洞察については、Stanford AI Index Report がエージェント能力の包括的な追跡を提供しています。






