Agentic Workflows
エージェント型ワークフローがどのように自律的なAIエージェントによる複雑なタスクの解決を可能にするかをご覧ください。Ultralytics YOLO26のような高度なビジョンツールの統合方法を学びましょう。
Agentic Workflowsは、人工知能 (AI)における変革的なアプローチであり、複数の自律的なエージェントが相互に作用し、意思決定を行い、最小限の人的介入で多段階のタスクを実行します。厳格で直線的な実行パスに従う従来のマシンラーニングパイプラインとは異なり、Agentic Workflowsは非常に動的です。インテリジェントエージェントや調整されたエージェントネットワークが、周囲を認識し、複雑な問題を論理的に考え、外部ツールを活用してあらかじめ定義された目標を達成することを可能にします。組織がAIイニシアチブを拡大するにつれて、エンタープライズAgentic Workflowsは孤立したスクリプトに取って代わり、多様な産業全体で堅牢かつスケーラブルな自動化を実現しています。
Agentic Workflowsの理解
Agentic Workflowsの核心は、AIを受動的な生成から能動的な問題解決へとシフトさせることです。これには、単一のプロンプトによるやり取りから、計画、実行、観察という反復的なループへの移行が必要です。これらのループを調整することで、開発者は予期しないエッジケースに対処し、自らのエラーを修正できるシステムを構築できます。
密接に関連する概念を明確に区別すると、AIエージェントとは、(多くの場合大規模言語モデル (LLM)によって駆動される)推論と行動を行う個々の自律的なエンティティです。対照的に、Agentic Workflowsとは、これらのエージェントがいかに協力し、メモリを共有し、アクションを順序付けるかを統括する包括的なアーキテクチャプロセスです。さらに、生成AIは主にユーザープロンプトに基づいて単一の直線的なパスでコンテンツを作成しますが、Agenticシステムは、自己反省、計画、マルチエージェント討論といったエージェント設計パターンを使用して、目標が完全に達成されるまで出力を継続的に洗練させます。
主要コンポーネント
いくつかの基本的な要素が、これらのワークフローの成功を推進します:
- LLMバックボーン:ワークフローの中心的な推論エンジン。フレームワークはOpenAIのGPT-4oのような最先端モデルを調整し、ユーザーの意図を解釈して実行計画を動的に生成します。
- [関数呼び出しとツール使用:エージェントは外部世界とやり取りするための特定のツールを備えています。これには、データベースへのクエリ、コードの実行、またはコンピュータービジョンモデルを呼び出して視覚データを分析することが含まれます。OpenAIの関数呼び出しに関するドキュメントでは、外部APIを確実にトリガーするためにモデルが出力をフォーマットする方法が概説されています。
- オーケストレーションフレームワーク:LangGraph、CrewAIやMicrosoft AutoGenのようなライブラリは、エージェントを接続し、会話状態を管理し、タスクをインテリジェントにルーティングするための重要なインフラストラクチャを提供します。
- メモリとコンテキスト管理:ハルシネーションを防ぎ、多段階プロセス全体で一貫性を維持するために、ワークフローは短期メモリ(現在の会話コンテキストウィンドウ)と長期メモリ(永続的なデータベース)を保持し、過去のやり取りから学習します。
現実世界のアプリケーション
Agentic Workflowsは、現実世界の複雑でオープンエンドなタスクを積極的に解決しています:
-
自律的な視覚検査: 製造現場において、エージェントシステムは欠陥検出を自動化できます。オーケストレーターエージェントがカメラツールをトリガーして画像をキャプチャし、物体検出モデルを使用して処理し、出力を分析します。欠陥が見つかった場合、エージェントは自律的にメンテナンスチケットを記録し、手動レビューのために製品をルーティングして、工場全体の対応を管理します。
-
インテリジェントなドキュメント解析: 金融および法務分野では、非構造化PDFから構造化データを抽出するようにワークフローが設計されています。エージェントは反復的にレイアウト検出を適用し、ターゲットを絞ったプロンプトエンジニアリングを使用して、抽出されたテーブルを自己修正し、期待される財務スキーマに対して検証します。
-
動的なマーケティング運用: 先見の明のあるマーケティングチームは、現在のトレンドを自律的に分析し、キャンペーンアセットを生成し、広告コピーのバリエーションをテストし、リアルタイムのパフォーマンス指標に基づいて予算戦略を調整するエージェントを配置することで、マーケティングワークフローを再構築しています。
例:Vision-Agentワークフローの構築
Ultralytics Platformとultralytics Pythonパッケージを使用すると、視覚的インテリジェンスをAgentic Workflowsに簡単に統合できます。この概念的な例では、エージェントシステムはYOLO26を認識ツールとして使用して工場ラインを検査し、ワークフローの基礎となるロジックがpredictモードの結果に基づいて次のアクションを自律的に決定できるようにします。
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Agentic workflow step 1: Vision tool gathers environmental data
results = model.predict("factory_line.jpg")
# Agentic workflow step 2: Agent logic evaluates the visual detections
def decision_agent(detections):
for obj in detections:
# Check if the model detected a specific class, e.g., 'defect'
if obj.names[int(obj.cls)] == "defect":
return "Action: Trigger immediate maintenance alert."
return "Action: Continue production line smoothly."
# Execute the agent's decision logic based on bounding box data
action = decision_agent(results[0].boxes)
print(action)内部でPyTorchのようなフレームワークを活用することで、これらのビジョンツールは非常に正確な空間認識情報を広範なAIロジックに供給します。エージェント組織が成熟し続けるにつれて、高度な推論モデルとリアルタイムビジョン機能の組み合わせが、次世代のインテリジェントで自己修正可能な自動化を推進します。アクティブラーニングを通じた継続的な改善と洗練されたオーケストレーションにより、Agentic WorkflowsはAIシステムが複雑な戦略をエンドツーエンドで確実に実行することを保証します。






