関数呼び出しとツール使用がいかにAIをAPIやデータベースとの対話に活用させるかを探ります。今日からUltralytics YOLO26をエージェントワークフローに統合する方法を学びましょう。
関数呼び出し(しばしばツール利用と呼ばれる)は、現代の人工知能(AI)における強力なパラダイムであり、モデルが静的なテキストや画像生成を超えてその能力を拡張することを可能にします。内部のトレーニングデータに基づいてプロンプトに答えるだけでなく、モデルは外部のプログラミング関数をトリガーしたり、データベースをクエリしたり、REST APIと対話したりするための構造化されたコマンドを出力できます。このアプローチにより、AIはデジタル環境で具体的なアクションを実行する能力を効果的に得られます。
AIシステムが関数呼び出しを利用する場合、開発者は、JSON Schemaを使用して記述された利用可能なツールのリストをモデルに提供します。ユーザーのプロンプトがリアルタイムデータまたは特定の動作を要求する場合、モデルは標準の生成プロセスを一時停止し、選択されたツールの必須パラメータに一致する、高度に構造化されたJSON形式のペイロードを出力します。OpenAIの関数呼び出しAPIやAnthropicのツール利用フレームワークのようなフレームワークがこの技術を普及させ、会話型エージェントを有能な問題解決者へと変化させました。
ワークフローにツール利用を統合することで、ソフトウェアの動作方法が変革されます。Berkeley Function Calling Leaderboardのようなベンチマークで評価されるこれらの機能は、高度に自律的なシステムへの移行を推進しています。
コンピュータビジョンモデルを、包括的なAIエージェントの機能ツールとして公開できます。このアーキテクチャでは、推論を実行するPythonメソッドを定義し、視覚データが必要なときに推論モデルがこれをトリガーできます。
from ultralytics import YOLO
# Define a specific tool function for an AI agent to call
def count_objects_in_scene(image_url: str) -> str:
# Load the highly efficient YOLO26 model
model = YOLO("yolo26n.pt")
# Perform inference to analyze the visual data
results = model(image_url)
object_count = len(results[0].boxes)
# Return structured context back to the calling AI system
return f"Vision Analysis: Detected {object_count} objects in the scene."
# Simulated function call executed by an AI system
print(count_objects_in_scene("https://ultralytics.com/images/bus.jpg"))
現代のAIアーキテクチャを完全に理解するには、関数呼び出しが類似の概念とどのように関連し、異なるかを理解することが役立ちます。

未来の機械学習で、新たな一歩を踏み出しましょう。