Yolo 深圳
深セン
今すぐ参加
用語集

機能呼び出し(道具の使用)

関数呼び出しとツール使用が、AIがAPIやデータベースとやり取りする能力をどのように強化するかを探求しましょう。Ultralytics エージェント型ワークフローに統合する方法を今すぐ学びましょう。

関数呼び出し(ツール使用とも呼ばれる)は、現代の人工知能(AI)における強力なパラダイムであり、モデルが静的なテキストや画像生成を超えた能力を発揮することを可能にする。内部の訓練データに基づくプロンプトへの応答だけでなく、モデルは構造化されたコマンドを出力して外部プログラミング機能を起動したり、データベースを照会したり、REST APIとやり取りしたりできる。このアプローチにより、AIはデジタル環境で具体的な行動を実行する能力を効果的に獲得する。

AIシステムが関数呼び出しを利用する場合、開発者はJSONスキーマを用いて記述された利用可能なツールのリストをモデルに提供します。ユーザーのプロンプトがリアルタイムデータや特定のアクションを要求すると、モデルは標準的な生成プロセスを一時停止し、選択されたツールの必要パラメータに合致する高度に構造化されたJSON形式のペイロードを出力します。OpenAIの関数呼び出しAPI Anthropicツール利用フレームワークといった技術が普及し、対話型エージェントを高度な問題解決能力を持つ存在へと変貌させている。

実際のアプリケーション

ツール使用をワークフローに統合することで、ソフトウェアの動作様式が変革される。 バークレー関数呼び出しリーダーボードなどのベンチマークで評価されるこれらの機能は、 高度に自律的なシステムへの移行を推進している。

  • 自動化された小売とカスタマーサービス: 小売分野におけるAIでは、仮想アシスタントが関数呼び出し機能を使用してリアルタイム在庫を確認できます。顧客が「注文品はどこですか?」と尋ねた場合、モデルはデータベースAPIへの関数呼び出しを生成し、追跡ステータスを取得して自然言語応答を返します。
  • 視覚支援データ抽出: 視覚言語モデル(VLM)Ultralytics YOLO オブジェクト検出ツールとして活用できる。工場画像の安全基準遵守を検証するよう要求された場合、メインの対話型AIはスクリプトを呼び出し、Ultralytics モデルを実行してdetect 。検出結果をシームレスにユーザーの対話画面へ返却する。

コンピュータビジョンをツールとして統合する

コンピュータビジョンモデルを包括的なAIエージェント向けの機能ツールとして公開できます。このアーキテクチャでは、推論を実行するPython メソッドを定義し、視覚データが必要な際に推論モデルがこれをトリガーします。

from ultralytics import YOLO


# Define a specific tool function for an AI agent to call
def count_objects_in_scene(image_url: str) -> str:
    # Load the highly efficient YOLO26 model
    model = YOLO("yolo26n.pt")

    # Perform inference to analyze the visual data
    results = model(image_url)
    object_count = len(results[0].boxes)

    # Return structured context back to the calling AI system
    return f"Vision Analysis: Detected {object_count} objects in the scene."


# Simulated function call executed by an AI system
print(count_objects_in_scene("https://ultralytics.com/images/bus.jpg"))

関連用語の区別

現代のAIアーキテクチャを完全に理解するには、関数呼び出しが類似の概念とどのように関連し、どのように異なるかを理解することが有用である:

  • モデルコンテキストプロトコル(MCP) 関数呼び出しがモデルプロンプトで渡される特定のAPI定義に依存するのに対し、MCPは包括的で標準化されたアーキテクチャである。MCPはAIモデルとデータソースを接続するための普遍的なプロトコルを構築する一方、関数呼び出しはモデルが実際にそれらの接続を呼び出すために使用する局所的なメカニズムである。
  • 検索拡張生成(RAG) RAGは、LLMのプロンプトを拡張するために関連テキストや文書を取得するように特別に設計された手法である。 機能呼び出しはより広範なメカニズムです。AIはツールを使用してRAGを実行できるだけでなく、 ディスクへのファイル書き込みやメール送信にもツールを利用できます。 ツールを活用したRAGの包括的な実装例は、 PyTorch Google マルチモーダルガイドで確認できます。
  • AIエージェントAIエージェントとは、環境を認識し目標達成のために行動を起こす完全自律システムである。 関数呼び出しは、エージェントにそれらの行動を実行する能力を与える主要な技術である。大規模なエージェント型システムを展開する際、チームはしばしばUltralytics を使用して、これらのエージェントが世界を見るために呼び出す基盤となる視覚モデルをシームレスにトレーニングし、サービスを提供する。静的モデルからエージェント型ワークフローへ移行する組織は、 TensorFlow などのディープラーニングライブラリに依存することが多い。

Ultralytics YOLOパワーアップ

あなたのプロジェクトに高度なAIビジョンを。あなたの目標に合ったライセンスを今すぐ見つけましょう。

ライセンスオプションを見る