YOLO Vision Shenzhen
深セン
今すぐ参加
用語集

モデルコンテキストプロトコル (MCP)

Model Context Protocol (MCP) がAIとデータおよびツールの接続をどのように標準化するかを学びましょう。よりスマートなワークフローのためにUltralytics YOLO26をMCPと統合する方法を発見してください。

モデルコンテキストプロトコル(MCP)は、AIモデルが外部データ、ツール、および環境とどのように相互作用するかを標準化するために設計されたオープン標準です。歴史的に、大規模言語モデル(LLM)やコンピュータービジョンシステムを、ローカルファイル、データベース、APIエンドポイントなどの実世界のデータソースに接続するには、個々のツールごとにカスタム統合を構築する必要がありました。MCPは、AIアプリケーション向けのUSBポートに似たユニバーサルプロトコルを提供することで、この断片化を解決します。これにより、開発者はコネクタを一度構築するだけで複数のAIクライアントで機能させることができ、コンテキスト認識型カスタマーサポートエージェントやインテリジェントアシスタントの作成の複雑さを大幅に軽減します。

MCPはどのように機能するか

MCPの核となる機能は、クライアント・ホスト・サーバーアーキテクチャを介して動作します。「クライアント」は、リクエストを開始するAIアプリケーション(コーディングアシスタントやチャットボットインターフェースなど)です。「ホスト」はランタイム環境を提供し、「サーバー」は特定のデータやツールへの橋渡しをします。AIエージェントがファイルにアクセスしたりデータベースをクエリしたりする必要がある場合、プロトコルを介してリクエストを送信します。MCPサーバーはこのリクエストを処理し、必要なコンテキストを取得し、構造化された方法でモデルにフォーマットして返します。

このアーキテクチャは、主に3つの機能をサポートしています。

  • リソース: これらにより、モデルはログ、コードファイル、ビジネス文書などのデータを読み取り、検索拡張生成(RAG)に必要な根拠付けを提供します。
  • プロンプト: ユーザーやモデルがサーバーと効果的に対話するのに役立つ、事前に定義されたテンプレートであり、プロンプトエンジニアリングのワークフローを効率化します。
  • ツール:ファイルの編集、スクリプトの実行、コンピュータービジョンパイプラインとのインタラクションなど、モデルがアクションを実行できるようにする実行可能な関数です。

実際のアプリケーション

MCPはモデルと統合ロジックを分離するため、急速に普及しています。その応用例を2つ具体的に示します。

  1. 統合開発環境: ソフトウェアエンジニアリングにおいて、開発者はIDE、ターミナル、ドキュメントの間を頻繁に切り替えます。MCP対応のコーディングアシスタントは、GitHubリポジトリ、ローカルファイルシステム、バグ追跡データベースに同時に接続できます。開発者が「なぜログインが失敗するのですか?」と尋ねた場合、AIはMCPサーバーを使用して、最近のエラーログを取得し、関連する認証コードを読み取り、未解決の問題を確認し、ユーザーがコンテキストをコピー&ペーストすることなく、このマルチモーダルデータを統合して解決策を生成できます。

  2. コンテキスト認識型目視検査: 産業環境では、標準的なビジョンモデルは欠陥をdetectしますが、履歴コンテキストが不足しています。MCPを使用することで、Ultralytics YOLO26 detectシステムを在庫データベースにリンクできます。モデルが「損傷部品」をdetectすると、MCPツールをトリガーして交換品の在庫状況をデータベースに問い合わせ、自動的にメンテナンスチケットを作成します。これにより、単純なobject detectionタスクが完全な自動化ワークフローに変換されます。

関連用語の区別

MCPをAIエコシステムにおける類似の概念と区別することは有用です。

  • MCP vs. API: アプリケーションプログラミングインターフェース(API)は、あるソフトウェアが別のソフトウェアと通信するための一連の特定のルールです。MCPは、あらゆるAIモデルがあらゆるAPIまたはデータソースとどのように相互作用するかを標準化するプロトコルです。特定のAPIをラップするMCPサーバーを構築し、MCP準拠のクライアントが普遍的にアクセスできるようにすることができます。
  • MCPとRAG:Retrieval-Augmented Generationは、外部データをモデルに供給するための手法です。MCPは、これを容易にするインフラストラクチャです。RAGは「何を」(データの取得)であり、MCPは「どのように」(標準的な接続パイプ)です。
  • MCP vs. 関数呼び出し: OpenAI GPT-4を含む多くのモデルは、関数呼び出しをネイティブにサポートしています。MCPは、これらの関数(ツール)を定義および公開するための標準的な方法を作成し、モデルのシステムプロンプトに毎回ハードコードする必要がないようにします。

コンピュータ・ビジョンとの統合

元々はテキストベースのLLMで普及しましたが、MCPはビジョン中心のワークフローにとってますます重要になっています。開発者は、コンピュータービジョン機能をツールとして公開するMCPサーバーを作成できます。例えば、中央コントローラーとして機能するLLMは、MCPツールとして公開されたローカルのPythonスクリプトを介して、視覚タスクをUltralyticsモデルに委任できます。

以下のpythonスニペットは、スクリプトがビジョンモデルを使用してコンテキストを生成し、その後MCP互換のエンドポイントを介して提供される可能性のある概念的なワークフローを示しています。

from ultralytics import YOLO

# Load the YOLO26 model (efficient, end-to-end detection)
model = YOLO("yolo26n.pt")

# Perform inference to get visual context from an image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract detection data to be passed as context
detections = []
for r in results:
    for box in r.boxes:
        cls_name = model.names[int(box.cls)]
        detections.append(f"{cls_name} (conf: {box.conf.item():.2f})")

# This string serves as the 'context' a downstream agent might request
context_string = f"Visual Analysis: Found {', '.join(detections)}"
print(context_string)

AI接続の未来

モデルコンテキストプロトコルの導入は、モジュール式で相互運用可能なエージェントAIシステムへの移行を示しています。接続を標準化することで、業界はサイロ化されたチャットボットから、組織の既存インフラ内で意味のある作業を実行できる統合アシスタントへと移行します。Ultralytics Platformのようなツールが進化し続けるにつれて、MCPのような標準プロトコルは、より大規模なエンタープライズワークフロー内でカスタム学習モデルがどのように展開され、利用されるかにおいて重要な役割を果たすでしょう。

共にAIの未来を築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。