绿色检查
链接复制到剪贴板

人工智能自动化的下一步:模型上下文协议(MCP)

了解模型上下文协议 MCP 的基础知识、它在人工智能系统中的工作原理,以及开发人员为何使用它将模型与实时工具和数据联系起来。

从大型语言模型到计算机视觉系统,不同类型的人工智能模型能够支持各种任务,包括生成文本、分析图像、检测模式和进行预测。然而,要以无缝、可扩展的方式将这些模型与现实世界的计算机系统连接起来,通常需要复杂的集成工作。

虽然模型本身可能性能良好,但在实际环境中部署它往往需要访问外部工具、实时数据或特定领域的上下文。将这些元素拼接在一起通常需要定制代码、手动设置和有限的可重用性。

最近,模型上下文协议(MCP)的概念在人工智能界越来越受到关注。MCP 是一种开放标准,允许人工智能系统使用共享的结构化格式与工具、文件和数据库交换信息。开发人员可以使用 MCP 来简化模型访问和与所需上下文交互的方式,而不是为每个用例构建集成。

你可以把 MCP 想象成一个通用适配器。就像旅行适配器可以让您的设备插入世界各地不同的电源插座一样,MCP 可以让人工智能模型插入各种系统、工具和数据源,而无需为每个系统、工具和数据源进行自定义设置。

在本文中,我们将深入探讨什么是 MCP、它是如何工作的,以及它在使人工智能在实际应用中更加有效方面发挥的作用。我们还将探讨 MCP 在现实世界中的一些应用实例。

什么是模型上下文协议?

模型上下文协议(MCP)是由Anthropic 创建的一个开放标准,Anthropic 是一家人工智能安全和研究公司,以构建高级语言模型而闻名。它为人工智能模型提供了一种与工具、文件或数据库连接的明确方式。 

如今,大多数人工智能助手都依赖大型语言模型来回答问题或完成任务。然而,这些模型往往需要额外的数据才能做出良好的响应。如果没有共享系统,每个连接都必须从零开始。 

例如,旨在帮助提供 IT 支持的聊天机器人可能需要从公司的内部票务系统获取信息。如果没有 MCP,这就需要自定义集成,使得设置耗时且难以维护。

MCP 作为所有工具和模型的通用端口,解决了这一问题。它不属于任何一家公司或模型,而是人工智能系统如何连接外部数据和服务的新概念。

图 1.MCP 就像是所有工具和模型的通用端口。

任何开发人员都可以使用 MCP 来构建可与实时信息协同工作的助手。这减少了设置时间,避免了在工具或平台之间切换时的混乱。 

模型上下文协议》的起源和采用

Anthropic 于2024 年 11 月提出了 "模型上下文协议"(MCP)的概念。它最初是一个开源项目,旨在改进语言模型与工具和数据的交互方式。 

从那时起,MCP 开始受到广泛关注。一开始,开发人员为文档搜索和代码协助等工作构建内部工具。这种早期的兴趣迅速增长,较大的公司开始在其生产系统中使用 MCP。

图 2.MCP 与传统人工智能集成的对比。

到 2025 年初,对 MCP 的支持开始在整个科技行业蔓延。OpenAI 和Google DeepMind 这两个领先的人工智能研究实验室宣布,它们的系统将与该协议协同工作。

大约在同一时间,Microsoft 发布了帮助开发人员更轻松地使用 MCP 的工具,包括对其流行产品的支持,如帮助企业构建人工智能助手的Copilot Studio 和广泛使用的代码编辑器 Visual Studio Code。

模式上下文协议》的主要组成部分

MCP 的核心包括三个主要部分:客户端、服务器和一套称为协议的共享规则。把它想象成双方之间的对话:一方请求信息,另一方提供信息。

在这种设置中,人工智能系统扮演客户端的角色。当它需要某些东西,如文件、数据库条目或工具来执行某个操作时,它就会发送一个请求。另一边,服务器接收请求,从正确的地方获取所需的信息,并以人工智能能够理解的方式发送回来。

这种结构意味着开发人员无需在希望人工智能模型与新工具或数据源配合使用时建立自定义连接。MCP 有助于实现流程标准化,让一切变得更快、更简单、更可靠。

MCP 工作原理概述

以下是 MCP 如何将人工智能助手与外部数据或工具连接起来的演示:

  • 助手检查自己知道什么: 当用户提出问题时,助手首先会检查自己是否已经知道答案。如果没有,它就会决定从其他系统获取帮助。
  • 它创建一个请求: 作为 MCP 客户端,助手会创建一个请求。这包括它需要哪些数据以及原因。
  • 请求到达服务器: 请求被发送到连接到工具、应用程序或数据库的服务器。服务器可以理解并使用 MCP 规则处理请求。
  • 服务器执行工作: 它可以搜索数据、运行查询、更新文件或在连接的工具中执行其他操作--无论助手要求什么。
  • 服务器回复: 数据以 MCP 格式打包并发送回助手。
  • 助手回答: 有了更新的上下文,助手就会使用新信息来完成回复。用户会得到准确、相关、基于实时数据的回答。
图 3.MCP 在人工智能应用中的工作原理

探索 MCP 在现实世界中的应用

如今,MCP 已被用于各种依赖实时上下文的工具和平台。以下是一些公司如何使用该协议将语言模型与实时系统和结构化数据连接起来的例子:

  • 软件开发: 当编码助手知道你在做什么时,他们会更有帮助。Zed(一种快速、协作式代码编辑器)和 Replit(一种用于编写和运行代码的在线平台)等工具使用 MCP,因此它们的助手可以读取打开的文件,并在你编写代码时跟踪你的修改。

  • 企业助手: 许多公司使用维基、服务台或客户关系管理 (CRM) 系统等内部工具。像 Apollo(销售团队平台)这样的企业使用 MCP 让他们的助理在这些系统中查找信息,而不需要用户在应用程序之间切换。

  • 多工具代理: 有些任务跨越多个系统。有了 MCP,助理可以顺利地搜索文件、发送更新或消息。

  • 桌面助手: 在电脑上运行的助手有时需要访问本地文件。由Anthropic 打造的 Claude 桌面应用程序是其人工智能助手系列的一部分,它使用 MCP 安全地处理这些请求,将数据保留在设备上,而不是发送到云端。
图 4.MCP 如何跨多个系统处理数据的示例。

使用 MCP 推动计算机视觉应用

接下来,让我们仔细看看人工智能的一个分支,MCP 刚刚开始出现:计算机视觉。

虽然计算机视觉模型,如 Ultralytics YOLO11等计算机视觉模型能够很好地识别图像中的模式和对象,但如果与正确的上下文相结合,它们的洞察力会变得更有影响力。 

在现实世界的应用中,尤其是在医疗保健领域,添加患者病史、化验结果或临床笔记等上下文可显著提高模型预测的实用性,从而获得更明智、更有意义的结果。

这就是模型上下文协议(MCP)的用武之地。虽然它还没有被广泛使用,研究人员和工程师们仍在探索中,但它显示出了巨大的潜力。 

利用情境感知 AI 和 MCP 增强医学成像能力

例如,在诊断糖尿病视网膜病变(一种可能导致糖尿病患者视力下降的疾病)时,人工智能助手可以使用 MCP 来协调多种专业工具。首先,它可能会从数据库中检索患者记录,并使用预测模型评估糖尿病风险。 

然后,计算机视觉模型会对视网膜图像进行分析,寻找出血或肿胀等表明视网膜病变存在或严重程度的损伤迹象。最后,助手可以根据患者的资料搜索相关的临床试验。 

MCP 使所有这些工具都能通过共享协议进行通信,让助手在一个无缝的工作流程中将图像分析和结构化数据汇集在一起。

图 5.人工智能助手使用 MCP 处理的视网膜图像。

每种工具都通过 MCP 服务器进行访问,使助手能够发送结构化请求并接收标准化响应。这样就不需要定制集成,助理就能在一个流畅、高效的工作流程中将图像分析与重要的患者数据结合起来。虽然 MCP 仍是新生事物,但已有大量研究和工作正在进行中,旨在使类似的使用案例成为现实。

模型上下文协议》的利弊

以下是 MCP 的一些主要优势:

  • 一致的标准化通信: 该协议确保了统一的请求/响应结构,使调试和日志记录更易于管理。

  • 模块化程度提高: 系统变得更加模块化,允许不同组件(模型、工具、数据库)独立发展。

  • 促进人工智能代理的自主性: 人工智能代理可以在没有人类定义的工作流程的情况下,通过多种工具进行推理和行动,从而实现更灵活、更自主的行为。

另一方面,说到 MCP,有几个限制因素需要注意:

  • 初始设置复杂: 为现有系统设置符合 MCP 标准的服务器和主机需要大量的工程设计工作,还可能需要重新考虑当前的架构。

  • 性能开销: 添加协议层可能会带来延迟,尤其是在工具分布式或通过网络访问的情况下。

  • 学习曲线: 开发团队需要了解 MCP 体系结构(主机、客户端、服务器)以及如何进行设计,这可能会降低采用速度。

主要收获

人工智能模型的能力越来越强,但它们仍然依赖于对正确数据的访问。模型上下文协议(MCP)为开发人员提供了建立这些连接的一致且标准化的方法。团队无需从头开始构建每个集成,而是可以遵循一种可在不同工具和系统中使用的共享格式。

随着采用率的提高,MCP 有可能成为设计和部署人工智能助手的标准组成部分。它有助于简化设置、改善数据流,并为现实世界中的模型交互提供结构。 

加入我们不断壮大的社区。访问我们的GitHub 存储库,了解有关人工智能的更多信息,探索我们的许可选项,开始使用 Vision AI。想了解它在现实生活中的应用?请访问我们的解决方案页面,了解人工智能在医疗保健零售业中的应用。

LinkedIn 徽标Twitter 徽标Facebook 徽标复制链接符号

在此类别中阅读更多内容

让我们共同打造人工智能的未来

开始您的未来机器学习之旅