本文介绍了模型上下文协议(MCP),一种标准化的开放协议,用于连接大型语言模型(LLM)与外部工具和数据源,解决集成复杂性、工具碎片化等问题。MCP被比喻为AI领域的“USB-C”,具有即插即用的特性。当前开发者已利用MCP构建多种创新应用,包括AI驱动的故事板、语音集成、浏览器自动化等,展示了其多功能性和潜力。MCP被认为是AI生态系统发展的重要转折点,未来或将成为AI基础设施的核心组成部分。
原文作者:Mohamed ElSeidy
原文编译:深潮 TechFlow
昨日,Solana 上的 AI 相关代币 $Dark 上线 Binance Alpha,截止目前市值已经来到 4000 万美元左右。
在最新的加密 AI 叙事中,$Dark 与「MCP」(模型上下文协议)密切相关,而这也是近期谷歌等 Web2 科技公司正在关注和探索的领域。
但在目前,能够清晰讲清楚 MCP 这个概念和叙事影响的文章并不多。
下文是 Alliance DAO 研究员Mohamed ElSeidy的一篇关于 MCP 协议深入浅出的文章,以非常通俗的语言讲述了 MCP 的原理和定位,或许对我们快速了解最新的叙事有所帮助。
深潮 TechFlow 对全文进行了编译。
在我于 Alliance 的这些年里,我见证了无数创始人构建了他们自己的专用工具和数据集成,这些都被嵌入到他们的 AI 代理和工作流程中。然而,这些算法、形式化和独特的数据集被锁在定制的集成背后,极少有人会使用。
随着模型上下文协议(Model Context Protocol, MCP)的出现,这种情况正在迅速改变。MCP 被定义为一种开放协议,它标准化了应用程序如何与大型语言模型(LLM)进行通信并提供上下文。我非常喜欢的一个比喻是:「对于 AI 应用程序来说,MCP 就像硬件中的 USB-C」;它是标准化的、即插即用的、多功能的,并且具有变革性。
大型语言模型(如 Claude、OpenAI、LLAMA 等)非常强大,但它们受限于当前可以访问的信息。这意味着它们通常存在知识截止点,不能独立浏览网络,也无法直接访问你的个人文件或专用工具,除非进行某种形式的集成。
特别是,在此之前,开发者在将 LLM 连接到外部数据和工具时面临三个主要挑战:
这些示例尤其引人注目之处在于其多样性。自 MCP 推出以来的短短时间内,开发者已经创建了涵盖创意媒体制作、通信平台、硬件控制、位置服务和区块链技术的集成。这些各种不同的应用遵循同一标准化协议,展示了 MCP 的多功能性及其成为 AI 工具集成通用标准的潜力。
如果想要查看全面的 MCP 服务器集合,可以访问 GitHub 上的官方 MCP 服务器库。在使用任何 MCP 服务器之前,请仔细阅读免责声明,并谨慎对待运行和授权的内容。
面对任何新技术,值得问的是:MCP 是否真正具有变革性,还是仅仅是另一个过度炒作、最终会消退的工具?
在观察过众多初创企业后,我相信 MCP 代表了 AI 发展的一次真正的转折点。与许多承诺革命但仅带来渐进变化的趋势不同,MCP 是一种生产力提升,解决了阻碍整个生态系统发展的基础设施问题。
它的特别之处在于,它并不试图替代现有的 AI 模型或与之竞争,而是通过将它们连接到所需的外部工具和数据,使它们更加有用。
尽管如此,关于安全性和标准化的合理担忧仍然存在。正如任何协议在初期阶段一样,随着社区在审计、权限、认证和服务器验证方面摸索最佳实践,我们可能会看到成长的烦恼。开发者需要信任这些 MCP 服务器的功能,不能盲目信任它们,尤其是在它们变得丰富时。本文讨论了一些因盲目使用未经仔细审查的 MCP 服务器而暴露的最近漏洞,即使是在本地运行时。
最强大的 AI 应用将不再是独立的模型,而是通过像 MCP 这样的标准化协议连接起来的专业能力生态系统。对于初创公司来说,MCP 代表了一个构建适合这些不断增长的生态系统的专业组件的机会。这是一个利用您独特知识和能力的机会,同时从基础模型的大量投资中获益。
展望未来,我们可以预期 MCP 将成为 AI 基础设施的基本组成部分,就像 HTTP 之于网络一样。随着协议的成熟和采用的增长,我们很可能会看到专门的 MCP 服务器市场的出现,使 AI 系统能够利用几乎任何想象得到的能力或数据源。
您的初创公司是否尝试过实施 MCP?我很想在评论中听到您的经验。如果您在这个领域构建了有趣的东西,请通过@alliancedao 与我们联系并申请。
对于那些有兴趣了解 MCP 实际工作原理的人,以下附录提供了其架构、工作流程和实施的技术细分。
类似于 HTTP 标准化了网络访问外部数据源和信息的方式,MCP 为 AI 框架做到了这一点,创造了一种通用语言,使不同的 AI 系统能够无缝沟通。让我们来探索它是如何做到的。
MCP 架构和流程
主要架构遵循客户端 - 服务器模型,由四个关键组件协同工作:
现在我们已经讨论了这些组件,来看一下它们在典型工作流程中的交互:
这种架构的强大之处在于,每个 MCP 服务器专注于特定领域,但使用标准化的通信协议。这样,开发者无需为每个平台重建集成,只需一次性开发工具即可服务于整个 AI 生态系统。
现在让我们看看如何使用 MCP SDK 在几行代码中实现一个简单的 MCP 服务器。
在这个简单的例子中,我们希望扩展 Claude Desktop 的能力,让它能够回答诸如「中央公园附近有哪些咖啡店?」这样的问题,信息来源于谷歌地图。您可以轻松扩展此功能以获取评论或评分。但现在,我们专注于 MCP 工具 find_nearby_places,它将允许 Claude 直接从谷歌地图获取这些信息,并以对话的方式呈现结果。
正如您所见,代码非常简单。首先,它将查询转换为谷歌地图 API 搜索,然后返回结构化格式的顶级结果。这样,信息被传递回 LLM 以便进一步决策。
现在我们需要让 Claude Desktop 知道这个工具,因此我们在其配置文件中注册它,如下所示:
macOS 路径:~/Library/Application Support/Claude/claude_desktop_config.jsonWindows 路径:%APPDATA%\Claude\claude_desktop_config.json
就这样,你完成了!现在你已经成功扩展了 Claude 的功能,可以实时从谷歌地图中查找位置。