Spring-AI之MCP

引言

在 AI 技术快速发展的今天，模型与外部数据源、工具的集成效率成为制约其应用落地的关键瓶颈。传统模式下，每个数据源或工具都需要单独开发 API 接口，导致重复劳动与扩展性不足。在AI项目开发中可以发现，集成AI模型复杂，现有框架如LangChain Tools、LlamaIndex和Vercel AI SDK存在问题。LangChain和LlamaIndex代码抽象高，商业化过重；Vercel AI SDK与Nextjs绑定过深。

一什么是MCP（Model Context Protocol）

定义

MCP（Model Context Protocol，模型上下文协议），2024年11月底，由 Anthropic 推出的一种开放标准，旨在统一大型语言模型（LLM）与外部数据源和工具之间的通信协议。MCP 的主要目的在于解决当前 AI 模型因数据孤岛限制而无法充分发挥潜力的难题，MCP 使得 AI 应用能够安全地访问和操作本地及远程数据，为 AI 应用提供了连接万物的接口。

（旨在通过结构化数据格式和标准化通信流程，帮助模型在不同场景下高效理解、记忆和利用上下文信息。它解决了传统模型在处理长对话、多轮交互或复杂任务时上下文丢失、信息冗余等问题。）

通过标准化的架构设计，为 AI 模型与外部系统的无缝连接提供了 “即插即用” 的解决方案，被誉为 AI 时代的 “USB-C 接口”。

MCP的优势在于：一是开放标准利于服务商开发API，二是避免开发者重复造轮子，可利用现有MCP服务增强Agent。

附官方链接： https://modelcontextprotocol.io/introduction

Function Calling是AI模型调用函数的机制，MCP是一个标准协议，使AI模型与API无缝交互，而AI Agent是一个自主运行的智能系统，利用Function Calling和MCP来分析和执行任务，实现特定目标。

价值

打破数据孤岛
简化开发流程
增强模型能力

举个栗子，在过去，为了让大模型等 AI 应用使用我们的数据，要么复制粘贴，要么上传下载，非常麻烦。

即使是最强大模型也会受到数据隔离的限制，形成信息孤岛，要做出更强大的模型，每个新数据源都需要自己重新定制实现，使真正互联的系统难以扩展，存在很多的局限性。

现在，MCP 可以直接在 AI 与数据（包括本地数据和互联网数据）之间架起一座桥梁，通过 MCP 服务器和 MCP 客户端，大家只要都遵循这套协议，就能实现“万物互联”。

有了MCP，可以和数据和文件系统、开发工具、Web 和浏览器自动化、生产力和通信、各种社区生态能力全部集成，实现强大的协作工作能力，它的价值远不可估量。

与传统 API 集成的区别

功能	传统 API	MCP 协议
整合难度	需为每个工具单独开发接口	标准化协议一次整合所有工具
实时双向通信	不支持	支持（如 AI 实时获取数据库更新）
动态发现工具	不支持	支持（模型自动识别可用工具）
扩展性	弱（需额外开发）	强（即插即用）
安全性	分散管理	统一权限控制

MCP 与 Function Calling 的区别

这两种技术都旨在增强 AI 模型与外部数据的交互能力，但 MCP 不止可以增强 AI 模型，还可以是其他的应用系统。

安全问题

MCP 通过标准化的数据访问接口，大大减少了直接接触敏感数据的环节，降低了数据泄露的风险。

还有，MCP 内置了安全机制，确保只有经过验证的请求才能访问特定资源，相当于在数据安全又加上了一道防线。同时，MCP协议还支持多种加密算法，以确保数据在传输过程中的安全性。

例如，MCP 服务器自己控制资源，不需要将 API 密钥等敏感信息提供给 LLM 提供商。这样一来，即使 LLM 提供商受到攻击，攻击者也无法获取到这些敏感信息。

二核心架构与原理

MCP 采用客户端 - 服务器模型（Client-Server Model），其核心组件包括：

MCP 主机（MCP Hosts）：发起请求的LLM应用程序（例如 Claude Desktop、IDE 或 AI 工具）。
MCP 客户端（MCP Clients）：在主机程序内部，与 MCP server 保持 1:1的连接。负责与 MCP 服务器通信，传递模型的意图与请求。
MCP 服务器（MCP Servers）：为 MCP client 提供上下文、工具和 prompt 信息。作为连接 AI 模型与外部系统的中介，承担 “翻译” 与 “桥梁” 角色。（解析模型意图，调用外部资源执行操作，并将结果返回模型）
资源（Resources）：本地或外部资源。（如文件、数据库、API 等）