mcp和skill的工作原理,以及资源耗费的区别
1️⃣1. 概念区分
1.1 MCP
- JSON-RPC 2.0 的消息结构
- 生命周期/能力协商(连接初始化、会话控制)
- Server 侧暴露的三类对象:tools、resources、prompts
- Client/Host 侧可提供的能力(例如 sampling)
1.2 Skill
一个可用的 skill 通常包含:
- 触发条件(什么时候用)
- 工作流(步骤、决策点、失败处理)
- 可执行资产(脚本、模板、测试用例)
2️⃣2. 链路区分
2.1 MCP 链路:发现 → 选择 → 调用 → 回写
一个常见的 MCP 执行回路可以抽象成:
1. Host 启动/连接 MCP server。
2. Host 获取能力清单。
3. LLM 根据任务与当前状态选择工具并生成参数。
4. MCP server 执行,返回结构化结果(可能带大段文本/文件引用/错误堆栈)。
5. Host 将结果写回上下文,继续下一轮推理或最终回答。
这个闭环里,MCP 的协议层只保证可调用,不保证会用。
2.2 Skill 链路:索引常驻,正文按需;执行在外部环境
在 Skill 机制里常见的策略是:
- 上下文中常驻的是“技能索引/触发规则”,而不是技能全文。
- 触发后再加载 SKILL.md、脚本、参考资料。
- 代码执行发生在工具/终端环境中,回写到上下文的是最小必要输出(而不是整段日间文件)。
这条链路的关键是:把“长文本推理”尽量变成“短文本调度 + 外部执行”。
3️⃣3. 资源耗费差异
3.1 MCP 为什么更容易推高 token 与时延
来自近一年多项基准的共同结论是:真实 MCP 任务经常同时满足“长轨迹、长上下文、工具空间大、工具不熟悉”。
- MCP-Universe 把长上下文与未知工具作为显式挑战,并报告 token 随交互步数快速增长。
工程直觉对应到三点:
- 工具描述与 schema 本身要进上下文(工具越多越贵)。
- 工具返回值通常比人类写的“摘要”长(回写越多越贵)。
- 多 server 并联会引入选择噪声,导致更多无效调用与重试(越试越贵)
3.2 Skill 为什么通常更省 token,但并不总是更省资源
Skill 的常见优势是:
- 把怎么做沉淀成文档与脚本,减少重复规划。
- 通过按需加载降低常驻上下文。
但它的资源风险也很明确:
- 执行成本可能从LLM token转移到脚本/工具运行时。
- skill 数量膨胀后,同样会出现检索/触发错误,只是错误发生在工作流级别。
1.1 MCP
- JSON-RPC 2.0 的消息结构
- 生命周期/能力协商(连接初始化、会话控制)
- Server 侧暴露的三类对象:tools、resources、prompts
- Client/Host 侧可提供的能力(例如 sampling)
1.2 Skill
一个可用的 skill 通常包含:
- 触发条件(什么时候用)
- 工作流(步骤、决策点、失败处理)
- 可执行资产(脚本、模板、测试用例)
2️⃣2. 链路区分
2.1 MCP 链路:发现 → 选择 → 调用 → 回写
一个常见的 MCP 执行回路可以抽象成:
1. Host 启动/连接 MCP server。
2. Host 获取能力清单。
3. LLM 根据任务与当前状态选择工具并生成参数。
4. MCP server 执行,返回结构化结果(可能带大段文本/文件引用/错误堆栈)。
5. Host 将结果写回上下文,继续下一轮推理或最终回答。
这个闭环里,MCP 的协议层只保证可调用,不保证会用。
2.2 Skill 链路:索引常驻,正文按需;执行在外部环境
在 Skill 机制里常见的策略是:
- 上下文中常驻的是“技能索引/触发规则”,而不是技能全文。
- 触发后再加载 SKILL.md、脚本、参考资料。
- 代码执行发生在工具/终端环境中,回写到上下文的是最小必要输出(而不是整段日间文件)。
这条链路的关键是:把“长文本推理”尽量变成“短文本调度 + 外部执行”。
3️⃣3. 资源耗费差异
3.1 MCP 为什么更容易推高 token 与时延
来自近一年多项基准的共同结论是:真实 MCP 任务经常同时满足“长轨迹、长上下文、工具空间大、工具不熟悉”。
- MCP-Universe 把长上下文与未知工具作为显式挑战,并报告 token 随交互步数快速增长。
工程直觉对应到三点:
- 工具描述与 schema 本身要进上下文(工具越多越贵)。
- 工具返回值通常比人类写的“摘要”长(回写越多越贵)。
- 多 server 并联会引入选择噪声,导致更多无效调用与重试(越试越贵)
3.2 Skill 为什么通常更省 token,但并不总是更省资源
Skill 的常见优势是:
- 把怎么做沉淀成文档与脚本,减少重复规划。
- 通过按需加载降低常驻上下文。
但它的资源风险也很明确:
- 执行成本可能从LLM token转移到脚本/工具运行时。
- skill 数量膨胀后,同样会出现检索/触发错误,只是错误发生在工作流级别。
全部评论
相关推荐
05-01 15:42
深圳大学 产品经理 点赞 评论 收藏
分享
