字节跳动抖音 AI Agent开发二面

1、自我介绍

2、讲一个你做过的最有代表性的 Agent 项目

3、如果让你设计一个通用 Agent 框架，你会怎么设计

我会把它拆成六层。最上面是接入层，处理用户请求、鉴权、限流和会话管理。下面一层是理解层，负责意图识别、槽位抽取、风险识别和任务分类。再往下是规划层，根据任务复杂度决定是直接回答、走工作流，还是做多步规划。中间一层是记忆和上下文层，统一管理短期记忆、长期记忆、任务状态和检索到的证据。再下面是工具层，把所有外部能力封装成标准化 skill，包括描述、参数 schema、执行逻辑和异常处理。最底层是执行与评测层，负责模型调用、工具执行、结果回填、日志埋点和效果评估。

如果要做成工程上可维护的框架，我会特别强调几件事：一是工具协议标准化，不然 skill 越多越难管；二是上下文构造标准化，不同任务不能随便拼接；三是监控指标要拆开看，至少要区分模型问题、检索问题、工具问题和工作流问题；四是要有失败兜底机制，比如工具调用失败时降级成普通问答或者触发重试。

4、你怎么理解 Agent 和 Workflow 的边界

Workflow 更偏确定性，它适合流程相对固定的任务，比如先查一个接口，再根据结果决定下一步，再做格式化输出。好处是稳定、可控、便于排查，尤其适合线上核心链路。Agent 更偏自主决策，它更像一个能自己判断下一步做什么的执行体，适合复杂、开放、多步的不确定任务。

实际项目里，我一般不会纯做自由 Agent，而是让 Workflow 控制主干流程，把需要理解、规划和选择的局部步骤交给 Agent。这样既能保留灵活性，也能保证线上稳定性。很多所谓的 Agent 系统，本质上都是“Workflow + LLM 决策节点”。

5、你们项目里工具很多的话，怎么做 tool routing

工具多的时候不能直接把所有工具描述都丢给模型，这样 token 开销大，而且模型容易选错。我一般会做分层路由。先做一级粗分类，比如检索类、查询类、生成类、执行类，再在二级做具体工具选择。粗分类可以用规则、小模型分类器或者轻量 LLM 来完成，二级路由再用更详细的 tool description 让模型选。

另外会做工具候选裁剪，比如结合当前意图、用户角色、会话历史和参数完整性，先过滤掉明显不可能用的工具。再往后是参数校验和执行反馈，如果模型选了工具但参数不完整，就不直接执行，而是先补槽或者纠错。这样比“选错了再失败”稳定很多。

6、项目里做过记忆吗，怎么避免记忆把上下文污染掉

做过。记忆最容易出问题的地方就是“记了很多，但真正该用的时候用错了”。所以我一般会把记忆分成三类。

第一类是短期会话记忆，只保留当前任务强相关的最近几轮内容，适合直接拼接进上下文。第二类是长期用户记忆，比如用户偏好、常用配置、角色信息，这类记忆通常结构化存储，不会整段塞给模型，而是在需要时按字段召回。第三类是任务状态记忆，比如当前做到第几步、有哪些待办、已经拿到了哪些中间结果，这类更像 workflow state。

为了避免污染，上下文拼接时会做相关性筛选和优先级排序，不是所有记忆都放。很多时候少而准，比多而乱效果更好。