一、基本情况 / 项目概述1.你先做个自我介绍。2.你最近的一份项目,能不能从整体框架、实现方式、你承担的角色这几个方面讲一下?________________________________________二、字节实习:端上特征平台 / 数据处理链路3.你们这个特征平台,本质上是在做哪些事情?4.你们是只做数据处理和平台化支撑,真正的使用方是各个业务侧,对吗?5.端上数据的产生流程是怎么设计的?6.特征是怎么从原始事件中生成出来的?7.不同特征之间是怎么区分的?8.数据产生之后,准确性校验是怎么做的?9.如果你们主要只是做订阅、采集、落库,那这个平台真正的复杂度和难点在哪里?10.你刚才提到的平台能力里,除了基础入库,还有哪些额外的处理或运行能力?________________________________________三、SQL 优化 / 性能问题11.你做的 SQL 优化具体是怎么发现问题的?12.这个问题最初是怎么产生的?13.你的优化方案具体分成了哪几步?14.为什么这些 SQL 可以做模板化和合并处理?15.最终修复效果怎么样?优化指标大概是多少?________________________________________四、自动化测试 / MCP / Agent 能力16.你提到做了自动化测试相关的 Agent 和 MCP,这块整体设计思路是什么?17.这个自动化测试能力具体包含哪些功能?18.你是怎么把 MCP 接进自动化测试流程里的?19.这个自动化测试后面是怎么和业务流程、版本流程结合起来的?20.如果有新增接口或者代码变更,你们后续怎么补自动化测试用例?________________________________________五、AI 投资分析系统 / Multi-Agent 设计21.你做的 AI 投资项目,是一个 Multi-Agent 项目,对吗?22.这个 Multi-Agent 架构整体是怎么设计的?23.主控 Agent 和子 Agent 之间是怎么分工的?24.不同 Agent 之间的数据是怎么流转的?25.任务列表、完成标记、工具调用列表这套机制是怎么设计的?26.你的系统提示词一般是怎么设计出来的?27.你自己先写提示词,和让 AI 帮你结构化整理,这两部分分别怎么配合?________________________________________六、Prompt / 幻觉控制28.写提示词的时候,怎么尽量减少幻觉?29.你觉得减少幻觉最关键的设计点是什么?30.除了提示词约束和标注信息来源,你还有没有别的方法控制幻觉?________________________________________七、字节中的 Agent 实践31.在字节实习期间,除了测试那块,你还做过其他 Agent 相关开发吗?32.你说的测试 Agent,本质上到底用了哪些 Agent 能力?________________________________________八、通用 Agent 设计方法论33.如果现在让你从一个业务场景出发设计一个 Agent,整个流程你会拆成哪些步骤?34.在架构设计阶段,你会先判断哪些关键问题?35.什么时候适合做简单的一问一答式 Agent,什么时候适合做 ReAct / Plan-and-Execute 这种复杂 Agent?36.长短期记忆、工具设计、安全审查,这些部分在 Agent 设计里分别怎么考虑?37.你觉得一个 Agent 的最小可行版本(MVP)应该包含哪些核心部分?________________________________________九、Agent 评估 / 数据集 / 上线38.一个 Agent 做出来之后,你怎么评估它的效果?39.你刚才说需要准备测试数据集,那这个测试集应该怎么设计?40.如果测试集不好准备,那上线前你怎么确认这个 Agent 足够可用?41.除了离线测试,你会怎么做人工测试和灰度验证?________________________________________十、Agent 安全 / Prompt Injection / 越权42.Agent 测试时,除了正常测试,你有没有了解过异常测试场景?43.你对越权调用、Prompt 投毒这类安全问题了解多少?44.如果要做这类安全防御,你会怎么设计技术方案?45.在输入侧做规则引擎和小模型审查,这两种思路你怎么理解?________________________________________十一、C++ 并发 / 异步 / 落库46.你提到过 concurrent hashmap,你能讲讲它的实现原理吗?47.这个结构是怎么保证线程安全的?48.你们当时这个并发 map 真的是无锁实现吗?49.如果是锁 + 条件变量,它具体是怎么工作的?50.你提到异步落库,这个异步队列是怎么设计的?51.你们怎么处理消息延迟、消息丢失、消息堆积这些问题?52.如果队列在内存里堆积,进程或者机器异常退出,消息怎么恢复?53.你们当时对失败重试和上报之外,有没有更完整的恢复设计?________________________________________十二、网络基础 / HTTP54.你大致说一下 HTTP/1.1 和 HTTP/2 的区别。55.在长连接场景下,比如 Agent、模型交互、AI Coding 这些场景里,HTTP/1.1 和 HTTP/2 一般分别适用于什么情况?56.如果要选协议,你会怎么考虑它们各自的适用场景?