26.4.15 阿里控股安全一面

一、基本情况 / 项目概述
1.你先做个自我介绍。
2.你最近的一份项目,能不能从整体框架、实现方式、你承担的角色这几个方面讲一下?
________________________________________
二、字节实习:端上特征平台 / 数据处理链路
3.你们这个特征平台,本质上是在做哪些事情?
4.你们是只做数据处理和平台化支撑,真正的使用方是各个业务侧,对吗?
5.端上数据的产生流程是怎么设计的?
6.特征是怎么从原始事件中生成出来的?
7.不同特征之间是怎么区分的?
8.数据产生之后,准确性校验是怎么做的?
9.如果你们主要只是做订阅、采集、落库,那这个平台真正的复杂度和难点在哪里?
10.你刚才提到的平台能力里,除了基础入库,还有哪些额外的处理或运行能力?
________________________________________
三、SQL 优化 / 性能问题
11.你做的 SQL 优化具体是怎么发现问题的?
12.这个问题最初是怎么产生的?
13.你的优化方案具体分成了哪几步?
14.为什么这些 SQL 可以做模板化和合并处理?
15.最终修复效果怎么样?优化指标大概是多少?
________________________________________
四、自动化测试 / MCP / Agent 能力
16.你提到做了自动化测试相关的 Agent 和 MCP,这块整体设计思路是什么?
17.这个自动化测试能力具体包含哪些功能?
18.你是怎么把 MCP 接进自动化测试流程里的?
19.这个自动化测试后面是怎么和业务流程、版本流程结合起来的?
20.如果有新增接口或者代码变更,你们后续怎么补自动化测试用例?
________________________________________
五、AI 投资分析系统 / Multi-Agent 设计
21.你做的 AI 投资项目,是一个 Multi-Agent 项目,对吗?
22.这个 Multi-Agent 架构整体是怎么设计的?
23.主控 Agent 和子 Agent 之间是怎么分工的?
24.不同 Agent 之间的数据是怎么流转的?
25.任务列表、完成标记、工具调用列表这套机制是怎么设计的?
26.你的系统提示词一般是怎么设计出来的?
27.你自己先写提示词,和让 AI 帮你结构化整理,这两部分分别怎么配合?
________________________________________
六、Prompt / 幻觉控制
28.写提示词的时候,怎么尽量减少幻觉?
29.你觉得减少幻觉最关键的设计点是什么?
30.除了提示词约束和标注信息来源,你还有没有别的方法控制幻觉?
________________________________________
七、字节中的 Agent 实践
31.在字节实习期间,除了测试那块,你还做过其他 Agent 相关开发吗?
32.你说的测试 Agent,本质上到底用了哪些 Agent 能力?
________________________________________
八、通用 Agent 设计方法论
33.如果现在让你从一个业务场景出发设计一个 Agent,整个流程你会拆成哪些步骤?
34.在架构设计阶段,你会先判断哪些关键问题?
35.什么时候适合做简单的一问一答式 Agent,什么时候适合做 ReAct / Plan-and-Execute 这种复杂 Agent?
36.长短期记忆、工具设计、安全审查,这些部分在 Agent 设计里分别怎么考虑?
37.你觉得一个 Agent 的最小可行版本(MVP)应该包含哪些核心部分?
________________________________________
九、Agent 评估 / 数据集 / 上线
38.一个 Agent 做出来之后,你怎么评估它的效果?
39.你刚才说需要准备测试数据集,那这个测试集应该怎么设计?
40.如果测试集不好准备,那上线前你怎么确认这个 Agent 足够可用?
41.除了离线测试,你会怎么做人工测试和灰度验证?
________________________________________
十、Agent 安全 / Prompt Injection / 越权
42.Agent 测试时,除了正常测试,你有没有了解过异常测试场景?
43.你对越权调用、Prompt 投毒这类安全问题了解多少?
44.如果要做这类安全防御,你会怎么设计技术方案?
45.在输入侧做规则引擎和小模型审查,这两种思路你怎么理解?
________________________________________
十一、C++ 并发 / 异步 / 落库
46.你提到过 concurrent hashmap,你能讲讲它的实现原理吗?
47.这个结构是怎么保证线程安全的?
48.你们当时这个并发 map 真的是无锁实现吗?
49.如果是锁 + 条件变量,它具体是怎么工作的?
50.你提到异步落库,这个异步队列是怎么设计的?
51.你们怎么处理消息延迟、消息丢失、消息堆积这些问题?
52.如果队列在内存里堆积,进程或者机器异常退出,消息怎么恢复?
53.你们当时对失败重试和上报之外,有没有更完整的恢复设计?
________________________________________
十二、网络基础 / HTTP
54.你大致说一下 HTTP/1.1 和 HTTP/2 的区别。
55.在长连接场景下,比如 Agent、模型交互、AI Coding 这些场景里,HTTP/1.1 和 HTTP/2 一般分别适用于什么情况?
56.如果要选协议,你会怎么考虑它们各自的适用场景?
全部评论

相关推荐

点赞 评论 收藏
分享
昨天 08:02
东南大学 C++
一、基本情况 / 经历1.你先简单做一下自我介绍。2.你在字节是在北京实习吗?3.你后来为什么没有继续在字节那边实习?4.你有 Java 相关的开发经验吗?5.你对 RPC 了解吗?6.你对 Kafka、MQ 这类消息队列中间件了解吗?________________________________________二、AI 投资分析系统 / 多 Agent 设计7.你之前做的 Agent 项目主要是用 Python 写的吗?8.你这个投资分析系统,是不是用户给一个投资问题,然后系统拆成多个子 Agent 去分析,最后汇总输出?9.你为什么要拆子 Agent?10.如果现在基于支持 skill 的系统重新实现你的 AI 投资分析系统,你觉得能不能用 skill 代替子 Agent?11.你说 skill 不能完全代替子 Agent,你理解的局限性具体是什么?12.如果 skill 的调用过程、输入输出都能清晰观测,而且上下文也能做清洗,那在你的理解里,skill 和子 Agent 还有什么本质区别?13.你觉得多 Agent 在什么情况下容易出错?14.你有没有一些实际经验,能说明多 Agent 什么时候会出问题?________________________________________三、AI Coding 环节相关15.你先看看这个 AI Coding 题目,理解一下。16.在这个词包拆分场景里,如果一个词包里有 10 万级别的词,你觉得 Agent 应该怎么处理?17.这些词包拆分时,你是不是必须覆盖词包里所有词,不能随机丢弃?18.如果广告主提出新的拆分维度,比如按产品型号、季节、颜色,甚至“适合情人节投放”这种抽象维度,你会怎么设计?19.这种动态维度拆分的问题,你觉得应该靠工具层解决,还是靠 Agent 自己推理解决?20.如果系统没有预定义这些维度,Agent 怎么识别和处理一个新的分类标准?________________________________________四、字节实习项目:特征平台 / SDK / 端云协同21.你能讲一个你觉得比较自豪、能体现你个人能力的方案设计吗?22.你做的这个特征 SQL 优化,里面的时间戳具体是 SQL 里的什么条件?23.你这个平台分析的是抖音这类 C 端用户行为吗?24.如果事件量很大,但查询量没那么高,你们有没有评估过事件驱动更新缓存会不会反而带来更大的压力?25.你实习里做的 SDK、特征平台、特征处理这些东西,它们之间到底是什么关系?26.头条和抖音用的是同一套 SDK,但关注的特征不一样,这种差异化是怎么实现的?27.这些差异化逻辑是在客户端做过滤,还是在服务端做过滤?28.如果过滤是在客户端做,那之前没上报的数据后面突然想要了,这种历史数据追溯问题怎么解决?29.你们现在的过滤逻辑,最终是在端上做的吗?________________________________________五、实习时间 / 求职安排30.你现在有考研或者读研的计划吗?31.如果还能继续实习的话,你最早什么时候能到岗,能实习到什么时候?
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务