26.4.15 阿里控股安全一面

一、基本情况 / 项目概述
1.你先做个自我介绍。
2.你最近的一份项目,能不能从整体框架、实现方式、你承担的角色这几个方面讲一下?
________________________________________
二、字节实习:端上特征平台 / 数据处理链路
3.你们这个特征平台,本质上是在做哪些事情?
4.你们是只做数据处理和平台化支撑,真正的使用方是各个业务侧,对吗?
5.端上数据的产生流程是怎么设计的?
6.特征是怎么从原始事件中生成出来的?
7.不同特征之间是怎么区分的?
8.数据产生之后,准确性校验是怎么做的?
9.如果你们主要只是做订阅、采集、落库,那这个平台真正的复杂度和难点在哪里?
10.你刚才提到的平台能力里,除了基础入库,还有哪些额外的处理或运行能力?
________________________________________
三、SQL 优化 / 性能问题
11.你做的 SQL 优化具体是怎么发现问题的?
12.这个问题最初是怎么产生的?
13.你的优化方案具体分成了哪几步?
14.为什么这些 SQL 可以做模板化和合并处理?
15.最终修复效果怎么样?优化指标大概是多少?
________________________________________
四、自动化测试 / MCP / Agent 能力
16.你提到做了自动化测试相关的 Agent 和 MCP,这块整体设计思路是什么?
17.这个自动化测试能力具体包含哪些功能?
18.你是怎么把 MCP 接进自动化测试流程里的?
19.这个自动化测试后面是怎么和业务流程、版本流程结合起来的?
20.如果有新增接口或者代码变更,你们后续怎么补自动化测试用例?
________________________________________
五、AI 投资分析系统 / Multi-Agent 设计
21.你做的 AI 投资项目,是一个 Multi-Agent 项目,对吗?
22.这个 Multi-Agent 架构整体是怎么设计的?
23.主控 Agent 和子 Agent 之间是怎么分工的?
24.不同 Agent 之间的数据是怎么流转的?
25.任务列表、完成标记、工具调用列表这套机制是怎么设计的?
26.你的系统提示词一般是怎么设计出来的?
27.你自己先写提示词,和让 AI 帮你结构化整理,这两部分分别怎么配合?
________________________________________
六、Prompt / 幻觉控制
28.写提示词的时候,怎么尽量减少幻觉?
29.你觉得减少幻觉最关键的设计点是什么?
30.除了提示词约束和标注信息来源,你还有没有别的方法控制幻觉?
________________________________________
七、字节中的 Agent 实践
31.在字节实习期间,除了测试那块,你还做过其他 Agent 相关开发吗?
32.你说的测试 Agent,本质上到底用了哪些 Agent 能力?
________________________________________
八、通用 Agent 设计方法论
33.如果现在让你从一个业务场景出发设计一个 Agent,整个流程你会拆成哪些步骤?
34.在架构设计阶段,你会先判断哪些关键问题?
35.什么时候适合做简单的一问一答式 Agent,什么时候适合做 ReAct / Plan-and-Execute 这种复杂 Agent?
36.长短期记忆、工具设计、安全审查,这些部分在 Agent 设计里分别怎么考虑?
37.你觉得一个 Agent 的最小可行版本(MVP)应该包含哪些核心部分?
________________________________________
九、Agent 评估 / 数据集 / 上线
38.一个 Agent 做出来之后,你怎么评估它的效果?
39.你刚才说需要准备测试数据集,那这个测试集应该怎么设计?
40.如果测试集不好准备,那上线前你怎么确认这个 Agent 足够可用?
41.除了离线测试,你会怎么做人工测试和灰度验证?
________________________________________
十、Agent 安全 / Prompt Injection / 越权
42.Agent 测试时,除了正常测试,你有没有了解过异常测试场景?
43.你对越权调用、Prompt 投毒这类安全问题了解多少?
44.如果要做这类安全防御,你会怎么设计技术方案?
45.在输入侧做规则引擎和小模型审查,这两种思路你怎么理解?
________________________________________
十一、C++ 并发 / 异步 / 落库
46.你提到过 concurrent hashmap,你能讲讲它的实现原理吗?
47.这个结构是怎么保证线程安全的?
48.你们当时这个并发 map 真的是无锁实现吗?
49.如果是锁 + 条件变量,它具体是怎么工作的?
50.你提到异步落库,这个异步队列是怎么设计的?
51.你们怎么处理消息延迟、消息丢失、消息堆积这些问题?
52.如果队列在内存里堆积,进程或者机器异常退出,消息怎么恢复?
53.你们当时对失败重试和上报之外,有没有更完整的恢复设计?
________________________________________
十二、网络基础 / HTTP
54.你大致说一下 HTTP/1.1 和 HTTP/2 的区别。
55.在长连接场景下,比如 Agent、模型交互、AI Coding 这些场景里,HTTP/1.1 和 HTTP/2 一般分别适用于什么情况?
56.如果要选协议,你会怎么考虑它们各自的适用场景?
全部评论

相关推荐

04-30 08:01
东南大学 C++
一、项目与实习经历1.你先做个自我介绍。2.你能详细介绍一下你在字节跳动做的项目吗?二、AI Coding 题:配置驱动的 HTTP 路由转发题目:实现一个通过配置文件管理的HTTP接口路由转发功能,需满足:基础功能•支持 YAML/JSON 配置文件定义路由规则(路径、方法、目标服务)•实现 HTTP/HTTPS 请求转发•处理路径通配符(如 /api/*)进阶能力•配置热加载(修改文件不重启服务)•负载均衡(轮询/随机两种策略)•请求超时控制与重试机制生产级要求•大文件传输时内存占用 < 50MB(流式转发)•可读的错误码体系(如 404、502)•输出审计日志(路径、目标 IP、状态码、耗时)交付要求•可运行代码 + 配置示例•通过三个测试场景:热加载、重试、100MB 文件传输10.你先看一下这个题目,然后说一下你的理解,以及你打算怎么处理、整体思路是什么。11.你对这里“负载均衡”这一块是怎么理解的?12.热加载这个功能,你觉得一般应该怎么做?13.你刚才提到定时轮询配置,那这个轮询一般隔多久比较合适?14.你说到实习里也有类似的动态配置更新?对应的机制大概是什么?15.这个接口转发里,你理解的“目标服务”是什么?16.如果目标服务不只是 HTTP,也可能是 RPC,那你觉得这里还需要考虑什么?17.这个生成出来的代码里,配置和接口的匹配方式是什么?18.你希望这个配置文件的更新机制是什么样的?19.如果手动修改配置文件出了问题,比如 JSON 不合法,你觉得系统应该怎么处理?________________________________________三、设备特征缓存优化 / 特征 SQL 优化20.你刚才提到设备特征缓存优化,在你优化之前,这块有缓存机制吗?21.你刚才说每次要调适配器,这里调用适配器主要是为了获取什么?22.是因为这个接口耗时比较长,所以你们才考虑加缓存,是吗?23.如果设备特征对准确性要求不是特别高,那为什么适合做缓存?24.这块缓存机制上线之后,大概优化了多少?25.你刚才提到用了并发相关的开发,比如 concurrent hash map 这些,这块你了解多少?26.如果涉及多线程开发,你大概了解哪些线程相关的工具?________________________________________四、线程 / 系统能力 / 开放题27.如果一台 8G 内存的机器,你觉得大概能创建多少个线程?28.如果不要求你给具体数字,那你觉得估算“最多能创建多少线程”时,需要考虑哪些因素?________________________________________五、SQL 复用优化29.你第二点提到 SQL 复用优化,这一块能简单介绍一下你做的工作吗?30.你这里提到“将时间窗口不同的查询归定为同类请求”,这个怎么理解?31.你们是不是把某个时间范围内的 SQL 放在一起统一去请求?________________________________________六、滑动窗口消息去重(开放题)32.如果你的系统接收外部消息,并且希望在一个滑动时间窗口内对消息做去重,这个功能如果交给你,你会怎么做?33.假设你的服务有多台机器共同消费同一个上游消息源,在这种分布式场景下,滑动窗口内的消息去重你会怎么设计?34.如果你想到加一个共享中间件,那这个共享中间件应该怎么设计?35.这个去重逻辑你具体会怎么实现?
查看28道真题和解析
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务