求职战斗鸡

2025-12-17 23:25 合肥工业大学算法工程师

关注

蚂蚁大模型Agent算法二面-55min

1.你的 Agent 系统Prompt 是怎么设计和迭代的？有没有做过 Prompt 自动优化？当用户提出不完整的请求时，如何补全用户意图的？
2.构建 Agent 的时候，遇到过哪些瓶颈？LangChain 的 memory 默认机制在多
3.用户并发中怎么做隔离？你是如何保证线程安全的？
4.微调 Llama2 你是怎么选择训练样本的？清洗逻辑是什么？你有没有观察到哪些训练样本质量问题对模型行为有很大影响？举例说明。
5.DPO相比 SFT，有哪些优劣？它在 Agent 任务上效果提升明显吗？你怎么构造偏好对？构造逻辑是自动的还是人工？
6.你说你服务部署在 vLLM 上，为何选择它？KV-cache 如何帮助推理加速？你自己做过哪些优化？
7.假如需要支持 Streaming 输出，但当前服务延迟又超标，你会怎么折中设计？
8.多轮对话上下文状态管理是如何做的？如何在高并发场景下保证一致性？
9.你做的 Agent 使用了多少个外部工具，在调用链条上如何保障故障容错和超时机制？
10.有没有做过工具调用失败后的feedback策略设计？
11.训练过程中数据来自用户行为日志，你是如何从这些数据中抽取训练对话的？有没有做过归一化或事件抽象？
12.有没有了解过带有时间窗口/偏移限制的对话系统？模型怎么“理解时间”？
13.你觉得 Agent 哪些模块最容易在真实业务中出问题？你会如何监控和定位的？

全部评论

推荐最新楼层

04-07 00:05

广西大学算法工程师

淘天 AI应用开发一面

1. 先做一个简短的自我介绍，重点讲你和 AI 应用开发最相关的经历2. 讲一下你做的这个Agent项目介绍一下核心链路一般是用户输入问题后，先做意图识别，再判断是走直接生成、知识检索还是工具调用。技术上可以拆成接入层、编排层、检索层、模型层和观测层。编排层负责 Prompt 模板、上下文管理和工具路由；检索层负责文档切片、向量检索、关键词检索和重排；模型层负责对接通用大模型和总结模型；观测层负责 trace、耗时、召回质量和最终答案质量。 public Answer handle(QueryReq req) { Intent intent = intentService.detect(req...

AI-Agent面试实战...

点赞评论收藏

分享

04-13 03:15

门头沟学院算法工程师

蚂蚁实习 AI agent算法二面 1h

攒人品中，祝大家都能拿到满意的Offer！1.项目拷打2. 实习拷打3. 你们选用的训练方法是什么？训练数据具体是怎么构造的？4. 这里的训练过程，我理解是前面有一段医学语料的预训练，然后再加一段对齐过程，是这样吗？5. 关于 SFT 阶段，数据具体是怎么生成的？6. SFT 之后，后面的 DPO 过程又是如何开展的？7. DPO 需要 Chosen 和 Rejected 至少两组对比数据，这两组数据你们是怎么得到的？8. 我们现在这边可能对于医疗业务关系比较远，问一下更加基础的知识。既然谈到 DPO，谈一下 DPO 以及后续其他偏好学习算法的区别，以及各自的优劣。9. 那么 GRPO 算法呢？10. DPO 算法有哪些缺点？11. 谈谈强化学习中 On-policy 和 Off-policy 的区别，你是怎么理解的？12. 看你不仅做训练，还负责基础设施 Infra 的搭建。训练基础设施也是归你亲自搭吗？13. 当时是在哪个项目里面参与 Infra 工作的14. 你刚才提到了 Megatron，你们试过 PyTorch 原生的 FSDP 吗？15. 既然试过 FSDP，为什么最终还是选用了 Megatron？，你们当时的选型考量是什么？16. 既然提到 FSDP 和 DeepSpeed ZeRO 的区别，FSDP 实现了 ZeRO 的哪几个阶段？ZeRO-1, 2 还是 3？17. 探讨一个现实的业务问题：我们核心业务是对话类 Agent 产品。经典架构是前端设有一个意图识别与路由环节，将客户请求分发到不同的子 Agent，由于子 Agent 功能实现完全不同，不能混在一起，所以路由非常关键，一旦路由错误就无法满意回答。另外，作为全链路的必经点，路由必须足够快。我们考虑在最前端用一个相对较小（如 7B 或 13B）的模型，通过后训练使其掌握特定领域知识，实现低延迟的路由。如果让你做这个模型，你会怎么去做？

查看15道真题和解析

点赞评论收藏

分享

03-29 00:13

广西大学算法工程师

阿里 AI Agent 开发二面

1. 大语言模型的 RLHF 训练流程是什么，它存在哪些潜在风险RLHF 一般分三步。第一步是 SFT，用高质量指令数据把基座模型调成能听懂任务、按格式回答的模型。第二步是训练奖励模型，把人工偏好数据整理成 chosen 和 rejected 形式，让奖励模型学会判断两个回答哪个更好。第三步是强化学习优化，最经典的是 PPO，让当前策略在奖励更高的方向上更新，同时用 KL 约束避免模型偏离初始策略太远。它的风险主要在三个地方。第一，奖励模型可能学偏，模型最后学到的是“讨好奖励模型”而不是真正更有帮助。第二，强化学习阶段如果约束不够，模型容易出现 reward hacking，看起来分数高，但真...

AI-Agent面试实战...

点赞评论收藏

分享

03-31 15:04

北京邮电大学 Java

蚂蚁暑期二面

聊一面布置的任务那个demo问了一下实习的时候遇到问题怎么解决聊了一下ai看法，未来程序员发展无手撕，也没有新的大作业

查看2道真题和解析

点赞评论收藏

分享

04-13 18:15

东华大学 Python

蚂蚁集团效能研发面经

一面-大概32分钟1、自我介绍2、项目介绍3、假如搭建一个agent来帮助我测试上面介绍的项目，会怎么搭建，技术栈4、手撕题，一个hard说是可以ai coding，写完讲思路5、agent项目6、线程、进程、协程解释（这个真不会，举了个例子来说我在业务遇到这几个概念）7、如何借助ai使得整个测试流程自动化8、如何软件工程的那些我不会的东西9、薪资base和回杭州之后的计划10、反问11、再介绍了一手面试流程和后续安排

查看6道真题和解析

点赞评论收藏

分享

评论

3

15

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 简历上如何体现你的“AI”能力？ #

15000次浏览 335人参与

# 选择和努力，哪个更重要？ #

207217次浏览 1551人参与

# 华泰星战营，提前锁定校招offer #

13272次浏览 389人参与

# 找不到大厂实习可以去小厂吗？ #

20256次浏览 223人参与

# 一人推荐一个值得去的通信/硬件公司 #

262244次浏览 2157人参与

# 没有面试的日子里，你在做什么 #

13346次浏览 358人参与

# vivo求职进展汇总 #

294966次浏览 1610人参与

# 找AI工作应该卷什么？ #

51943次浏览 281人参与

# 哪些AI项目值得做？ #

25194次浏览 612人参与

# 你总挂在第__面？ #

10632次浏览 117人参与

# 实习时最怕听到的一句话 #

22524次浏览 193人参与

# 非技术岗是怎么找实习的 #

333382次浏览 2654人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

200220次浏览 1186人参与

# 你的秋招第一场笔试是哪家 #

330293次浏览 2184人参与

# 秋招笔试记录 #

399788次浏览 2220人参与

# 硬件开发岗知多少 #

28063次浏览 154人参与

# 美团秋招笔试 #

213556次浏览 1183人参与

# 通信和硬件还有转码的必要吗 #

105597次浏览 642人参与

# AI Coding的使用心得 #

36229次浏览 243人参与

# 你简历上最心虚的一句话 #

20939次浏览 230人参与

# 你知道最慷慨和最抠的公司分别是 #

10544次浏览 85人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务