蚂蚁大模型Agent算法二面-秋招面经

1.你的 Agent 系统Prompt 是怎么设计和迭代的?有没有做过 Prompt 自动优化?当用户提出不完整的请求时,如何补全用户意图的?
2.构建 Agent 的时候,遇到过哪些瓶颈?LangChain 的 memory 默认机制在多3.用户并发中怎么做隔离?你是如何保证线程安全的?
4.微调 Llama2 你是怎么选择训练样本的?清洗逻辑是什么?你有没有观察到哪些训练样本质量问题对模型行为有很大影响?举例说明。
5.DPO相比 SFT,有哪些优劣?它在 Agent 任务上效果提升明显吗?你怎么构造偏好对?构造逻辑是自动的还是人工?
6.你说你服务部署在 vLLM 上,为何选择它?KV-cache 如何帮助推理加速?你自己做过哪些优化?
7.假如需要支持 Streaming 输出,但当前服务延迟又超标,你会怎么折中设计?
8.多轮对话上下文状态管理是如何做的?如何在高并发场景下保证一致性?
9.你做的 Agent 使用了多少个外部工具,在调用链条上如何保障故障容错和超时机制?
10.有没有做过工具调用失败后的feedback策略设计?
11.训练过程中数据来自用户行为日志,你是如何从这些数据中抽取训练对话的?有没有做过归一化或事件抽象?
12.有没有了解过带有时间窗口/偏移限制的对话系统?模型怎么“理解时间”?
13.你觉得 Agent 哪些模块最容易在真实业务中出问题?你会如何监控和定位的?
全部评论
没有手撕吗
点赞 回复 分享
发布于 2025-12-19 16:12 江苏

相关推荐

2025-12-31 17:09
北京交通大学 Java
这个客户端是偏AI的,28、27都可以投,可以转正。但是我只会Agent开发和Java后端开发,误打误撞投了。早上10:30投简历,下午3点HR打电话问意向城市,出勤率,第二天11点就面试一.关于我的terminal coding agent项目:1.效果怎么样?怎么提速?提速的效果如何?2.multi-agent怎么做的?3.你自己做过MCP吗?刚刚好做过,但是有点难描述4.上下文压缩怎么实现的?二.关于问答智能体项目:1.为什么要做LoRA?效果怎么评估的?我只能勉强会看那几个评估指标2.RAG优化3.Agent的评估和打分怎么做的?以上我感觉还行,我尽力往我的节奏这边带,下面Java就是重灾区,太久不写Java了,面试太突然没有复习三.白牛点评到这里面试官就真的领域展开了1.JVM垃圾回收?不会。JVM内部结构?不会2.Springboot的AOP原理?只记得动态代理。你知道Spring出来之前,开发Java项目怎么样吗?不会。3.为什么要分布式锁?(感觉应该是想问我分段锁)线程问题。4.为什么会有线程问题,举例?迷迷糊糊,不会。还有:你说你会做上下文记忆优化,怎么做的?关系上下文,Mem0,LibSQL,上下文压缩手撕一道完全没有见过的算法题,codetop前200没看见过?输入一个数n,标记1到n,围成一圈,从2开始每隔一个人pop掉,(2,4,6)不够就回头,求最后剩下两个数没有做出来,口述思路应该也是错的😂最后问我知道GUI(Graphical UI)吗?我刚刚好知道,但是记错了,我说的好像是CopilotKit的GUI(generative UI)和Google的A2UI😫
查看15道真题和解析
点赞 评论 收藏
分享
评论
点赞
19
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务