蚂蚁大模型Agent算法二面-55min

1.你的 Agent 系统Prompt 是怎么设计和迭代的?有没有做过 Prompt 自动优化?当用户提出不完整的请求时,如何补全用户意图的?
2.构建 Agent 的时候,遇到过哪些瓶颈?LangChain 的 memory 默认机制在多
3.用户并发中怎么做隔离?你是如何保证线程安全的?
4.微调 Llama2 你是怎么选择训练样本的?清洗逻辑是什么?你有没有观察到哪些训练样本质量问题对模型行为有很大影响?举例说明。
5.DPO相比 SFT,有哪些优劣?它在 Agent 任务上效果提升明显吗?你怎么构造偏好对?构造逻辑是自动的还是人工?
6.你说你服务部署在 vLLM 上,为何选择它?KV-cache 如何帮助推理加速?你自己做过哪些优化?
7.假如需要支持 Streaming 输出,但当前服务延迟又超标,你会怎么折中设计?
8.多轮对话上下文状态管理是如何做的?如何在高并发场景下保证一致性?
9.你做的 Agent 使用了多少个外部工具,在调用链条上如何保障故障容错和超时机制?
10.有没有做过工具调用失败后的feedback策略设计?
11.训练过程中数据来自用户行为日志,你是如何从这些数据中抽取训练对话的?有没有做过归一化或事件抽象?
12.有没有了解过带有时间窗口/偏移限制的对话系统?模型怎么“理解时间”?
13.你觉得 Agent 哪些模块最容易在真实业务中出问题?你会如何监控和定位的?
全部评论

相关推荐

2025-12-12 15:19
首先说明一下我眼中互联网大厂的定义:扎根互联网+对互联网影响重大T0:BAT(无先后)字节:如今 TT 已经成为全球最火的软件,直播电商创造的价值无法估计。对于 AI 技术,字节更是成立了 seed 部门,应用上有豆包,学术上有论文。阿里:业务就不多介绍,AI技术上和字节类似,通义实验室的 AI 也在国际上有一席之地。腾讯:更不用介绍,有鹅选鹅似乎永远不会过时。T1:蚂蚁蚂蚁:实际上,蚂蚁的认可度可以达到 T0(当阿里用一点问题没有),熟悉商业史的同学都知道,蚂蚁没改名前叫做"浙江阿里巴巴",除了这层关系,蚂蚁本身的业务、技术都配得上T0 的宝座,把它排在 T1 主要还是 bat 的业务太广泛(且名义上不属于阿里巴巴)。T1.5:美团美团:个人感觉实力能够排在蚂蚁之后,但是认可度似乎还没那么高。即时零售已经成为电商领域的必争之地,美团作为霸主有非常多的优势。同时技术上,也是公认的很好,AI 目前没有特别多的成果。T2:京东、pdd、滴滴、shopee、百度、shein、快手、TME、小红书等等,能够排在 T2 的定义:三个 T2 可以合成一个 T0,这个层次的大厂认可度其实没有太大区别了,社招简历都能过筛。(TME 的认可度也可以当腾讯用,但是 TME 本身实力不像蚂蚁,所以只能在 T2)对于美团:我认为美团比 T2 其他大厂强很多,但是又比 T1、T0 的大厂逊色不少,就单独为 T1.5 了。中厂定义:不属于 T2 的互联网大公司,例如 soul、陌陌、知乎、科大讯飞这种,他们有知名度,但是认可度差了 T2 一个档次,也没办法“三合一成为T0”
点赞 评论 收藏
分享
评论
3
11
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务