阿里淘天大模型Agent校招面经

狠狠被拷打,已经是没招了...
1. Transformer中Attention的本质是什么?你能从数学角度简要解释一下吗?
2. 在Agent多轮对话任务中,你觉得Attention的局限性体现在哪些方面?
3. 简要介绍一下SFT的核心流程,以及数据集的构建策略,SFT之后常见的Post-Training还有哪些?它们之间的目的有何区别?
4. 什么是RAG,它是怎么提升生成质量的?与传统检索+模型生成的流程有何不同?如何评估一个RAG系统是否work的?
5. PPO和DPO在大模型对齐中的主要区别是什么?DPO训练通常有哪些注意事项?用过GRPO么?
6. 项目里的Modular Agent,你能讲讲它是如何实现多步规划的吗?
7. 项目提到了多个工具调用链路,调度策略是如何设计的?是否有异常fallback策略?
8. Agent评估体系包括哪些维度?如何衡量planning能力 vs hallucination rate?
9. 项目里微调Qwen,选择的训练阶段和Loss函数是如何决定的?
10. Prompt自动推荐模块用了哪些优化策略?有没有尝试过Prompt压缩或embedding表示的方式?
11. 场景题:假如一个Agent 推理链路包含3个工具+高频请求,系统整体延迟较高,你会如何优化?
12. 代码:岛屿数量
全部评论
m
1 回复 分享
发布于 03-05 01:25 广东
大佬你的八股都是在哪看的呀
点赞 回复 分享
发布于 昨天 12:47 四川
佬你这个是算法岗还是开发
点赞 回复 分享
发布于 03-21 22:42 海南
m
点赞 回复 分享
发布于 03-19 22:58 北京
已老实
点赞 回复 分享
发布于 03-17 18:06 四川
大淘宝技术-行业运营技术,招暑期实习,AI Agent 开发/算法岗,感兴趣的朋友可以私聊我哦~
点赞 回复 分享
发布于 03-17 00:29 浙江
m
点赞 回复 分享
发布于 03-16 20:54 四川
m
点赞 回复 分享
发布于 03-15 21:44 上海
m
点赞 回复 分享
发布于 03-13 17:02 浙江
m
点赞 回复 分享
发布于 03-10 17:40 陕西
已老实
点赞 回复 分享
发布于 03-10 11:26 四川
岛屿数量这个题,我之前有刷到过
点赞 回复 分享
发布于 03-09 19:07 陕西
m
点赞 回复 分享
发布于 03-09 14:10 天津
蹲进度
点赞 回复 分享
发布于 03-09 12:16 安徽
m
点赞 回复 分享
发布于 03-09 07:53 广东
m
点赞 回复 分享
发布于 03-08 10:15 加拿大
m
点赞 回复 分享
发布于 03-06 21:39 辽宁
mark
点赞 回复 分享
发布于 03-06 17:17 江苏
m
点赞 回复 分享
发布于 03-05 23:57 湖北
mark
点赞 回复 分享
发布于 03-05 10:26 宁夏

相关推荐

1. 为什么做Agent项目?2. 了解过市面上有哪些智能体agent吗3. 讲下Agent项目4. Agent项目开发的框架5. 介绍一些AI大模型6. RAG系统流程7. MCP和Function Calling8. 如何写好的prompt9. 多轮对话的实现方案10. Agent项目背景11. LLM产生幻觉的原因及解决方案12. MCP协议的核心内容13. 推理模式的差异化设计14. RAG检索优化策略15. 特定推理模型不支持MCP的技术原因16. Agent推理模式17. 跨模块错误追踪的Agent知识库构建方案18. 多Agent执行策略的智能选择和切换机制设计19. 简历关键词提取的技术实现20. RAG评估方案21. SSE的局限性22. 举例复杂任务下执行流程23. MCP通信方式24. 项目中AI贡献的代码占比25. Prompt工程的实践经验26. 基于代码构建知识库的Agent设计27. A2A协议28. 长文本生成的技术方案29. Agent skills30. 演示Agent项目实现细节31. 了解其他的Agent范式吗32. 模型预热机制33. NL2SQL场景下的SQL安全防护34. 复杂任务执行准确率提升的评估方法35. AI辅助IDE开发工具36. RAG动态知识更新37. MCP和skill区别38. 推理模式的选择机制39. 企业内部知识库RAG的动态持续更新方案40. Prompt设计示例41. A2A与MCP区别42. 多阶段召回策略优化43. AI辅助开发的实践经验
SeanWong-b...:大佬面的哪些厂呀
掌握什么AI技能,会为你...
点赞 评论 收藏
分享
02-27 08:25
门头沟学院 Java
给我面没招了,强度也太大了....1.实习拷打2.项目拷打3.处理查询文档里的异构数据(如图片)时,具体的处理流程是什么?解析成纯文字后如何进一步加工?这样只返回文字给用户,图片信息不会丢失吗?4.你们是通过人工打标建立图片和文本的对应关系吗?文档量很大的情况下,打标工作能完成吗?5.如何保证大部分图片异构数据解析后回答的正确性?若回答错误,怎么识别问题?后续要验证回答准确性,你有什么方案?6.用于评测的另一个大模型,如何构造问题、分析文字并进行对比?这个大模型的正确率以及模型自我一致性怎么确定?7.你们的模型基于哪些异构图像做增强?模型会不会产生幻觉,生成文档外的内容?8.若用户的问题不在文档里,你们会怎么处理?是调用其他模型吗?大模型回答不了时,会提示用户补充问题吗?用户补充后仍无法解决该怎么办?模型如何判断何时需要让用户补充提问?9.你们有框架编排这些流程吗?用的是什么框架?10.怎么理解检索召回率?这些指标具体包含哪些评价项?什么是忠实度?召回率的分子分母是怎么定义的?11.你之前那段实习的具体工作内容是什么?针对设备故障叙述报告这类复杂文本,模型如何理解?是做了相关检测吗?大模型是怎么实现术语解释的?12.请讲一下LoRA技术,除了减少参数量,它还有什么优点?你做的LoRA相关工作,后续有落地应用吗?13.你写代码主要用Python吗?会不会用Java?了解Java的多线程、双亲委派模型以及消息中间件吗?有没有做过Java相关项目?14.你用过LangChain吗?如何用它解决大模型的幻觉问题?若不熟悉LangChain,还能通过什么方法做AI能力增强?
查看12道真题和解析
点赞 评论 收藏
分享
评论
40
268
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务