阿里淘天AI Agent二面面经分享

继续来分享下之前的面经~
1.介绍RAG项目,整体架构和实现思路
2.RAG中的检索模块召回错误结果时,你会如何处理?
3.RAG出现漏召的情况,你会如何优化检索模块?
4.如何评估RAG系统的效果?有哪些评估指标?
5.解释LoRA高效参数微调的原理,为什么要用低秩分解?
6.DPO训练中模型输出变长是什么原因?如何解决?
7.大模型出现复读机现象的原因是什么?有哪些解决方法?
8.SFT微调后模型的通用能力出现遗忘,你会如何处理?
9.Wide&Deep模型的原理是什么?Wide部分和Deep部分分别解决什么问题?
10.DIN模型相比传统推荐模型有什么改进?
11.L1正则和L2正则的区别是什么?从数学角度解释为什么L1能产生稀疏性?
12.SQL:统计每个商家的评论数并去重
13.手撕代码:编辑距离
全部评论
这个ai优化还是ai应用开发岗位呀
2 回复 分享
发布于 03-27 02:52 湖南
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 03-28 07:37 广东
这难度面ai算法的吧
点赞 回复 分享
发布于 04-11 00:59 四川
请问阿里agent有几轮面试啊
点赞 回复 分享
发布于 04-03 16:36 河南
阿里还考代码吗我以为全都是ai coding了
点赞 回复 分享
发布于 04-01 10:18 浙江
这是优化岗吗,后面问的几个完全没听过啊
点赞 回复 分享
发布于 03-29 21:27 吉林
考虑我司不 欢迎联系
点赞 回复 分享
发布于 03-27 10:56 上海

相关推荐

04-10 02:40
门头沟学院 Java
给我面没招了,发点面经攒攒人品~1.项目拷打2.你在这个 RAG 系统优化里面,在多阶段 RAG 系统中采用了 BM25 和向量混合检索,然后这个是怎么去设计两者的结合逻辑的?然后混合策略的话具体是如何去提升检索效果的?3.RAG支持 PDF 扫描件和 OCR,然后还有表格结构化的提取,然后在这过程中有没有遇到什么技术难点?4.识别准确率怎么样?5.这个多智能体系统设计里面,然后它的这个 State 管理和Checkpoint分配机制的具体实现方式是什么?怎么去解决对话执行中的状态竞争问题呢?6.怎么样实现 State 全局管理?7.将Choice 接口封装为MCP工具的时候,怎么去设计一个标准化接口?然后遇到有没有遇到过一些兼容性的挑战?8.举了项目里的一个例子,问我出参入参是怎么去定义的?9.大模型在调用这个工具的时候,比如说有 MCP 之前,它的调用的处理流程是什么样子的?10.或者说 MCP 它有哪些缺点或者挑战呢?11.提供的这个 MCP 的结果它是流式的吗?12.这个多agent项目是主子agent的项目吗?13.其中一个功能,然后它的 token 就是一次会话 token 大概有多少?有没有超过上限?14.模型用的哪个?我答Qwen,问我Qwen具体哪个版本15.在子任务过程中啊,如果它的某个子任务失败,比如说数据获取为空,它的这个整个工作流是怎么去重试或者是降级处理的?16.在实现这个流式输出实现的时候,比如说后端用了 FastAPI 和 SSE 来实现中间结果的实时流式输出。然后在这个 Langchain 这种基于图的状态机框架中,是怎么捕获每个 node 的执行结果,然后推送到前端的?17.LangGraph 和Langchain 为什么选择了 LangGraph 没有选择简单的那个 Langchain 呢?18.Checkpoint 的持久化19.对话之后重新连接的话,是怎么能够恢复到之前的那个状态呢?20.对话持久化的话,是存储到哪里的?是存储到内存里面,还是存到硬盘上面去的?21.关于 RAG 的,向量数据库在选择建索引的时候是用了哪种向量数据库?为什么?22.这里面你提到了 RRF 重排序,然后有没有引入什么模型进行精排?
查看22道真题和解析
点赞 评论 收藏
分享
评论
7
34
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务