淘天 AI agent 二面面经 好难

攒人品中,祝大家都能拿到满意的Offer!
1.请详细介绍你简历中的RAG项目,包括整体架构和实现思路?
2.RAG中的检索模块召回错误结果时,你会如何处理?
3.RAG出现漏召的情况,你会如何优化检索模块?
4.如何评估RAG系统的效果?有哪些评估指标?
5.解释LoRA高效参数微调的原理,为什么要用低秩分解?
6.DPO训练中模型输出变长是什么原因?如何解决?
7.大模型出现复读机现象的原因是什么?有哪些解决方法?
8.SFT微调后模型的通用能力出现遗忘,你会如何处理?
9.Wide&Deep模型的原理是什么?Wide部分和Deep部分分别解决什么问题?
10.DIN模型相比传统推荐模型有什么改进?
11.L1正则和L2正则的区别是什么?从数学角度解释为什么L1能产生稀疏性?
12.SQL:统计每个商家的评论数并去重
13.手撕代码:编辑距离
全部评论
27届拼多多实习机会或看我主页 https://careers.pddglobalhr.com/campus/intern?t=4OmKPVeX9a
点赞 回复 分享
发布于 03-19 19:49 上海
欢迎来我们这,淘天推荐算法
点赞 回复 分享
发布于 03-19 17:38 浙江
大淘宝技术-行业运营技术,招暑期实习,AI Agent 开发/算法岗,感兴趣的朋友可以私聊我哦~
点赞 回复 分享
发布于 03-17 00:29 浙江
DPO训练中模型输出变长是什么原因咋回答的
点赞 回复 分享
发布于 03-11 18:22 湖南
感觉好难啊,现在的面试题已经大变样了
点赞 回复 分享
发布于 03-11 15:55 安徽
什么bg
点赞 回复 分享
发布于 03-09 09:25 黑龙江
这是开发还是算法
点赞 回复 分享
发布于 03-07 14:44 湖北

相关推荐

04-10 02:40
门头沟学院 Java
给我面没招了,发点面经攒攒人品~1.项目拷打2.你在这个 RAG 系统优化里面,在多阶段 RAG 系统中采用了 BM25 和向量混合检索,然后这个是怎么去设计两者的结合逻辑的?然后混合策略的话具体是如何去提升检索效果的?3.RAG支持 PDF 扫描件和 OCR,然后还有表格结构化的提取,然后在这过程中有没有遇到什么技术难点?4.识别准确率怎么样?5.这个多智能体系统设计里面,然后它的这个 State 管理和Checkpoint分配机制的具体实现方式是什么?怎么去解决对话执行中的状态竞争问题呢?6.怎么样实现 State 全局管理?7.将Choice 接口封装为MCP工具的时候,怎么去设计一个标准化接口?然后遇到有没有遇到过一些兼容性的挑战?8.举了项目里的一个例子,问我出参入参是怎么去定义的?9.大模型在调用这个工具的时候,比如说有 MCP 之前,它的调用的处理流程是什么样子的?10.或者说 MCP 它有哪些缺点或者挑战呢?11.提供的这个 MCP 的结果它是流式的吗?12.这个多agent项目是主子agent的项目吗?13.其中一个功能,然后它的 token 就是一次会话 token 大概有多少?有没有超过上限?14.模型用的哪个?我答Qwen,问我Qwen具体哪个版本15.在子任务过程中啊,如果它的某个子任务失败,比如说数据获取为空,它的这个整个工作流是怎么去重试或者是降级处理的?16.在实现这个流式输出实现的时候,比如说后端用了 FastAPI 和 SSE 来实现中间结果的实时流式输出。然后在这个 Langchain 这种基于图的状态机框架中,是怎么捕获每个 node 的执行结果,然后推送到前端的?17.LangGraph 和Langchain 为什么选择了 LangGraph 没有选择简单的那个 Langchain 呢?18.Checkpoint 的持久化19.对话之后重新连接的话,是怎么能够恢复到之前的那个状态呢?20.对话持久化的话,是存储到哪里的?是存储到内存里面,还是存到硬盘上面去的?21.关于 RAG 的,向量数据库在选择建索引的时候是用了哪种向量数据库?为什么?22.这里面你提到了 RRF 重排序,然后有没有引入什么模型进行精排?
查看22道真题和解析
点赞 评论 收藏
分享
评论
18
135
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务