淘天AI Agent 一面面经

1. 挑选个人复杂度最高、难点最突出的项目完整讲解,重点说明项目核心痛点、落地难点、技术瓶颈与最终落地解决方案。
2. 结合项目场景,说明Agent任务目标拆解逻辑,以及PPO算法完整训练指标、效果评估标准。
3. 阐述RLHF对齐偏好定义逻辑,大模型对话优劣好坏的标注标准与偏好数据集构建逻辑。
4. 详细讲解奖励模型RM、Critic网络结构设计思路,组件有效性验证方式、调优优化策略,以及整体对话效果量化评估方案。
5. 对比选型SFT、DPO、PPO、GRPO、RAG多条技术路线,说明为何选用强化学习做Agent对齐优化,完整输出各方案评估维度、适配场景与选型依据。
6. DPO全流程效果评估方式,结合实际业务案例说明DPO固有短板,对比DPO与GRPO原理差异、优劣特点与落地适用场景。
7. 从算法原理角度,讲解GRPO具备更强探索能力、稳定训练的核心原因。
8. 阐述个人参与RAG相关项目初衷,梳理RAG系统整体架构与核心工作内容。
9. 对比语义切分、固定长度切分、递归语义切分优劣,说明递归切分选型原因,以及不规则、非结构化文档专属预处理方案。
10. 梳理向量数据库选型核心考量维度,结合线上高并发、低延迟生产环境,说明落地选型策略。
11. 说明关键词检索+向量检索混合检索设计原因,介绍召回率、准确率等检索效果客观量化评价指标。
12. 针对检索召回不足、匹配精度偏低、上下文关联性差等问题,逐条梳理全链路优化手段。
13. 讲解用户意图模糊、指代不清、需求不明确类问题的意图识别与澄清处理方案。
14. 讲解重排序模型选型、技术实现、解决的检索冗余错乱问题,所用开源/商用工具库,以及不同重排模型横向对比实验结论。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

不愿透露姓名的神秘牛友
04-30 17:45
本人简历上 1 个 RAG 项目 + 1 个 Agent demo;这次面的是AI岗一面前我以为:背完八股 + 把项目讲清楚,应该能稳过。0-5 min:自我介绍 + 项目背景- 顺利。讲清楚了我的 RAG 是给法律咨询场景做的,痛点是大模型不懂行业术语。5-20 min:项目深挖(开始崩)- Q1:你的法律文档总共多少?切了多少个 chunk?- 我:约 500 份 PDF,5 万个 chunk- Q2:500 份 PDF 加起来才 5 万 chunk?平均每份 100 个 chunk,你切片粒度是多少?- 我:512 token- Q3:法律文档里"第三条第二款"和"第三条之二"是不同含义,你的切片会不会把它切散?- 我:(沉默 5 秒)……应该会- Q4:那你怎么解决?- 我:我可以加一个 metadata……(开始编)❌ 第一次崩:切片粒度没考虑业务语义。20-35 min:评测体系(继续崩)- Q:你怎么知道你的 RAG 有效?- 我:我用 Recall@5……- Q:评测集多少条?怎么构造的?- 我:100 条,我手工标注的- Q:100 条够吗?分布怎么样?- 我:分布……我没分- Q:那你的 Recall@5 是 0.81,你怎么知道这个数字是好是坏?baseline 是什么?- 我:(沉默 10 秒)❌ 第二次崩:没有 baseline,没分布分析,纯靠"看起来还行"。35-55 min:Agent 部分(彻底崩)- Q:你的 Agent demo 用了几个工具?- 我:3 个,搜索、计算器、文档查询- Q:当用户问一个问题,你的 Agent 怎么决定调哪个工具?- 我:用 ReAct,让模型自己决定- Q:模型决策错了怎么办?- 我:我加了个 reflection……- Q:reflection 失败 3 次后怎么处理?- 我:(沉默 15 秒)……我没想过❌ 第三次崩:异常路径完全没设计。55-65 min:业务理解 + 反问- Q:你觉得字节做 AI 应用最大的瓶颈是什么?- 我:算力?数据?- Q:你看过哪些字节最近发的 AI 产品?- 我:豆包、扣子……- Q:扣子是 Agent 平台还是工作流平台?- 我:(再次沉默)❌ 第四次崩:对面试公司业务一无所知。
面试官拷打AI项目都会问...
点赞 评论 收藏
分享
04-19 01:20
门头沟学院 Java
查看9道真题和解析
点赞 评论 收藏
分享
评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务