淘天AI Agent 一面面经

1. 挑选个人复杂度最高、难点最突出的项目完整讲解,重点说明项目核心痛点、落地难点、技术瓶颈与最终落地解决方案。
2. 结合项目场景,说明Agent任务目标拆解逻辑,以及PPO算法完整训练指标、效果评估标准。
3. 阐述RLHF对齐偏好定义逻辑,大模型对话优劣好坏的标注标准与偏好数据集构建逻辑。
4. 详细讲解奖励模型RM、Critic网络结构设计思路,组件有效性验证方式、调优优化策略,以及整体对话效果量化评估方案。
5. 对比选型SFT、DPO、PPO、GRPO、RAG多条技术路线,说明为何选用强化学习做Agent对齐优化,完整输出各方案评估维度、适配场景与选型依据。
6. DPO全流程效果评估方式,结合实际业务案例说明DPO固有短板,对比DPO与GRPO原理差异、优劣特点与落地适用场景。
7. 从算法原理角度,讲解GRPO具备更强探索能力、稳定训练的核心原因。
8. 阐述个人参与RAG相关项目初衷,梳理RAG系统整体架构与核心工作内容。
9. 对比语义切分、固定长度切分、递归语义切分优劣,说明递归切分选型原因,以及不规则、非结构化文档专属预处理方案。
10. 梳理向量数据库选型核心考量维度,结合线上高并发、低延迟生产环境,说明落地选型策略。
11. 说明关键词检索+向量检索混合检索设计原因,介绍召回率、准确率等检索效果客观量化评价指标。
12. 针对检索召回不足、匹配精度偏低、上下文关联性差等问题,逐条梳理全链路优化手段。
13. 讲解用户意图模糊、指代不清、需求不明确类问题的意图识别与澄清处理方案。
14. 讲解重排序模型选型、技术实现、解决的检索冗余错乱问题,所用开源/商用工具库,以及不同重排模型横向对比实验结论。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

05-04 01:25
门头沟学院 Java
攒攒人品!有面试过同岗的朋友欢迎评论区交流1. 拷打实习2. 并发搜索场景下,主线程起了多个子线程后,怎么和它们通信以知道任务全都做完了?3. 为了提速引入了 Kafka,但 Kafka 本身是异步组件,会不会反而导致任务流转变得更慢?4. 流量变大后,每个任务拆解并发大量消息,Kafka 会不会变成系统的性能瓶颈?(答了限流桶策略、结合业务使用频次限制)5. 扫表和用消息中间件(如 Kafka 双 Topic)管理长时任务状态,各自的优缺点是啥?6. 详细介绍一下你项目里的多智能体协同策略,三层 Agent(Root、Main/Fallback、Sub-Agent)是怎么互相配合流转的?7. 如果主 Agent 决定越过第二层直接调底层的子 Agent,上下文信息是怎么跨层传过去的?(答了通过解析 JSON 传递意图,并共用主线程/连接)8. 补充检索是如何评估数据质量并触发的?你怎么保证二次检索能搜到之前没搜到的内容?9. 怎么避免大模型检索到网上被 AI 批量生成的虚假垃圾数据(防止 GU 投毒)?10. 短期对话记忆和长期记忆分别是怎么提取和存储的?11. 怎么判断当前用户的提问需不需要去 RAG 里检索长期记忆?12. 为什么底层选用了 pgvector 做向量数据库,而不是其他的?13. 为什么在向量检索的基础上还要加 BM25 精确检索?具体解决了什么 bad case?14. 重排序(Rerank)是怎么做的?有没有设置低分阈值做提前过滤操作?15. 传统 CNN 有什么痛点?ResNet 让你印象深刻的核心思想是什么?16. 介绍你最近读过的五篇论文17. 平时拿到一个项目任务,你用 AI 辅助编程的工作流是怎么拆解的?18. 你的AIcoding提示词策略是怎么操作的?人工一般在哪个环节介入审核?
查看17道真题和解析
点赞 评论 收藏
分享
评论
1
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务