淘天AI Agent 一面面经

1. 挑选个人复杂度最高、难点最突出的项目完整讲解,重点说明项目核心痛点、落地难点、技术瓶颈与最终落地解决方案。
2. 结合项目场景,说明Agent任务目标拆解逻辑,以及PPO算法完整训练指标、效果评估标准。
3. 阐述RLHF对齐偏好定义逻辑,大模型对话优劣好坏的标注标准与偏好数据集构建逻辑。
4. 详细讲解奖励模型RM、Critic网络结构设计思路,组件有效性验证方式、调优优化策略,以及整体对话效果量化评估方案。
5. 对比选型SFT、DPO、PPO、GRPO、RAG多条技术路线,说明为何选用强化学习做Agent对齐优化,完整输出各方案评估维度、适配场景与选型依据。
6. DPO全流程效果评估方式,结合实际业务案例说明DPO固有短板,对比DPO与GRPO原理差异、优劣特点与落地适用场景。
7. 从算法原理角度,讲解GRPO具备更强探索能力、稳定训练的核心原因。
8. 阐述个人参与RAG相关项目初衷,梳理RAG系统整体架构与核心工作内容。
9. 对比语义切分、固定长度切分、递归语义切分优劣,说明递归切分选型原因,以及不规则、非结构化文档专属预处理方案。
10. 梳理向量数据库选型核心考量维度,结合线上高并发、低延迟生产环境,说明落地选型策略。
11. 说明关键词检索+向量检索混合检索设计原因,介绍召回率、准确率等检索效果客观量化评价指标。
12. 针对检索召回不足、匹配精度偏低、上下文关联性差等问题,逐条梳理全链路优化手段。
13. 讲解用户意图模糊、指代不清、需求不明确类问题的意图识别与澄清处理方案。
14. 讲解重排序模型选型、技术实现、解决的检索冗余错乱问题,所用开源/商用工具库,以及不同重排模型横向对比实验结论。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

05-02 22:50
门头沟学院 Java
继续来分享下最近的面经~欢迎友好讨论,信息共享1.实习拷打2.你刚刚说用AI写的那套东西,能介绍一下你具体做了什么?从AI写代码到交付,整个流程是怎么弄的?3.你的项目有前后端吗?大概结构是怎样的?怎么让AI帮你搞出一套能线上正式运行交付的东西?4.你实现这个项目涉及到哪些应用、中间件组件?我需要你说明系统设计的技术选型、底层逻辑,比如爬取后做什么,完整的业务流程讲清楚。5.如果是公司里的实际场景,比如有几十个应用,涉及前端、后端系统,要改一个需求可能需要改多个系统,你让AI怎么处理?6.你用的是什么模型?7.做这个项目消耗了多少token?8.开发中token很昂贵,节省token有哪些方式?9.SDD/TDD这块了解吗?10.那你知道创建一个skill有哪些方式吗?除了自然语言描述,还有什么方式?11.说一说你对function calling的理解。12.function calling和MCP相比,是不是可以没有MCP?13.MCP和客户端通信有几种方式?你怎么配置MCP?14.function calling是通过什么告诉大模型有哪些工具可用?15.大模型使用MCP调用查询天气工具,整个交互流程大概是怎样的?不用太细。16.笔试的时候,你是怎么和系统交互的?没改代码吗?17.你怎么确保AI写的代码没问题?用的是单agent吗?18.单agent和多agent相比,多agent的优势在哪里?19.能用英文口语说1分钟左右吗?20.你平时用的数据库是MySQL吧?如果线上数据量特别大,分页查询变慢,拿到这个优化任务,你的操作步骤是怎样的?21.如果单纯是数据量大导致深度分页查询慢,优化思路是什么?22.MySQL的索引结构你了解吗?为什么是B+树,而不是红黑树、平衡二叉树或者哈希结构?23.HashMap的1.8和1.7相比,做了哪些优化?24.除了结构和插入方式,还有其他优化吗?为什么插入方式会不一样?25.线程池用过吧?它的核心参数有哪些?原理是怎样的?26.Redis你使用了哪些场景?怎么实现的?27.Redis实现分布式锁的原理是什么?28.如果锁的过期时间是1分钟,任务还没执行完,其他人会不会抢锁?29.(看门狗机制下)如果任务一直卡住,其他人是不是都拿不到锁?
查看28道真题和解析
点赞 评论 收藏
分享
评论
点赞
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务