美团北斗大模型秋招算法岗面经
1️⃣一面
1. 介绍第一篇论文,reward model怎么设计。
2. 过程监督的信号具体是怎么设计的。过程监督的信号还能应用在哪些地方。
3. 如何保证强化学习的训练效率(平衡效率和稳定),grpo训练过程中出现了全0或者全1怎么解决。
4. 混合推理是怎么做的(OpenAI GPT-5),大模型在增强推理的时候如何保证通用数据不遗忘。
5. 现在大模型还有那些能力值得增强。
6. 介绍第二篇论文
7. 介绍第一段实习,介绍落地的场景。
8. 写题,非hot100的模拟
2️⃣二面
1. 介绍第二段实习,中间会打断提问,问看过qwen2.5‑vl的报告了吗,问具体业务细节,强化学习数据集的构建方法,问部门几个人
2. 介绍第一段实习,主包这一段实习是基座的,问了很多部门的情况,包括后训练、预训练、数据生成等等
3. 介绍第一篇论文,介绍背景和方法
4. 面试官感觉很真诚,共享屏幕介绍他们组的业务
3️⃣三面
1. 问是保研的吗,论文是研究生阶段发的吗,大四在干什么,研究生的毕业论文写好了吗,两篇论文是一个领域的吗
2. 介绍第一篇论文,中途打断,说不了解你们这个领域,针对强化学习的底层设计,怎么去设计的,强化学习能解决什么问题,强化学习每一轮用的数据是多少,模型用的多大的,用小模型做强化学习效果会好吗,实验室里有多少张卡,训练的时候都用了几张。
3. 研究生阶段在做科研时遇到了什么困难,花费时间最长的是哪个阶段,研究生有什么成功的经验,有没有失败的经历,发现某条技术路线不行。
4. 你认为未来会有什么新技术,还会有强化学习这种路线吗,agent调用工具时工具需要很多参数,幻觉现象很严重,未来可能会有什么解决方案
4️⃣四面
1. 共享屏幕介绍论文,面试官听不懂,打开word讲述,问论文的创新点,输入输出是什么。
2. 介绍第二篇论文。你的方法有泛化性吗,可以泛化到垂直领域吗
3. 介绍第一段实习,问有什么经验,有哪些失败的尝试
4. 介绍第二段实习,觉得我的介绍太平铺直叙了,说可以后面做个PPT
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
1. 介绍第一篇论文,reward model怎么设计。
2. 过程监督的信号具体是怎么设计的。过程监督的信号还能应用在哪些地方。
3. 如何保证强化学习的训练效率(平衡效率和稳定),grpo训练过程中出现了全0或者全1怎么解决。
4. 混合推理是怎么做的(OpenAI GPT-5),大模型在增强推理的时候如何保证通用数据不遗忘。
5. 现在大模型还有那些能力值得增强。
6. 介绍第二篇论文
7. 介绍第一段实习,介绍落地的场景。
8. 写题,非hot100的模拟
2️⃣二面
1. 介绍第二段实习,中间会打断提问,问看过qwen2.5‑vl的报告了吗,问具体业务细节,强化学习数据集的构建方法,问部门几个人
2. 介绍第一段实习,主包这一段实习是基座的,问了很多部门的情况,包括后训练、预训练、数据生成等等
3. 介绍第一篇论文,介绍背景和方法
4. 面试官感觉很真诚,共享屏幕介绍他们组的业务
3️⃣三面
1. 问是保研的吗,论文是研究生阶段发的吗,大四在干什么,研究生的毕业论文写好了吗,两篇论文是一个领域的吗
2. 介绍第一篇论文,中途打断,说不了解你们这个领域,针对强化学习的底层设计,怎么去设计的,强化学习能解决什么问题,强化学习每一轮用的数据是多少,模型用的多大的,用小模型做强化学习效果会好吗,实验室里有多少张卡,训练的时候都用了几张。
3. 研究生阶段在做科研时遇到了什么困难,花费时间最长的是哪个阶段,研究生有什么成功的经验,有没有失败的经历,发现某条技术路线不行。
4. 你认为未来会有什么新技术,还会有强化学习这种路线吗,agent调用工具时工具需要很多参数,幻觉现象很严重,未来可能会有什么解决方案
4️⃣四面
1. 共享屏幕介绍论文,面试官听不懂,打开word讲述,问论文的创新点,输入输出是什么。
2. 介绍第二篇论文。你的方法有泛化性吗,可以泛化到垂直领域吗
3. 介绍第一段实习,问有什么经验,有哪些失败的尝试
4. 介绍第二段实习,觉得我的介绍太平铺直叙了,说可以后面做个PPT
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
查看17道真题和解析 点赞 评论 收藏
分享
查看2道真题和解析 点赞 评论 收藏
分享