腾讯-混元大模型面经-华5硕-主页内tui

腾讯-混元大模型面经-华5硕-主页内tui

❗❗腾讯26届春招提前批/26届暑期实习生/日常实习生/25届补录招聘启动 | 所有专业类型均有岗位
🏅中国民营企业500强排行榜第6位

【在招岗位】
1. 技术类:软件开发、技术运营、安全技术、测试与质量管理、技术研究、解决方案与服务、硬件开发
2. 产品类:游戏产品、内容制作、通用产品、金融产品、项目管理
3. 设计类:游戏美术、平面交互
4. 市场类:战略投资、市场营销、公共关系、销售拓展
5. 职能类:财经分析、人力资源、法律与公共政策、行政支持

【招聘范围】应届生(24届、25届可投)、实习生(在校生可投)、青云计划(23届/24届/25届博士、24届/25届硕士)

【网申链接】
https://join.qq.com/resume.html?k=ANQI6RfQ3rhPS2dpyIkeSw

腾讯-混元大模型面经-华5硕
部门与岗位:TEG - 混元大模型团队 - 大模型对齐
一面
自我介绍,过实习,讲论文,论文过的比较细,有说的笼统的地方面试官会实时进行询问交流
了解哪些大模型,简要挑一两个介绍一下,当时说了 Qwen 和 DeepSeek,然后面试官又问了这两个有什么区别
接着上一问,为什么大家都开始探索 MoE 架构,MoE 相比 Dense 有什么好处
在之前实习的时候用 LoRA 微调过 Qwen,于是问了有没有全量微调过,有没有对比过两者的性能表现
讲一下大模型训练和推理的流程,SFT 和 RLHF 的作用分别是什么
在 RLHF 中,目前主流的强化学习算法有哪几个,写一下损失函数的表达式
代码:22. 括号生成
代码:多头自注意力
一面问的八股还是比较多的,问的也比较细,而且还写了两道代码题,整个面试花的时间也比较多,大概一个半小时左右
二面
自我介绍,过实习和论文,面试官会一起进行探讨,包括工作的动机、贡献和结果,也会提一些问题和建议
之前实习用 DeepSpeed 微调过 Qwen2-72B,于是面试官问了 ZeRO-1,ZeRO-2,ZeRO-3 三个模式的区别
当时你用 DeepSpeed ZeRO-3 来微调 Qwen2-72B,每一张卡占用的显存大概是多少,估算一下为什么是占这么多的显存

除了 DeepSpeed,还用过其他的什么优化方法吗
我看你也用到了 LoRA,知道 LoRA 的原理吗,A 和 B 两个矩阵怎么初始化,有了解过其他的初始化方法吗
对 RLHF 了解的多吗
代码:3. 无重复字符的最长子串
二面更多的是结合具体的工作来问的,从用到的东西来引出问题,问的也比较灵活。当然因为部门主要是做对齐的,所以也大概聊了聊 RLHF
三面
自我介绍,挑一个觉得做的比较好的论文和实习讲一下,面试官问的比较详细,为什么选现在这种方案,为什么 work,其他方案有考虑吗
在微调 Qwen 的时候,数据是怎么构造的,有用到什么数据清洗方法吗,数据配比是怎么做的
讲一下 RLHF 的流程,之前有用 RLHF 做过模型对齐吗
在做对齐的时候,为什么 SFT 之后还要做 RLHF,只用 SFT 可以吗
知道哪些强化学习算法,除了 PPO 和 DPO 这些呢,DeepSeek 用的 GRPO 相比于 GPT 的 PPO 做了哪些改进
开放题:对目前大模型的发展有什么看法
代码:零钱的两个题 322. 零钱兑换518. 零钱兑换 II
三面面试官更聚焦于对齐这一块的内容,考的比较深。由于之前没有接触过强化学习,答得还是比较吃力的,不过面试官还挺好的,会一起讨论来做引导
四面
自我介绍,过论文和实习,问的也比较细,这里能明显的感受出来面试官的视角更系统,会把这些工作串起来问我看你简历上没写 RLHF,平常有用过 RLHF 吗
推导一下神经网络反向传播的过程一道排列组合的概率题
开放题:你觉得大模型目前还有哪些可以改进的点
四面整体更看重思维和基础,没有考察什么八股
总结
一共四轮技术面,整体来说强度比较大,对于大模型八股的考察比较细,对大模型的理解问的也比较深刻,包括一些数理逻辑基础,考察的比较全面

#26届实习##大模型##八股##面经##腾讯##内推#
全部评论

相关推荐

04-26 12:59
已编辑
门头沟学院 前端工程师
三战美团拼尽全力终于拿下,今天阴历生日mt加好友oc了,来还愿!!欢迎大家许愿,生日加持果然有效4.17  36min以下是录音大模型整理的面经:**个人背景与技术能力**  - 自我介绍。  - 使用过哪些大模型?  - 为什么选择 Cursor?  - Cursor 相比其他工具的优势是什么?  - 追问:Agent 模式的使用体验如何?  - 追问:在使用大模型过程中发现哪些问题?**项目深度考察**  - 虚拟列表实现的具体方案是什么?  - 高度不一致时如何处理?  - 前后预加载条数是如何设置的?  - 快速滑动出现白屏问题的优化方案有哪些?  - 性能优化实践中,优化前后的首屏加载时间对比情况如何?  - 追问:优化指标的选择依据是什么?  - 追问:是否考虑过其他性能指标?  -追问:performer首屏加载时间2-3s是什么水平?**技术原理**  - AI 无法处理的典型业务逻辑场景有哪些? - 人工干预的具体案例是什么?  - 前端技术的学习路径是怎样的?  - 如何掌握新技术?  **算法考核**  - 题目:三数之和要求10min,秒讲思路和时空复杂度,还可以怎么优化- 边界条件如何处理?  有什么可以优化的?例如提前终止条件和代码优雅性改进。  **反问环节**  - 实习生的能力期望有哪些?- 实习时间要求是怎样的?  - 对面试表现有什么反馈?  **其他信息确认**  - 确认到岗时间。  - 当前面试进度。- 工作地点倾向。  第三次二面啦,从一开始面完激动等oc到现在心如止水,团子你到底还要不要人呢?这次再不oc我真的要黑化了😇求右下角的送花~今天正好生日,许愿一个顺利的暑期实习,大庇天下寒士俱oc🥳(蛋糕还是美团外卖点的呢,团子真的不再爱我一次吗)
查看27道真题和解析 实习进度记录 牛客创作赏金赛
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客企业服务