腾讯-混元大模型面经-华5硕

部门与岗位:TEG - 混元大模型团队 - 大模型对齐
一面
自我介绍,过实习,讲论文,论文过的比较细,有说的笼统的地方面试官会实时进行询问交流
了解哪些大模型,简要挑一两个介绍一下,当时说了 Qwen 和 DeepSeek,然后面试官又问了这两个有什么区别
接着上一问,为什么大家都开始探索 MoE 架构,MoE 相比 Dense 有什么好处
在之前实习的时候用 LoRA 微调过 Qwen,于是问了有没有全量微调过,有没有对比过两者的性能表现
讲一下大模型训练和推理的流程,SFT 和 RLHF 的作用分别是什么
在 RLHF 中,目前主流的强化学习算法有哪几个,写一下损失函数的表达式
代码:22. 括号生成
代码:多头自注意力
一面问的八股还是比较多的,问的也比较细,而且还写了两道代码题,整个面试花的时间也比较多,大概一个半小时左右
二面
自我介绍,过实习和论文,面试官会一起进行探讨,包括工作的动机、贡献和结果,也会提一些问题和建议
之前实习用 DeepSpeed 微调过 Qwen2-72B,于是面试官问了 ZeRO-1,ZeRO-2,ZeRO-3 三个模式的区别
当时你用 DeepSpeed ZeRO-3 来微调 Qwen2-72B,每一张卡占用的显存大概是多少,估算一下为什么是占这么多的显存

除了 DeepSpeed,还用过其他的什么优化方法吗
我看你也用到了 LoRA,知道 LoRA 的原理吗,A 和 B 两个矩阵怎么初始化,有了解过其他的初始化方法吗
对 RLHF 了解的多吗
代码:3. 无重复字符的最长子串
二面更多的是结合具体的工作来问的,从用到的东西来引出问题,问的也比较灵活。当然因为部门主要是做对齐的,所以也大概聊了聊 RLHF
三面
自我介绍,挑一个觉得做的比较好的论文和实习讲一下,面试官问的比较详细,为什么选现在这种方案,为什么 work,其他方案有考虑吗
在微调 Qwen 的时候,数据是怎么构造的,有用到什么数据清洗方法吗,数据配比是怎么做的
讲一下 RLHF 的流程,之前有用 RLHF 做过模型对齐吗
在做对齐的时候,为什么 SFT 之后还要做 RLHF,只用 SFT 可以吗
知道哪些强化学习算法,除了 PPO 和 DPO 这些呢,DeepSeek 用的 GRPO 相比于 GPT 的 PPO 做了哪些改进
开放题:对目前大模型的发展有什么看法
代码:零钱的两个题 322. 零钱兑换518. 零钱兑换 II
三面面试官更聚焦于对齐这一块的内容,考的比较深。由于之前没有接触过强化学习,答得还是比较吃力的,不过面试官还挺好的,会一起讨论来做引导
四面
自我介绍,过论文和实习,问的也比较细,这里能明显的感受出来面试官的视角更系统,会把这些工作串起来问我看你简历上没写 RLHF,平常有用过 RLHF 吗
推导一下神经网络反向传播的过程一道排列组合的概率题
开放题:你觉得大模型目前还有哪些可以改进的点
四面整体更看重思维和基础,没有考察什么八股
总结
一共四轮技术面,整体来说强度比较大,对于大模型八股的考察比较细,对大模型的理解问的也比较深刻,包括一些数理逻辑基础,考察的比较全面

需要内推码的可以用下面这个链接:
内推链接:https://join.qq.com/resume.html?k=ANQI6RfQ3rhPS2dpyIkeSw
#26届实习##大模型##八股##面经##腾讯##内推#
全部评论
过了嘛大佬
点赞 回复 分享
发布于 03-20 19:49 北京

相关推荐

一面 1.进程,线程,协程的区别2.一个线程可以同时运行多个携程吗?3.Android线程间的通信4.计算机层面上的线程间通信5.synchronized和volatile的区别6.http不同版本之间的区别7.tcp三次握手和四次回收经典八股吟唱8.http和https去区别9.泛型擦除(这个没回答好)10.集合里面是个泛型,泛型编译完之后会变成什么?11.强转的时候 object就不能通过instanceof来判断类型了吗12.让我下去再看看泛型擦除13.java中有哪些引用14.软引用和弱引用的区别是什么15.hashmap的原理16.了解ConcurrentHashMap17.activtity的几个启动模式18.目前熟悉哪些布局19.场景:第一个实现一个圆角,布局的右上角加一个tips引导。你要怎么实现他20.要求viewgroup里面所有元素都是圆角,统一设置,不是一个组建一个组件去设置21.系统api有提供一个方法,你知道吗22.右上角的tips,这个tips和圆角有相交,不一定完全在圆角矩形里面,怎么搞23.tips超出会出现问题  会被截断。有什么属性可以解决吗?24.自定义view,聊一下做的的自定义view25.说一下自定义view的步骤26.Android内存优化哪一块27.内存抖动的了解28.recycleview的机制聊一下29.Android的双亲委派机制30.类角度的双亲委托机制31.glide的三级缓存,相关内存  磁盘 网络 三级缓存32.鸿蒙的ability的启动方式有哪些33.鸿蒙了解哪些东西自己说说34.面试官不建议我直接干,要去系统35.力扣109. 有序链表转换二叉搜索树二面1.分别介绍三段实习2.介绍一下在滴滴的难点3.对外提供sdk设置sdk时候有哪些需要注意的4.换个角度使用sdk方,接入sdk时候发现自己的依赖和sdk的依赖是有冲突的,咋么解决。5.排查到依赖冲突的地方后怎么解决呢?6.提到过工程能力,自己的提升是什么,讲解一下。7.接到crash后怎么定位问题的8.开始吐槽跨端不拉不拉不拉9.项目经历是一个音乐app。介绍一下10.介绍一下播放列表11.了解过recycleview的核心机制12.说一下anr是什么,怎么解决,怎么避免13.子线程处理完怎么给子线程(开始转到handler)14.讲一下handler15.除了handler还有其他的吗16.讲一下携程17.讲一下携程的结构性并发18.讲一下遇到的内存泄露的场景19.讲一下leakcanry的原理20.了解过git的原理吗21.http3.0讲一下22.链接复用相关23.算法148. 排序链表三面1.把三段实习全讲一遍2.学校科研相关的做了什么3.Android实习中接触到了大模型吗4.目前crash报警策略是基于什么策略的5.第二段实习负责了什么6.滴滴负责了什么7.组里往外提供是提供sdk吗8.他们是怎么调用的9.你们部门的定位是什么10.你们组提供的能力是什么11.位置偏移了怎么办,定位不对的case 是你们这里去过滤吗12.你们现在怎么看case的13.实习六个月的感触是什么14.你们的发版流程是什么15.你们的推集成是怎么搞得16.量级大的crash怎么办17.说一下遇到的anr怎么解决的18.出现crash不应该平台去解混淆吗19.你们crash是怎么分发的20.抓到crash怎么知道是哪个部门的21.组里面是单仓库还是多仓库22.为什么会分开,为了什么23.怎么去更好的支持国际化的24.你觉得发版流程有哪些问题  效率不高的地方25.出现循环依赖怎么去解决26.两个模块出现循环依赖,你会怎么去解决27.假设目前拆包合理  还是出现循环依赖,怎么解决28.音乐app,怎么做的29.学过什么基础课程 学校里面30.webview组件你用过没31.对于稳定性和性能有什么要求。32.你们对性能的明确指标是什么 ,怎么才会准出33.每次更新sdk  qa要测多久34.qa每次测试都要测全功能吗35.会学数据库会学吗?36.你知道https的整个加密过程吗37.用对称加密的原因是什么38.你能实习多久39. 搜索端团队40.算法。最长公共子串。
点赞 评论 收藏
分享
评论
3
15
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务