腾讯混元大模型算法一面-26校招
1.项目介绍,过实习,讲论文,根据表述实时跟进询问交流
2.讲一下大模型训练和推理的流程, SFT 和 RLHF 的作用分别是什么
3.为什么探索 MoE 架构, MoE 相比 Dense 有什么好处
4.有没有全量微调过
5.推导一下神经网络反向传播的过程
6.在 RLHF 中,目前主流的强化学习算法有哪几个,写一下损失函数的表达式
7.一道排列组合的概率题
8.平常有用过 RLHF 吗,简单介绍一下
9. 开放题:对目前大模型的发展有什么看法
10.代码:多头自注意力
2.讲一下大模型训练和推理的流程, SFT 和 RLHF 的作用分别是什么
3.为什么探索 MoE 架构, MoE 相比 Dense 有什么好处
4.有没有全量微调过
5.推导一下神经网络反向传播的过程
6.在 RLHF 中,目前主流的强化学习算法有哪几个,写一下损失函数的表达式
7.一道排列组合的概率题
8.平常有用过 RLHF 吗,简单介绍一下
9. 开放题:对目前大模型的发展有什么看法
10.代码:多头自注意力
全部评论
相关推荐
2025-12-17 14:56
辽宁石油化工大学 嵌入式软件开发 allin实习的大白...:我把第二个项目发出来了,如果感兴趣可以去研究研究,欢迎交流。
https://gitee.com/jtyjtyjty333/ind-dist-ai-sec-edge-cloud
https://github.com/jtylab/ind-dist-ai-sec-edge-cloud
点赞 评论 收藏
分享
迷茫的大四🐶:base不满足是为什么
,实习薪资开高一点也行吧
点赞 评论 收藏
分享
点赞 评论 收藏
分享