腾讯混元大模型算法一面-26校招

1.项目介绍,过实习,讲论文,根据表述实时跟进询问交流
2.讲一下大模型训练和推理的流程, SFT 和 RLHF 的作用分别是什么
3.为什么探索 MoE 架构, MoE 相比 Dense 有什么好处
4.有没有全量微调过
5.推导一下神经网络反向传播的过程
6.在 RLHF 中,目前主流的强化学习算法有哪几个,写一下损失函数的表达式
7.一道排列组合的概率题
8.平常有用过 RLHF 吗,简单介绍一下
9. 开放题:对目前大模型的发展有什么看法
10.代码:多头自注意力
全部评论

相关推荐

12-13 14:51
已编辑
井冈山大学 算法工程师
龙虾x:算法比你强的没有你美,比你美的…..算了已经没有比你美的了
工作两年想退休了
点赞 评论 收藏
分享
评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务