26校招腾讯大模型算法一面45min
1.自我介绍,过实习,讲论文,根据表述实时跟进询问交流
2.讲一下大模型训练和推理的流程, SFT 和 RLHF 的作用分别是什么
3.为什么探索 MoE 架构, MoE 相比 Dense 有什么好处
4.有没有全量微调过
5.推导一下神经网络反向传播的过程
6.在 RLHF 中,目前主流的强化学习算法有哪几个,写一下损失函数的表达式
7.一道排列组合的概率题
8.平常有用过 RLHF 吗,简单介绍一下
9. 开放题:对目前大模型的发展有什么看法
10.代码:多头自注意力
2.讲一下大模型训练和推理的流程, SFT 和 RLHF 的作用分别是什么
3.为什么探索 MoE 架构, MoE 相比 Dense 有什么好处
4.有没有全量微调过
5.推导一下神经网络反向传播的过程
6.在 RLHF 中,目前主流的强化学习算法有哪几个,写一下损失函数的表达式
7.一道排列组合的概率题
8.平常有用过 RLHF 吗,简单介绍一下
9. 开放题:对目前大模型的发展有什么看法
10.代码:多头自注意力
全部评论
相关推荐
12-17 17:15
华东师范大学 运营 点赞 评论 收藏
分享
投票
点赞 评论 收藏
分享