【25年7月最新大模型面经+答案】阿里大模型二面
【获取更多面经和 答案 移步小红书哦~】
1. 先做题,手写一个特殊的损失函数计算(带mask矩阵的要求的),手写rope
2. 论文拷打
3. GRPO/dpo/ppo区别,reward model必须的么,都如何体现,r1冷启动的作用
4. qwen用过么,讲讲进程,你认为最大的改进是什么
5. 实习遇到的最大困难是什么,怎么解决的,提了一个模型的,然后追问如何优化,怎么考虑的一堆
6. 反问#大模型#
1. 先做题,手写一个特殊的损失函数计算(带mask矩阵的要求的),手写rope
2. 论文拷打
3. GRPO/dpo/ppo区别,reward model必须的么,都如何体现,r1冷启动的作用
4. qwen用过么,讲讲进程,你认为最大的改进是什么
5. 实习遇到的最大困难是什么,怎么解决的,提了一个模型的,然后追问如何优化,怎么考虑的一堆
6. 反问#大模型#
全部评论
相关推荐
07-24 20:57
北京邮电大学 Python 点赞 评论 收藏
分享
点赞 评论 收藏
分享