美团三面
📍面试公司:美团
💻面试岗位:大模型
❓面试问题:
1. dpo怎么写
2. dpo,grpo,ppo怎么比较
3. ppo的模型,哪些在更新
4. 其他lora方法,介绍一下具体是怎么做的
5. lora为什么有效
6. qlora是什么
7. 介绍论文
8. 怎么让强化学习更稳定
9. 量化大模型的方法
10. 手撕 lc 113
🙌面试感想:
这会当上团孝女了,我爱美团,立刻抛弃闪购支持一下
#发面经攒人品##我的秋招日记#
💻面试岗位:大模型
❓面试问题:
1. dpo怎么写
2. dpo,grpo,ppo怎么比较
3. ppo的模型,哪些在更新
4. 其他lora方法,介绍一下具体是怎么做的
5. lora为什么有效
6. qlora是什么
7. 介绍论文
8. 怎么让强化学习更稳定
9. 量化大模型的方法
10. 手撕 lc 113
🙌面试感想:
这会当上团孝女了,我爱美团,立刻抛弃闪购支持一下
#发面经攒人品##我的秋招日记#
全部评论
学术垃圾瑟瑟发抖
让RL更稳定?先稳定下我的心态
有问啥时候出结果吗
相关推荐
点赞 评论 收藏
分享

点赞 评论 收藏
分享