美团大模型算法秋招一面
📍面试公司:美团
🕐面试时间:25.09.09
💻面试岗位:大模型应用算法工程师
❓面试问题:
1. PPO、DPO、GRPO分别是什么?为什么你选择GRPO?
2. Flashattention的原理(原理答出来了,但面试官说还做了一个softmax的优化,使得可以让分块的qkv计算结果聚合,这点没答出来)
3. 分布式训练的一些方法?deepspeed支持哪些分布式训练?zero1,zero2,zero3的区别?
4. LLM训练中有哪些学习率和batch设置的经验trick?
算法:最长递增子序列
🙌面试感想:还挺简单的,不难
#发面经攒人品#
🕐面试时间:25.09.09
💻面试岗位:大模型应用算法工程师
❓面试问题:
1. PPO、DPO、GRPO分别是什么?为什么你选择GRPO?
2. Flashattention的原理(原理答出来了,但面试官说还做了一个softmax的优化,使得可以让分块的qkv计算结果聚合,这点没答出来)
3. 分布式训练的一些方法?deepspeed支持哪些分布式训练?zero1,zero2,zero3的区别?
4. LLM训练中有哪些学习率和batch设置的经验trick?
算法:最长递增子序列
🙌面试感想:还挺简单的,不难
#发面经攒人品#
全部评论
相关推荐

点赞 评论 收藏
分享