大模型算法日常实习一面-MiniMax
#MiniMax求职进展汇总# 攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.介绍你熟悉的大模型架构
3.为什么 MoE 架构能在参数规模继续扩大的情况下保持训练效率?
4.MoE 的路由机制是怎么工作的?
为什么会出现专家负载不均的问题?
5.如果专家利用率很低,你会怎么优化路由策略?
6.SFT 和 RLHF 在训练目标上有什么本质区别?
为什么很多模型在 SFT 后仍然需要 RLHF?
7.RLHF 中 PPO 的核心优化目标是什么?
写出 PPO 的目标函数,并解释每一项的意义。
8.手撕:实现 滑动窗口最大值
1.项目拷打
2.介绍你熟悉的大模型架构
3.为什么 MoE 架构能在参数规模继续扩大的情况下保持训练效率?
4.MoE 的路由机制是怎么工作的?
为什么会出现专家负载不均的问题?
5.如果专家利用率很低,你会怎么优化路由策略?
6.SFT 和 RLHF 在训练目标上有什么本质区别?
为什么很多模型在 SFT 后仍然需要 RLHF?
7.RLHF 中 PPO 的核心优化目标是什么?
写出 PPO 的目标函数,并解释每一项的意义。
8.手撕:实现 滑动窗口最大值
全部评论

感觉问的似乎不多呀
MiniMax 大模型算法面经太干货了,MoE 相关问题总结得很全!
算法岗一面的这些问题很经典,准备面试的同学可以直接参考!
相关推荐
点赞 评论 收藏
分享
查看11道真题和解析