虾皮AI算法工程师面经

面试体验很好,面试官也很专业。
项目问题
八股:
讲一下GQA、MLA等结构
MLA对Query压缩了么?
什么框架做RL训练的?
DPO对齐方式有用过吗?
介绍DPO的原理?
DPO优化目标介绍
Reference Model需要训练吗?
DPO训练只用DPO对齐阶段的Loss吗?

代码题:
最大乘积子数组
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务