深信服AI算法实习二面-攒人品
1.项目拷打为主
2.介绍各个模块的优化思路
3.为什么用grpo,你们对grpo做了哪些改进
4.DPO和GRPO分别适用于什么场景
5.介绍MOE架构及其强化学习方式
6.详细介绍项目中的意图理解怎么做的
7.对深信服有什么了解
8.对工作地点有什么要求
9.智力题:100级台阶,4个玻璃球,假设从某一层开始,丢下玻璃球会摔碎(高于该层都会碎,低于该层都不会碎),最少需要扔几次才能确定这个临界楼层
2.介绍各个模块的优化思路
3.为什么用grpo,你们对grpo做了哪些改进
4.DPO和GRPO分别适用于什么场景
5.介绍MOE架构及其强化学习方式
6.详细介绍项目中的意图理解怎么做的
7.对深信服有什么了解
8.对工作地点有什么要求
9.智力题:100级台阶,4个玻璃球,假设从某一层开始,丢下玻璃球会摔碎(高于该层都会碎,低于该层都不会碎),最少需要扔几次才能确定这个临界楼层
全部评论
相关推荐
OPPO公司福利 1112人发布
查看14道真题和解析