深信服AI算法实习二面-攒人品

1.项目拷打为主
2.介绍各个模块的优化思路
3.为什么用grpo,你们对grpo做了哪些改进
4.DPO和GRPO分别适用于什么场景
5.介绍MOE架构及其强化学习方式
6.详细介绍项目中的意图理解怎么做的
7.对深信服有什么了解
8.对工作地点有什么要求
9.智力题:100级台阶,4个玻璃球,假设从某一层开始,丢下玻璃球会摔碎(高于该层都会碎,低于该层都不会碎),最少需要扔几次才能确定这个临界楼层
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务