深信服AI 日常实习二面 挂经
给我面没招了,发点面经攒攒人品~
实习项目拷打
八股如下
1.Attention的计算公式,为什么除以根号dk,能不能换成dk
2.qwenvl的架构是什么,从输入到输出,说一下
3.qwen3.5有哪些提升 优化
4.Attention的时间复杂度是O(n平方),有没有看过哪些方法针对长上下文可以优化的
5.有看过dsk发的论文吗?attention相关的
6.GRPO PPO 目标函数,GRPO相比于PPO有什么区别,优点,以及GRPO的缺点
7.DPO的目标函数,相比于上面俩有什么不同
8.了解GPRO的重要性采样吗
手撕
两个玩家玩抽金币游戏,动态规划,写了状态转移方程和思路,让优化复杂度
实习项目拷打
八股如下
1.Attention的计算公式,为什么除以根号dk,能不能换成dk
2.qwenvl的架构是什么,从输入到输出,说一下
3.qwen3.5有哪些提升 优化
4.Attention的时间复杂度是O(n平方),有没有看过哪些方法针对长上下文可以优化的
5.有看过dsk发的论文吗?attention相关的
6.GRPO PPO 目标函数,GRPO相比于PPO有什么区别,优点,以及GRPO的缺点
7.DPO的目标函数,相比于上面俩有什么不同
8.了解GPRO的重要性采样吗
手撕
两个玩家玩抽金币游戏,动态规划,写了状态转移方程和思路,让优化复杂度
全部评论
相关推荐
查看13道真题和解析 点赞 评论 收藏
分享
