高德机器学习算法二面-日常实习
1.项目的拷打与反问,比一面要刁钻一些
2.问了GRPO和DPO的公式,后者没答出来
3.问了DRPO,为什么可以把散度去掉,没答上来
4.为什么要重要性采样
5.讲一下注意力机制,交叉注意力,为什么除以根号d
6.介绍一下什么情况下会出现梯度爆炸和梯度消失,为什么,出现了这种情况模型会怎么样
7.反问
2.问了GRPO和DPO的公式,后者没答出来
3.问了DRPO,为什么可以把散度去掉,没答上来
4.为什么要重要性采样
5.讲一下注意力机制,交叉注意力,为什么除以根号d
6.介绍一下什么情况下会出现梯度爆炸和梯度消失,为什么,出现了这种情况模型会怎么样
7.反问
全部评论
感觉问的不多啊
一共就二面技术吧
感觉还顺利吗?
相关推荐
查看10道真题和解析 点赞 评论 收藏
分享

