大模型算法实习一面 滴滴
发一下问题给大家参考,攒攒人品!
1.Self-Attention的原理
2.PPODPOGRPO的区别,几个强化学习的损失函数
3.为什么用GRPO而不是SFT
4.都做过什么技术(罗列,没有深挖)
5.自监督学习怎么做
1.Self-Attention的原理
2.PPODPOGRPO的区别,几个强化学习的损失函数
3.为什么用GRPO而不是SFT
4.都做过什么技术(罗列,没有深挖)
5.自监督学习怎么做
全部评论
相关推荐
03-15 23:11
南开大学 Java
牛客91882925...:慢慢来,别给自己那么大压力,天无绝人之路。学习中成长,这背景已经超越绝大多数牛友了。多面几次就好了,我第一次面试前睡都睡不好,不过面试官人还好,进行一会面试就注意力全在题上了。所以跟面试官关系也很大 点赞 评论 收藏
分享
iiooz:别想太多了,面试官如果看不上,就不会约面了,腾讯很少所谓的kpi,有面就说明能力肯定不错,只是每个面试官筛选方式不同,二面甚至只跟你聊生活的都有,鹅还是很开放的在筛选人这一块 点赞 评论 收藏
分享
查看11道真题和解析