拼多多暑期推荐算法实习一面(凉凉
面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.实习拷打
2.问我项目里为什么选择DPO
3.强化学习和监督微调有什么不同
4.讲讲DPO算法,beta 的作用是什么
5.你看了这么多强化学习的算法,有什么心得?强化学习是怎么从最开始演变到现在的?
6.讲讲word2vec算法,为什么向量空间中比较接近的token在语义上也是相近的?
7.手撕了一个0/1背包的题
1.实习拷打
2.问我项目里为什么选择DPO
3.强化学习和监督微调有什么不同
4.讲讲DPO算法,beta 的作用是什么
5.你看了这么多强化学习的算法,有什么心得?强化学习是怎么从最开始演变到现在的?
6.讲讲word2vec算法,为什么向量空间中比较接近的token在语义上也是相近的?
7.手撕了一个0/1背包的题
全部评论
相关推荐
爱读书的小师弟很失落:继续找吧,别灰心,一般你这种学历,基础不太差最后都能找到的。 官网不能再投的,多在boss上捞捞 点赞 评论 收藏
分享
查看6道真题和解析