拼多多暑期推荐算法实习一面(凉凉

面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.实习拷打
2.问我项目里为什么选择DPO
3.强化学习和监督微调有什么不同
4.讲讲DPO算法,beta 的作用是什么
5.你看了这么多强化学习的算法,有什么心得?强化学习是怎么从最开始演变到现在的?
6.讲讲word2vec算法,为什么向量空间中比较接近的token在语义上也是相近的?
7.手撕了一个0/1背包的题
全部评论
看着问的似乎不多
点赞 回复 分享
发布于 04-19 22:45 北京

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务