Shopee Ai算法大模型二面 1h

被横向挂了,希望发出来对大家有帮助!
1.实习拷打
2.项目拷打
3.强化学习Policy-based和Value-based的区别
4.强化学习on-policy和off-policy的区别
5.RLHF中的Reward Model怎么实现的
6.手撕:哈希遍历
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 昨天 16:12 广东
考虑我司不 欢迎联系
点赞 回复 分享
发布于 今天 00:10 上海

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务