6.18 美团到餐供给算法-大模型方向实习生(1h)
1.自我介绍
2.介绍项目
3.强化学习DPO,PPO,GRPO的损失函数区别
4.手撕单词拼接
2.介绍项目
3.强化学习DPO,PPO,GRPO的损失函数区别
4.手撕单词拼接
全部评论
相关推荐

点赞 评论 收藏
分享
07-08 18:55
中山大学 算法工程师 点赞 评论 收藏
分享
PHI_517:西浦大团建了说是 xjtlu upup

点赞 评论 收藏
分享