腾讯云大模型暑期实习算法一面分享

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.kl散度怎么计算
2.ppo和grpo区别
3.grpo dapo gspo区别
4.rl的超参怎么设置的
5.向量模型怎么训练
6.有看过相关技术报告吗
7.训练看哪些指标,看loss吗
8.对比训练损失函数
代码:leetcode120
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务