腾讯云大模型暑期实习算法一面分享
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.kl散度怎么计算
2.ppo和grpo区别
3.grpo dapo gspo区别
4.rl的超参怎么设置的
5.向量模型怎么训练
6.有看过相关技术报告吗
7.训练看哪些指标,看loss吗
8.对比训练损失函数
代码:leetcode120
1.kl散度怎么计算
2.ppo和grpo区别
3.grpo dapo gspo区别
4.rl的超参怎么设置的
5.向量模型怎么训练
6.有看过相关技术报告吗
7.训练看哪些指标,看loss吗
8.对比训练损失函数
代码:leetcode120
全部评论
相关推荐
查看12道真题和解析