字节算法凉经

标注成本是多少
怎么确保标注的训练集是高质量
验证集的类别分布是什么
问实习项目有什么优化思路
为什么few shot可以提高模型输出表现
FAISS的原理
知识库怎么更新?
为什么不直接用相似度召回?而是过一遍大模型?
PPO和GRPO的区别?
为什么GRPO的kl 在loss中
PPO中每个模型解释
全部评论

相关推荐

10-31 10:18
东南大学 Java
投递中兴通讯等公司10个岗位
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务