字节算法凉经
标注成本是多少
怎么确保标注的训练集是高质量
验证集的类别分布是什么
问实习项目有什么优化思路
为什么few shot可以提高模型输出表现
FAISS的原理
知识库怎么更新?
为什么不直接用相似度召回?而是过一遍大模型?
PPO和GRPO的区别?
为什么GRPO的kl 在loss中
PPO中每个模型解释
怎么确保标注的训练集是高质量
验证集的类别分布是什么
问实习项目有什么优化思路
为什么few shot可以提高模型输出表现
FAISS的原理
知识库怎么更新?
为什么不直接用相似度召回?而是过一遍大模型?
PPO和GRPO的区别?
为什么GRPO的kl 在loss中
PPO中每个模型解释
全部评论
相关推荐
点赞 评论 收藏
分享
投票
点赞 评论 收藏
分享
查看3道真题和解析