字节大模型算法实习一面面经
1.项目拷打
2.GRPO有什么改进
3.GRPO里面KL散度怎么计算的
4.手撕:最长子串长度
第一次面试,非常紧张,脑子里面直接成一团浆糊,已寄
2.GRPO有什么改进
3.GRPO里面KL散度怎么计算的
4.手撕:最长子串长度
第一次面试,非常紧张,脑子里面直接成一团浆糊,已寄
全部评论
一个是rl的,一个是大模型的,
主包请问你准备的什么项目呀
相关推荐
查看26道真题和解析 点赞 评论 收藏
分享
相关推荐
查看26道真题和解析