字节实习 机器学习 面经 1h

被横向挂了,希望发出来对大家有帮助!
1.拷打项目
2.对强化学习训练有什么了解吗?
3.如果有一个对话任务,没有固定答案,该怎么选RL训练策略
4.讲一讲GRPO的原理,优劣以及后续改进
5.预训练和SFT的loss计算差异?
6.Qwen3相比前代有什么改进?
7.目前LLM领域关注到哪些最新进展?
8.手撕:最长公共子序列
全部评论

相关推荐

远航_随风:学院迂腐自大,无知无能的书记和导员是咱们就业路上的一大障碍
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务