字节大模型算法面经

1.拷打论文、竞赛
2.对强化学习训练有什么了解吗?
3.如果有一个对话任务,没有固定答案,该怎么选RL训练策略
4.讲一讲GRPO的原理,优劣以及后续改进
5.预训练和SFT的loss计算差异?
6.Qwen3相比前代有什么改进?
7.目前LLM领域关注到哪些最新进展?
8.手撕:最长公共子序列
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

评论
3
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务