字节大模型算法面经
1.拷打论文、竞赛
2.对强化学习训练有什么了解吗?
3.如果有一个对话任务,没有固定答案,该怎么选RL训练策略
4.讲一讲GRPO的原理,优劣以及后续改进
5.预训练和SFT的loss计算差异?
6.Qwen3相比前代有什么改进?
7.目前LLM领域关注到哪些最新进展?
8.手撕:最长公共子序列
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
2.对强化学习训练有什么了解吗?
3.如果有一个对话任务,没有固定答案,该怎么选RL训练策略
4.讲一讲GRPO的原理,优劣以及后续改进
5.预训练和SFT的loss计算差异?
6.Qwen3相比前代有什么改进?
7.目前LLM领域关注到哪些最新进展?
8.手撕:最长公共子序列
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
查看22道真题和解析 点赞 评论 收藏
分享
点赞 评论 收藏
分享
01-30 10:39
桂林电子科技大学 安卓 点赞 评论 收藏
分享
百度成长空间 584人发布