百度算法实习一面
1- 拷打后训练项目
2- 熟悉Verl框架吗?里面数据处理和训练流程逻辑,比如roll-out的生成、奖励函数打分、优势和loss的计算有了解吗
3- GRPO的优势是什么?
4- 拷打实习(agent相关)
5- 有没有研究过大模型上下文的工作,比如推理加速或长上下文扩展?
6- KV Cache的改进?
7- Coding:最长公共子序列
2- 熟悉Verl框架吗?里面数据处理和训练流程逻辑,比如roll-out的生成、奖励函数打分、优势和loss的计算有了解吗
3- GRPO的优势是什么?
4- 拷打实习(agent相关)
5- 有没有研究过大模型上下文的工作,比如推理加速或长上下文扩展?
6- KV Cache的改进?
7- Coding:最长公共子序列
全部评论
相关推荐
点赞 评论 收藏
分享
01-22 00:31
南京信息工程大学 Java 点赞 评论 收藏
分享

