百度算法实习一面

1- 拷打后训练项目
2- 熟悉Verl框架吗?里面数据处理和训练流程逻辑,比如roll-out的生成、奖励函数打分、优势和loss的计算有了解吗
3- GRPO的优势是什么?
4- 拷打实习(agent相关)
5- 有没有研究过大模型上下文的工作,比如推理加速或长上下文扩展?
6- KV Cache的改进?
7- Coding:最长公共子序列
全部评论
GRPO的优势是什么咋回答的
点赞 回复 分享
发布于 02-04 21:06 湖南
你这咋感觉问的好少啊
点赞 回复 分享
发布于 02-04 20:46 陕西
佬面的哪个部门
点赞 回复 分享
发布于 02-04 18:25 北京
看起来有些难啊,算法工程师一般是自学有哪些途径吗?
点赞 回复 分享
发布于 02-04 13:42 北京

相关推荐

评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务