字节大模型算法实习二面 55min

整体面试还是不错的,但是没后续了,,,
1.项目介绍
2.训练样本大概多少条
3.为什么会想在重排做生成式
4.如果是做生成式召回应该对模型结构怎么修改
5.有考虑用别的强化学习的方法吗
6.dpo 的公式是什么
7. grpo 了解吗
8.beamsearch 怎么做的
9.大模型了解多少,强化学习了解什么
10.手撕 transformer 并计算 flops 和内存开销
全部评论
重排为啥生成
点赞 回复 分享
发布于 03-04 11:22 北京
手撕 transformer 并计算 flops 和内存开销,是直接在自己本地IDE来写嘛?
点赞 回复 分享
发布于 02-13 16:27 山东

相关推荐

评论
点赞
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务