字节大模型算法面经

1.项目介绍
2.训练样本大概多少条
3.为什么会想在重排做生成式
4.如果是做生成式召回应该对模型结构怎么修改
5.有考虑用别的强化学习的方法吗
6.dpo 的公式是什么
7. grpo 了解吗
8.beamsearch 怎么做的
9.大模型了解多少,强化学习了解什么
10.手撕 transformer 并计算 flops 和内存开销
全部评论
bro你这个算是算法岗、还是应用性质的研发岗啊
点赞 回复 分享
发布于 今天 10:12 美国

相关推荐

评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务