字节大模型算法面经
1.项目介绍
2.训练样本大概多少条
3.为什么会想在重排做生成式
4.如果是做生成式召回应该对模型结构怎么修改
5.有考虑用别的强化学习的方法吗
6.dpo 的公式是什么
7. grpo 了解吗
8.beamsearch 怎么做的
9.大模型了解多少,强化学习了解什么
10.手撕 transformer 并计算 flops 和内存开销
2.训练样本大概多少条
3.为什么会想在重排做生成式
4.如果是做生成式召回应该对模型结构怎么修改
5.有考虑用别的强化学习的方法吗
6.dpo 的公式是什么
7. grpo 了解吗
8.beamsearch 怎么做的
9.大模型了解多少,强化学习了解什么
10.手撕 transformer 并计算 flops 和内存开销
全部评论
bro你这个算是算法岗、还是应用性质的研发岗啊
相关推荐
点赞 评论 收藏
分享
查看22道真题和解析