字节LLM大模型算法实习面经
1.项目介绍
2.训练样本大概多少条
3.为什么会想在重排做生成式
4.如果是做生成式召回应该对模型结构怎么修改
5.有考虑用别的强化学习的方法吗
6.dpo 的公式是什么
7. grpo 了解吗
8.beamsearch 怎么做的
9.大模型了解多少,强化学习了解什么
10.手撕 transformer 并计算 flops 和内存开销
2.训练样本大概多少条
3.为什么会想在重排做生成式
4.如果是做生成式召回应该对模型结构怎么修改
5.有考虑用别的强化学习的方法吗
6.dpo 的公式是什么
7. grpo 了解吗
8.beamsearch 怎么做的
9.大模型了解多少,强化学习了解什么
10.手撕 transformer 并计算 flops 和内存开销
全部评论
相关推荐
查看9道真题和解析