字节llm大模型实习一面

继续来分享下之前的面经~欢迎友好讨论,信息共享
1.项目相关
2.讲讲设计的初衷,模型结构
3.为什么会想在重排做生成式
4.如果是做生成式召回对模型结构怎么修改
5.召回怎么构造负样本
6.需要热度纠偏吗,减的那个概率和什么有关
7.稀疏 MOE 怎么做的
8.beamsearch 怎么做的
9.大模型了解多少,强化学习了解什么
10.DPO 的全称是什么,公式是什么
11.手撕:计算逆序对数量
全部评论

相关推荐

评论
点赞
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务