字节算法26校招一面
1.项目相关
2.mmoe的结构是怎么样的?
3.输入特征构建
4.召回阶段了解哪些深度模型?
5.粗排阶段是必要的吗?
6.share bottom 和 mmoe的差别?
7.DIN是什么结构?除了DIN,还有哪些方式?SIM是怎么做的?
8.emb层和mlp层什么区别?
9.双塔模型正负样本怎么选取?选取的规则
10.有没有微调过大模型?微调大模型的方式有哪些?
11.LN和BN的区别?
12.transformer吟唱
13.大模型吟唱
14.开放性问题推荐与大模型的结合
手撕
1.注意力机制
2.两种损失函数
3.搜索旋转排序数组
2.mmoe的结构是怎么样的?
3.输入特征构建
4.召回阶段了解哪些深度模型?
5.粗排阶段是必要的吗?
6.share bottom 和 mmoe的差别?
7.DIN是什么结构?除了DIN,还有哪些方式?SIM是怎么做的?
8.emb层和mlp层什么区别?
9.双塔模型正负样本怎么选取?选取的规则
10.有没有微调过大模型?微调大模型的方式有哪些?
11.LN和BN的区别?
12.transformer吟唱
13.大模型吟唱
14.开放性问题推荐与大模型的结合
手撕
1.注意力机制
2.两种损失函数
3.搜索旋转排序数组
全部评论
相关推荐
点赞 评论 收藏
分享
投票
点赞 评论 收藏
分享
点赞 评论 收藏
分享
