字节广告算法秋招一面面经
实习和项目
1.实习里粗排的融合公式里有哪些目标
2.拆成多个模型还是一个多目标模型
3.多任务模型有什么好处
4.粗排负样本怎么设计
5.相比 ReLU,Swish 有什么优点
6.GeLU 和 Swish 的关系是否了解
7.梯度消失或爆炸的原因和解决方法
8.BatchNorm 和LayerNorm的区别及适用场景
9.List-wise的损失函数形式是什么样子的
10.讲讲NDCG 的公式
11.ItemCF的i2i矩阵如何构建
12.DIN 和 Transformer 的 attention 有什么不同
概率题
1.每次射击独立,命中率15%,求首次命中时总射击次数的期望
coding
leetcode 124. 二叉树中的最大路径和(hot100 困难题)
反问
1.实习里粗排的融合公式里有哪些目标
2.拆成多个模型还是一个多目标模型
3.多任务模型有什么好处
4.粗排负样本怎么设计
5.相比 ReLU,Swish 有什么优点
6.GeLU 和 Swish 的关系是否了解
7.梯度消失或爆炸的原因和解决方法
8.BatchNorm 和LayerNorm的区别及适用场景
9.List-wise的损失函数形式是什么样子的
10.讲讲NDCG 的公式
11.ItemCF的i2i矩阵如何构建
12.DIN 和 Transformer 的 attention 有什么不同
概率题
1.每次射击独立,命中率15%,求首次命中时总射击次数的期望
coding
leetcode 124. 二叉树中的最大路径和(hot100 困难题)
反问
全部评论
相关推荐
12-04 17:55
中央民族大学 Java 点赞 评论 收藏
分享
查看13道真题和解析