字节广告算法秋招一面面经
实习和项目
1.实习里粗排的融合公式里有哪些目标
2.拆成多个模型还是一个多目标模型
3.多任务模型有什么好处
4.粗排负样本怎么设计
5.相比 ReLU,Swish 有什么优点
6.GeLU 和 Swish 的关系是否了解
7.梯度消失或爆炸的原因和解决方法
8.BatchNorm 和LayerNorm的区别及适用场景
9.List-wise的损失函数形式是什么样子的
10.讲讲NDCG 的公式
11.ItemCF的i2i矩阵如何构建
12.DIN 和 Transformer 的 attention 有什么不同
概率题
1.每次射击独立,命中率15%,求首次命中时总射击次数的期望
coding
leetcode 124. 二叉树中的最大路径和(hot100 困难题)
反问
1.实习里粗排的融合公式里有哪些目标
2.拆成多个模型还是一个多目标模型
3.多任务模型有什么好处
4.粗排负样本怎么设计
5.相比 ReLU,Swish 有什么优点
6.GeLU 和 Swish 的关系是否了解
7.梯度消失或爆炸的原因和解决方法
8.BatchNorm 和LayerNorm的区别及适用场景
9.List-wise的损失函数形式是什么样子的
10.讲讲NDCG 的公式
11.ItemCF的i2i矩阵如何构建
12.DIN 和 Transformer 的 attention 有什么不同
概率题
1.每次射击独立,命中率15%,求首次命中时总射击次数的期望
coding
leetcode 124. 二叉树中的最大路径和(hot100 困难题)
反问
全部评论
相关推荐
点赞 评论 收藏
分享
破防了的哈里很讲原则:咱们两的情况差不太多,我是大一寒假开始学的java,大二下的时候技术栈也学得差不多了,按道理讲应该去找实习了,但我害怕面试,害怕在面试官前出糗,所以不断得麻痹自己,告诉自己八股还没背熟,项目还没理解,所以投不了。然后又染上了酸角洲,沉迷其中,直到最近才开始投。 点赞 评论 收藏
分享
11-14 16:03
西北政法大学 新媒体运营 点赞 评论 收藏
分享
查看14道真题和解析