搜广推算法岗面经

今天老师给大家梳理了部分大厂搜广推算法岗面试真题,供各位同学参考学习。
1.PPNet的核心思想是什么?为什么要 stop gradient ?什么时候不需要这样操作?
2.多目标模型很容易遇到跷跷板问题或者两个 loss 数量级相差很大,优化速度差异太大,你知道有什么优化方法吗?
3.NEG loss 和 NCE loss 有什么区别? infonce loss 公式是什么
4.召回业务一般怎么定义负样本? bce loss 的公式是什么?简述一下 Pointwise , pairwise 和 listwise 的区别是什么?召回一般用什么 loss ?
5.粗排的作用?怎么验证粗排精排的链路一致性?用什么指标可以衡量链路一致性?
6.大模型了解吗?怎么在推荐中应用?比如怎么在召回中用?大模型训练分成哪几个阶段?简述一下各个阶段在干什么
7.千万级别的整型数组,怎么获取其中出现次数最多的前 N 个数?(考数据结构)8.讲一下你知道的机器学习里面的算法,比如 AdaBoost , GBDT , XGBoost 这些。 Bagging 和 Boosting 的区别?随机森林是什么
9.讲一下Word2vec是怎么做的?怎么降低计算复杂度?
10.你知道的中心极限定理有哪些?
11.双塔模型优势和缺点,怎么改进?
12.粗排的目的是什么?有哪些指标,粗排应该向精排看齐吗?
13.说一下 BN 的公式,哪几个参数是在训练时更新,在推理时还更新吗?简述一下测试过程中的 BN 怎么算。 BN 和 LN 的区别?
14.当神经网络的权重初始化为0时,会遇到什么问题?
15.你能抽象地归纳出序列建模发展的脉络吗?以及它的最终形态应该是什么样子?
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
好难啊,感觉我找算法没希望了
1 回复 分享
发布于 04-27 08:38 陕西

相关推荐

一面(面试官很好!很有耐心!)1.spark中rdd叫弹性分布式数据集,这个弹性的含义2.小文件的危害以及怎么处理3.spark中宽依赖、窄依赖4.stage的划分5.kafka怎么保证数据不重复消费(没回答上,但说了怎么重复消费数据)6.checkpoint机制7.spark的三种join(boardcast join,sort merge join,shuffle hash join)7.四道sql(前两道很简单,第三道次日留存和七日留存,第四道连续登录问题)8.算法题:移动最少区间个数 使得剩余区间无重叠1. 输入:[1,2][2,3][4,6][1,3]2. 输出:13. 解释:移除[1,3]后,剩余区间无重叠(面试后在牛客网看见有人分享这道算法题)一面最后面试官还问我以后的计划,我说打算先实习明年春招边实习边找工作,她居然问我没想留着字节吗(我当然想!)中间有些问题没想起来,耗时1小时40分钟二面(面试官很好!问的都是和数仓相关的,结合我的实习问)1.之前工作都干了什么2.之前实习搭建数仓的结构3.了解事实表吗,了解维度表吗4.怎么和其他人对接的5.你属于风控部门,但主要是构建数仓开发,那有没有和其他数据开发人员交流过6.你只有一段实习吧,那实习前后有什么感悟吗7.为什么要选择数据开发(我说因为之前实习是干数仓的,他说不要因为之前干什么就觉得以后三十年干什么,实习还是丰富点,看看干什么)8.最后反问二面耗时50分钟,感觉面试官对我回答的第七个问题不满意,只是我明年要毕业了,得多来一份垂直的实习建议多复习spark、hive方面的八股文、概念问题,实习生主要负责离线数仓开发
点赞 评论 收藏
分享
评论
2
21
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务