bigo推荐算法一/二面 面经

一面:
1.lstm原理三个门作用和sigmoid函数tanh使用,梯度消失问题如何解决,rnn为什么不能,缺点如何造成的。lstm如何解决长期记忆问题
2.bert原理和注意力机制介绍一下
3.dssm为什么不能做user和item的交叉,dssm有什么优缺点,item端如何处理语义的
4.召回和排序中有哪些模型,原理都了解吗?fm,deepfm,wide啥的
5.lr特征为什么要离散化
6.auc公式是什么,如何一句话解释auc的含义,数据不平衡对auc有影响吗,还有什么指标可以针对不平衡数据。
7.常用激活函数都有哪些,优缺点
8.时序模型用哪些,各有什么优势,介绍一下
9.商品匹配多模态如何做的(自己的项目)
10.召回后搜索fassi近邻搜索的原理
代码题:最长不重复子串

二面:
1. 针对不平衡样本问题,在通过上采样后,正例:负例的比值由1:10变为2:10,则dnn模型预测的概率会增大多少,若想要当前输出概率和原始期望想同,则需要如何操作
2. dnn如何评估特征有效性和重要性,其他机器学习模型呢,统计方法呢?
3. 如何进行的自创mixup采样操作(问不平衡采样一般的方法)
4. 双塔模型是做什么的,为什么不用热度推荐,相比的话dssm有什么优点
5. 如果遇上一个新item,它的向量该如何计算或者处理,如何解决新user和新item进来的问题(计算相似度,热们物品向量加权填充),特征缺失该怎么办。
6. 手撕:合并k个有序数组 (我只做了合并两个,结果惨了····)
7. 手撕提高版:给定一个由二元组组成的列表,分别代表分数和类别,给定一个k,要求按分数大小输出同时满足类别不能连续k个相同。
输入:[(1,1),(2,2),(3,3),(4,3)],k = 2
输出:[(4,3),(2,2),(3,3),(1,1)]
解释:原始数组排序后必须满足类别不能连续k个一样的条件,因此[(4,3),(3,3),(2,2),(1,1)] -> (4,3),(2,2),(3,3),(1,1)]
个人感受:面试官很好的,但是奈何我太菜,好多东西没准备好,感觉问的问题都很尖锐,是有区分度的那种。

三面:(主管面)
1. 自我介绍
2. 实习经历和项目(主要时间在谈这个)
3. 具体实现和遇见的问题
4. 为什么转型做算法(我是非科班)
5. bigo公司了解吗,我们针对的是海外直播和交友市场
6. 期望地点在哪里
7. 平时有什么爱好
8. 反问:公司的定位以及我所在的部门情况。

HR面:
刚通知。后续继续更新
#BIGO校招##面经##算法工程师#
全部评论
啊 好难
点赞
送花
回复
分享
发布于 2021-09-02 20:34
弱弱问句 老哥收到消息了吗
点赞
送花
回复
分享
发布于 2021-09-03 10:40
秋招专场
校招火热招聘中
官网直投
请问 二面的第一题该如何回答啊!请教!
点赞
送花
回复
分享
发布于 2021-09-04 17:11
请问增大是1/6-1/11吗
点赞
送花
回复
分享
发布于 2021-09-04 18:40
还有一个问题 手撕的第二题是力扣原题嘛!我没见过哎!
点赞
送花
回复
分享
发布于 2021-09-05 22:04
则dnn模型预测的概率会增大多少 这句话啥意思
点赞
送花
回复
分享
发布于 2021-09-06 11:05
请问 有三面的消息了吗
点赞
送花
回复
分享
发布于 2021-09-06 23:27

相关推荐

前两个流程都被结束了,然后被腾讯视频捞了,之前的面经马上到达字数限制了,所以新开一文记录。一面时间:4月17日 16:00 ~ 17:00上来先是做了一下自我介绍然后开始问实习的项目,让详细的讲,期间就夹杂着八股。使用的什么loss函数,除了交叉熵损失函数还了解哪些损失函数。项目过程中有没有遇到过过拟合的问题,什么原因造成的,什么办法解决。为什么L1和L2正则化能够缓解过拟合的问题。项目过程中模型设计方面遇到过什么问题,怎么解决的。什么时候会用softmax,和sigmoid的区别。了解什么召回算法。双塔降维的流程是什么?现在tf比较熟悉了吗。(因为提到上一段实习中最开始不习惯使用tf而是习惯使用pytorch)因为上段实习中讲到了特征降维,面试官问了一个场景题,比如当前情况下我没有任何用户的过往历史数据来进行学习,但我需要进行特征降维,我应该怎么做?后来面试官讲到他们目前遇到这个问题,然后想看我有什么想法,最后讲他们使用的VAE,问我有没有了解过VAE。结束之后做了一个算法题:1120. 子树的最大平均值然后就是反问时间。希望能过吧,三战腾讯了----------4月26日更新二面时间:4月25日 15:00 ~ 16:10主要就是问简历上的项目,然后从项目开始扣八股。介绍一下transformer,位置编码为什么要用三角函数。了解过哪些推荐算法,说了DIN就让简单介绍一下。思考一下如果是短视频推荐当中的序列,应该怎么编码。了解SGD,adam等优化器吗?adam和adagrad各自的优缺点以及适用场景。如果要从头开始做一个预测用户视频观看时长的模型,应该有哪些步骤?如果同时要优化用户的点击率和用户的观看时长,应该怎么做?多任务模型了解过哪些?权重共享是共享哪些部分?实习中用到了降维,因此问了一下了解过其他降维方法如pca没有?没有做算法题,如果过下一面是总监面,不知道结果如何,祈愿----------5月9日更新三面时间:5月8日 14:00 ~ 14:50三面是总监面,自我介绍完了之后针对之前做过的项目深挖了一下细节,然后问如果后续针对项目的算法进行优化会从哪些方面进行考虑,感觉主要看你的思维和解决问题能力。三面结束后第二天约了hr面,在10号
点赞 评论 收藏
转发
5 28 评论
分享
牛客网
牛客企业服务