机器学习算法岗秋招面试总结

面试已完成:

百度、滴滴、平安智慧城、陌陌、网易互娱、有赞、富途证券、vivo、盛大游戏、广发卡、中信卡、招行深分、锐捷、网宿、步步高

面试情况:

Bigo一面凉

欢聚时代一面凉

美团二面凉

招商银行信用卡中心一面凉

虎牙一面凉(不招机器学习算法岗)

招银网络科技一面凉

小米一面凉

蘑菇街一面凉

中国电信云一面凉

头条一面凉(手推XGBoost,代码实现字符串的编解码(有没有优化方法))

星环科技二面凉

交通银行总行一面凉(不招非计算机专业的)

还有十余家公司放弃面试了
只零零散散记录了一些面经,供学弟学妹们参考~

斗鱼直播

1.   LSTM和Textcnn的区别,分别适用于什么场合

2.   Fasttext和Textcnn的区别,分别使用于什么场合

3.   画出Fasttext、Textcnn的结构图

4.   讲下Attention机制

5.   多分类的损失函数叫什么?把具体形式写出来

6.   Tensorflow中scope的作用

7.   讲下Bert

8.   除了词向量、tf-idf,还可以用什么作为文本分类的输入特征

9.   句向量怎么训练的?除了DW还有什么

10.  知道霍夫曼树吗?霍夫曼树是怎么实现的

11.  讲下命名实体识别怎么做?

12.  讲下条件随机场

13.  讲下隐马尔科夫,用代码实现一下

14.  现在有一个场景,让你把一些文本中的“游戏专有名词”提取出来,该怎么做?完整流程

15.  现在有一个任务,要判断文本中是否包含***、恶意评论,怎么做?训练样本如何获得?

16.  讲下CTR怎么做的?用了哪些方法


滴滴

1.      xgboost和lgb区别,除了histogram

2.      xgboost如何处理缺失值

3.      xgboost和gdbt区别

4.      xgboost用二阶泰勒展开的好处

5.      textcnn

6.      进程和线程

7.      数据不平衡问题怎么解决

8.      过拟合怎么办

9.      Xgboost正则项的作用

10.    Attention原理

11.    Lstm为什么能解决梯度消失的问题

12.    Bagging为什么有较低的方差,Bossting为什么偏差较小

13.    Attention有什么缺点


虎牙

1.      Batchnomalizition的作用

2.      推导梯度下降

3.      Linux常用命令

4.      Attention原理

5.      Mapreduce怎么用的

6.      Python如何释放对象的

7.      快排的时间复杂度、二分法的时间复杂度

8.      进程和线程

9.      数据不平衡怎么处理

10.  野指针是什么

11.  线程死锁出现的原因


星环科技

1.      进程和线程的区别

2.      Xgboost如何处理缺失值

3.      Xgboost和gdbt区别

4.      Python多线程如何使用

5.      Python哪些函数用到了迭代器

6.      Xgboost并行化体现在哪


二面

1.    数学建模竞赛(目标函数怎么写的,怎么求解的,为什么能用这种方式求解)

2.    讲下模拟退火算法和贪婪算法

3.    随机森林和gdbt的区别

4.    随机森林为什么采用有放回的方式采样?为什么能降低方差?

5.    讲下Bootstrap抽样

6.    LR采用什么方式抽样?有放回还是无放回?为什么?

7.    LR损失函数推导,为什么能这样构造?这个损失函数代表的含义

8.    假设有正负两类样本,用LR去划分有什么缺陷?

9.    LR和SVM比较

10.  L1和L2正则项的区别

11.  对于线性模型,若初始化不同的w和b,加入L1和L2中的哪个正则项可以使得预测值更加稳定,为什么

12.  讲下图计算,深度优先和广度优先比较

13.  几个深度学习模型的原理(lstm、textcnn)

14.  撕代码(用深度优先)dict中查看某个值在不在key的value内


盛大游戏

1.    讲下实习经历

2.    讲下数据挖掘的整个流程是怎样的

3.    怎么判断模型是否过拟合或者欠拟合

4.    过拟合或者欠拟合了怎么办

5.    Xgboost一般调哪些参数

6.    讲下stacking

7.    讲下随机森林

8.    为什么深度学习会出现梯度消失的现象?sigmoid和relu的比较

9.    文本分类比赛模型融合的方式


百度

一面:

1.    自我介绍

2.    讲下实习,提出疑问

3.    讲下Mapreduce怎么用的?reduce用什么语言写的

4.    用Shell实现:一个文件中每一行包含一个ip地址,可能会有重复,找出ip地址最多的前10个

5.    用Shell实现:两个文件,其中一个文件包含两列(name和class),第二个文件包含两列(name和score),将两个文件按列合并

6.    讲下“达观杯”文本分类比赛

7.    讲下XGBoost

8.    XGBoost和LightGBM有什么区别

9.    XGBoost为什么用树作为基学习器

10.  集成学习中除了Boosting和Bagging还有什么模型?

11.  讲下Stacking

12.  讲下数据增强有哪些方法

13.  NLP领域的数据增强方法有哪些

14.  在机器学习中对于连续性特征会有哪些操作

15.  将连续型特征离散化的作用/好处是什么

16.  归一化方法有哪些,具体怎么描述

17.  特征归一化的作用

18.  讲下一个完整的机器学习项目需要做哪些工作

19.  讲下特征工程具体要做哪些工作

20.  讲下Textcnn,Textcnn的卷积核是一维还是二维的

21.  画出LSTM的结构图

22.  LSTM中有哪些激活函数

23.  LSTM这两个激活函数的作用分别是什么

24.  讲下Attention的原理

25.  代码题:判断二叉树B是不是A的子树


二面:

1.    自我介绍

2.    从模型的角度讲下文本分类的发展史

3.    Textcnn和LSTM模型比较

4.    LSTM训练时长是多少,训练的效果和Textcnn比较如何?F1-score差距多少百分点

5.    池化层的作用

6.    写出Sigmoid、Sigmoid的导数

7.    写出LR的损失函数

8.    SVM和LR比较

9.    词向量有哪些训练方式(skip-gram、cbow、glove、fasttext等),这些方式之间的比较

10.  用Skip-gram训练词向量在什么场合比较适用?(答到样本分布不均衡时,skip-gram可以采用负采样、层次softmax解决)

11.  有没有尝试在构建词向量后用传统的机器学习模型去训练?

12.  讲下bert

13.  比较下RNN和传统的机器学习模型

14.  实验室方向是什么

15.  写出tf-idf的公式

16.  代码题:有一个文件每一行包含一个文本,代码实现计算这个文本中每个词的tf-idf的值


三面:

1.    代码题:不用pandas实现merge按列合并两个txt文件,第一文件的第一行是name和class,第二个文件的第一行是name和score,可能包含缺失值,并且第二个文件中的name可能在第一个文件中不存在(文件很大,不开辟内存能做吗?有没有时间复杂度更低的方法)

2.    代码题:有一个文件,包含两列,第一列是name,第二列是money,接下来的每一行代表某个用户存进一笔钱,一个用户可能会存多次钱,计算每个用户总共存了多少钱,输出到一个新的文件,不能用dict,时间复杂度尽可能低。

3.    期望题:有很多很多球,红球:黑球=1:1,每次取一个球,若取到的是黑球则继续取球,若取到的是红球则停止,求取球次数的期望

4.    讲下决策树,熵是什么意思,写出熵的计算公式

5.    接下来是性格测试题(大学/研究生期间觉得最难的一门课,怎么学的?遇到的最大的挫折、最有成就感的一件事、大学期间有什么事是自己最遗憾的,和室友争执时怎么解决、对加班的看法)


#算法工程师##滴滴##虎牙直播##百度##校招#
全部评论
offer收割机八
点赞 回复
分享
发布于 2019-10-21 22:13
是我见过最稳的男人
点赞 回复
分享
发布于 2019-10-21 22:16
小红书
校招火热招聘中
官网直投
这也太强了吧
点赞 回复
分享
发布于 2019-10-21 23:04
招行深分技术面已完成了?问的什么内容呢
点赞 回复
分享
发布于 2019-10-22 15:53
请问百度地图部门,三面结束之后,大概什么时间给结果?我昨天刚去面的。
点赞 回复
分享
发布于 2019-10-22 16:13
讲bert太过分了吧
点赞 回复
分享
发布于 2019-11-24 09:50
楼主,请问下招行信用卡面试问啥呀
点赞 回复
分享
发布于 2020-04-12 15:43

相关推荐

13 156 评论
分享
牛客网
牛客企业服务