同程艺龙 数据挖掘(base北京) 一面面经
形式:视频面,30min左右
时间:29号下午14:30
主要是统计学,机器学习,Python和项目四个板块,顺序不记得了,印象中的问题如下:
1. p值的含义
2. 怎么检验一个数据是否服从标准正态分布
3. 卡方检验和t检验
4. 讲一下有哪些分类算法
5. 用梯度下降求解逻辑回归会出现局部最优解吗?梯度下降求解凸函数会出现局部最优吗?
6. 讲一下有哪几种梯度下降
7. SVM可以输出分类概率吗?
8. GBDT的原理
9. GBDT和xgboost的区别
10. 讲一下有哪些聚类算法
11. K-means怎么确定K值,怎么确定初始中心点
12. 如果给你一堆数据,有几百万个特征,你怎么做特征筛选
13. 说说Python吧,深拷贝和浅拷贝的区别是什么,给了代码问每一次输出的结果。
14. Python的list效率更高,还是numpy的ndarray效率更高?
15. pandas怎么对数据框进行行列转置
16. 说说项目,项目A为什么选择了这个模型?每个模型最后结果如何?
17. 介绍一下项目B。
2. 怎么检验一个数据是否服从标准正态分布
3. 卡方检验和t检验
4. 讲一下有哪些分类算法
5. 用梯度下降求解逻辑回归会出现局部最优解吗?梯度下降求解凸函数会出现局部最优吗?
6. 讲一下有哪几种梯度下降
7. SVM可以输出分类概率吗?
8. GBDT的原理
9. GBDT和xgboost的区别
10. 讲一下有哪些聚类算法
11. K-means怎么确定K值,怎么确定初始中心点
12. 如果给你一堆数据,有几百万个特征,你怎么做特征筛选
13. 说说Python吧,深拷贝和浅拷贝的区别是什么,给了代码问每一次输出的结果。
14. Python的list效率更高,还是numpy的ndarray效率更高?
15. pandas怎么对数据框进行行列转置
16. 说说项目,项目A为什么选择了这个模型?每个模型最后结果如何?
17. 介绍一下项目B。
18. 提问环节。
以上大概有1/3没答出来或者答错了,凉凉。
总的来说,看重基础,实习和项目问的比较少。
面试官小哥哥非常nice,一直在引导,卡壳的地方会换一种提问形式,说错的地方会帮助纠正过来,中间因为语音噪音问题,需要小哥端着手机面试,小哥就端了二十多分钟,真是辛苦了
小哥最后也给了一些建议,说工程能力需要加强,而且实习跟项目涉及的范围比较广,需要增加深度。
小哥真的人很好啊!
哎,菜是原罪,好好复习吧!
#同程旅行##面经##秋招##数据挖掘#