携程大数据分析岗面经(一面+二面)
rt,携程大数据分析的面经,来攒个rp
一面:
坐标上海,8.29上周四在现场一面,大教室好多人,一人一个桌子。
实习方面:
- 自我介绍,实习项目介绍(个人/team,负责部分)
- 怎么做的数据清洗,缺失值、脏数据等等
- 训练集维数大吗,用的集群还是单机,用过什么集群平台;了解Spark吗
- 如果让你用Python来做你的清洗工作,你能Handle吗
Machine Learning:
- 你有自己用过别的模型然后调参之类的吗?能说一下基本的调参流程吗?XGB知道吗,以XGB为例子说一下调参流程吧
- XGB和GBDT的区别有哪些?
- 知道SVM吗?核函数是什么,干嘛的
- RF每棵树之间有什么关系吗?每棵树是怎么选择特征优先进行分裂的?subfeature的经验值通常是多少?
- 线性回归,画了一个图,问怎么用回归拟合(对数变换)。然后问怎么确定这个阶是对数还是别的?(蒙了个box-cox好像对了)
Python:
- 用py2还是py3,给一个list怎么去重
- 给两个list,怎么用一行代码生成一个dict(让你用列表生成式)
- pandas对DataFrame的每一行调用一个函数怎么做?想要根据index删除行怎么做?
Deep Learning
问你懂不懂深度学习,我说我知道dnn和cnn,然后就问我cnn有哪些层,卷积和池化的作用分别是什么,没了= =
数理统计
这个就问了数理统计里最重要的两个定理是什么(大数定律和CLT),然后让你简述一下。
Hive:
因为我实习的时候写HQL比较多,就问我有没有什么优化查询语句的经验(随便扯了几个,count distinct,semi join什么的)。还有partition和bucket的区别
业务场景
面试最后问了一个业务场景题:一个用户订了一个酒店,现在要给她推荐旅游景点,从数据的角度你需要获取哪些信息呢?
一面总结:大概就面了30多分钟,总的来说感觉面的都是比较碎的基础知识,没有现场写代码或者写sql之类的,最后面试结束还主动和我握了个手233。希望能进到二面吧。。
二面:
一面结束后第二天傍晚就接到电话,约第二轮电话面试时间,定的是今天上午11点。电话接通是个女面试官,一开始让你自我介绍,然后说一下做过的数据分析项目,(听到这里我以为是HR面,后面发现并不是。。)简单的说了一下之后也没太深究,然后开始介绍部门做的是什么,说了一堆名词其实我也没太听懂(我好菜。。大概好像就是酒店定价方面的)
然后她问我会不会Java(不会),学没学过多目标优化算法(没学过..),会不会pyspark(会),会不会scala(不会..),知道Hive吗(用过,会写hql)等等。接着问我有没有想问她的.
然后问我能不能来实习,说实习可以让我看看对工作感不感兴趣什么的,我说可以来但是手头还在实习,不能立马来。接下来大概是问了些简历问题吧:
- 为什么想做数据分析方向
- 你的职业规划是什么
- 概率论学的怎么样,说一下Naive Bayes的原理
- Machine Learning学了多久,会推导公式吗,说一下LR的推导
到这里没了,最后说可能还会有一轮面试,等电话通知。。感觉有点凉,希望能抬我一手吧555,到现在就进了2次面试,第一次到二面,上岸太困难(菜的真实)
#携程##面经##数据分析师##校招#