回馈牛客 数据分析暑期实习面经
1、阿里
一面
1、介绍一下Hive;一道Hive题(A,B两表,查询B表中没有,A表中有的;关键字段:学号,课程号)
2、反转字符串有哪几种方法
3、数据仓库的ETL怎么做
4、Python用什么包
5、介绍一下词嵌入,one-hot和word2vec的区别,word2vec如何实现的
6、什么是维度建模
7、bagging和boosting的区别
8、Arima介绍,Arima和LSTM
9、如果数据量极大,怎么去定Arima的参数
10、平时怎么学习的
11、平时会读paper么/英文的paper
12、接触Python,Java,Hadoop多久
13、运筹学了解么,动态规划用过么
15、会Linux么,会用Class么
二面
1、自我介绍
2、编程中最喜欢哪门课,说明原因
3、喜欢运筹学么
4、国外交流学习中获得了什么
5、Python用过哪些包
6、有没有读博的打算
7、发过什么论文
8、一道有关集群的运筹优化问题,留了2小时做
三面
1、自我介绍
2、介绍一下项目,你在团队中的作用,有什么结果么?
3、爬虫用的什么包
4、对于Hive,Impala的了解
5、介绍一下OLAP;OLAP的工具
6、对于算法了解么;介绍一下聚类分析有哪几种,之间的区别是什么
HR面
1、自我介绍(从本科到研究生的经历)
2、数据分析的项目
3、职业规划
4、可实习时间
5、对于工作内容的了解
2、腾讯
一面
1、实习经历
2、还知道哪些分类算法 / 介绍一下朴素贝叶斯,朴素贝叶斯的特征独立体现在那个方面?
3、case:如果想要发一张优惠券,发多少面额的优惠券使得达到50w活跃人数的同时成本最低
4、平时做数据分析会用到什么工具
二面
1、实习经历(两个模型)
2、bagging 和boosting的区别
3、一道SQL题(去除重复项)
4、NLP(分词,关系抽取)
5、知道哪些聚类的算法,kmeans的原理,优势,劣势,怎么确定k值
6、roc-auc曲线
7、特征的选择