鹅厂 qq音乐+teg数平 数据科学实习
q音(非暑期,已过)
3.10 一面 80min
1. 自我介绍
2. 三道sql题+写完了讲思路 ———— 问oppo数分实习经历———
3. 介绍做策略的例子,追问细节,分析方法
4. 在oppo和字节都主要是写sql么,有什么区别么
5. 异动分析举例。数据溯源方向怎么做,横向拆解方向怎么做
6. AB实验,具体负责哪些,做什么检验
———— 问字节数据研发经历———
7. 在字节具体做什么,负责哪些层级数据的建设
8. 简单讲一下,如果让你来建设数仓,你从底层数据开始怎么设计(就是问分层建模方法)
9. 更喜欢数据分析的工作还是现在数据开发的工作
10. 有没有遇到数据倾斜情况?简述一下原因和解决方法
11. 问了个做的机器学习project,怎么选模型的,调参方法,RF怎么算feature importance
12. 最后问了个业务问题,qq音乐要发优惠券给用户,设计一下分发的策略,以至于收益最高(先答了ROI,再提示我从模型角度出发)
13. 接上,features很多的话,怎么做feature selection?顺便问了问深度学习了解情况
3.14 二面 30min
1. 介绍一下做过的实习/项目,能体现数据分析能力的
2. 一道条件概率计算
3. spark了解情况,job/stage/task关系
4. sql的join区别
5. 数仓分层建模思想,主题域、业务域的划分
6. random forest和xgboost的区别,xgboost的正则处理具体内容
7. 假设检验,一般用到什么检验,样本量如何计算
8. 实验结果不显著怎么办
(过了,无hr面)
——————
TEG 数据平台广告方向
3.14 一面
过了,有空来写
3.23 二面
问了AB实验为什么主要用uv分流而不用pv分流,没想明白,感觉状态一般,估计凉了。
3.24 gg了