金山数据分析暑期实习面经
部门:海外wps
一面6.13(30min)
- 自我介绍
- 实习详细介绍
- SQL:含有user_id,date的一张表,查询当日沉默用户量(30天内没有活跃)
- SQL:上述基础上查询近180天每天的沉默用户量
- 对自己的职业规划
- 对实习的时间看法(转正或者考虑9月份秋招)
- 反问(问到了海外wps市占,以及工作内容)
下午通知线下二面
二面6.17(30min)
- 自我介绍
- 实习项目介绍
- SQL:id,sex,gmv,每个性别第二高的第三字段(第三个字段记不清了,窗口函数)后续追问rank,dense_rank,rownumber的区别
- SQL:两张表t1(id,create_date)t2(id,buy_date,buy_number)每个id在注册六个月内的最高消费记录
- ABtest:两个样本量为100的实验组,观察比率分别为5%6%,怎么证明是随机现象还是统计显著。(回答用z统计量但是比率型的公式忘了,悲),追问为什么使用z统计量(样本量大于30)
- pandas:怎么查看空值的量,怎么用pandas解决问题3(对不起我的python都还给老师了,悲)
- 为什么决策树不用做归一化以及对于其他算法使用归一化的意义是什么(决策树对量纲不敏感,其他很多算法对于量纲很敏感)
- 开放题:如果发现wps会员续费量降低了,怎么分析(时间维度,用户分层维度,产品功能维度,竞品维度)
- 追问,如果上面的方法都没有找到问题,你会怎么办(办不了?那就凉拌!及时向Leader反应寻求帮助)
- 反问环节:日常工作内容;部门更看重用户增量还是用户留存;会不会对社群的舆情监控反馈(对于新出现的bug什么的);怎么判断一个新版本或者新功能做的好不好,除了看留存和活跃之外(付费率)
大抵是没有后续了,大家不用关注这个了。
#面试问题记录##金山面经##数据分析求职#