拼多多数据分析师一二面面经,交流
8.18一面 53分钟:
远程电话面,是个小哥哥,电话一接通报名身份后就说准备好纸和笔,我们来写一道sql题1.sql题:
已知一个订单表,有字段【订单号】,【日期】,【下单时间】,【下单金额】,【商品一级类目】,【商品二级类目】
请求最近7天内每一个一级类目下成交总额排名前3的二级类目。说一下思路:
- 1.先筛时间7天内,datediff(now(),日期)<=7
- 2.分组group by一级类目
- 3.sum开窗求每个二级类目销售总金额,sum(下单金额) over(partition by二级类目) as total_amt
- 4.再用rank(total_amt) over() rk rk in[1,2,3]或order by total_amt 结合Limit 3选前3。
2.自我介绍:介绍了自己做数据分析和挖掘的实习经历和感想。
3.分析和挖掘你更偏向哪个方向?
4.问项目细节
5.缺失值怎么处理?异常值怎么判断?
连续型我答用均值填充,又问离散型怎么弄,想了半天每想到,面试官提示介绍下极大似然估计法,最后说用众数去填充。
异常值看数据分布,均值、标准差,画图,箱线图判断等
6.模型的评价指标有哪些:
accuracy,precision,recall,F1,ROC,AUC
其他方面的评价:模型的稳定性,参数的显著性检验7.过拟合是什么原因造成的,有哪几个方面?
自己答了模型层面上的,面试官一直问还有吗,最后他回答:从样本层面上有样本不均衡,维度过多,数据样本太少等问题。
8.业务题:
(1)你的一个朋友经营一个网店,以前100个人浏览会有50个人下单,最近客服咨询量提升到200,但下单却下降到40,请你帮她分析原因。
答:先锁定原因,是在咨询到下单过程中,所以可能是页面设计的不合理,支付体验不佳,或者同类商品推荐更具诱惑,考虑商品问题。好像都没回答到他想听到的点,又问还有吗,然后我说也可能是客服的原因,他才接下来第二个问题
(2)你的朋友说最近咨询的人变多了,但是他做的是小本生意,没有能力再去请多一个客服,所以导致自己回复用户速度下降,很多人就走了没有下单,请你帮他想一下解决方案
答:能请多一个人更好,不能的话就看一看哪些时间段成交率比较高,在这些时段提高自己的效率,其他时间段可以稍微放松。或者重点服务信誉高,成交率高的用户。然后面试官又问还有吗,我实在想不到,沉默了一会....后来面试官说可以设置自动回复。
(3)你的朋友按照你的建议去做,生意变好了,他赚钱了,然后他一下子请了5个客服,请你设计指标去考核客服的KPI。
说了一些成交率,回复率,服务态度等,想不到别的啥。
我觉得业务题有点难回答吧,而且看其他面经都是一个或两个不相关的业务题,我这个一环套一环,没电商行业实习经历真的觉得这方面挺缺乏的,希望有小伙伴在底下交流下你们的思路,还有如何积累业务题的经历。
8.20二面 48分钟
1.先自我介绍2.讲了一个实习的项目,问的提别细,每个细节都问的特别清楚,我做了什么工作,怎么做的,具体实现。
3.做个sql题。意思就是有些人一个人开了好几个小号,你要用ip登录次数识别出来。大家可以讨论下,我没做出来正确方法,但最后问了面试官怎么做
4.有没有用过拼多多,怎么评价砍价活动的广告效果?有哪些指标?
5.有没有想问我的?
二面主要是那个题目有点难,想不到怎么表现共同出现,楼下可以交流讨论一下,还有业务题,一起提高进步!
这两面我都搞不清楚哪个是偏业务面,哪个偏技术,而且面试都约的太急,没什么时间准备,秋招第一个面试的公司,积累经验了!