拼多多数据分析师一二面面经,交流

8.18一面 53分钟

远程电话面,是个小哥哥,电话一接通报名身份后就说准备好纸和笔,我们来写一道sql题
1.sql题:
已知一个订单表,有字段【订单号】,【日期】,【下单时间】,【下单金额】,【商品一级类目】,【商品二级类目】
请求最近7天内每一个一级类目下成交总额排名前3的二级类目。说一下思路:
  • 1.先筛时间7天内,datediff(now(),日期)<=7
  • 2.分组group by一级类目
  • 3.sum开窗求每个二级类目销售总金额,sum(下单金额) over(partition by二级类目) as total_amt
  • 4.再用rank(total_amt) over() rk rk in[1,2,3]或order by total_amt 结合Limit 3选前3。

2.自我介绍:介绍了自己做数据分析和挖掘的实习经历和感想。
3.分析和挖掘你更偏向哪个方向?
4.问项目细节
5.缺失值怎么处理?异常值怎么判断?
连续型我答用均值填充,又问离散型怎么弄,想了半天每想到,面试官提示介绍下极大似然估计法,最后说用众数去填充。
异常值看数据分布,均值、标准差,画图,箱线图判断等
6.模型的评价指标有哪些:
accuracy,precision,recall,F1,ROC,AUC
其他方面的评价:模型的稳定性,参数的显著性检验
7.过拟合是什么原因造成的,有哪几个方面?
自己答了模型层面上的,面试官一直问还有吗,最后他回答:从样本层面上有样本不均衡,维度过多,数据样本太少等问题。
8.业务题:
(1)你的一个朋友经营一个网店,以前100个人浏览会有50个人下单,最近客服咨询量提升到200,但下单却下降到40,请你帮她分析原因。
答:先锁定原因,是在咨询到下单过程中,所以可能是页面设计的不合理,支付体验不佳,或者同类商品推荐更具诱惑,考虑商品问题。好像都没回答到他想听到的点,又问还有吗,然后我说也可能是客服的原因,他才接下来第二个问题
(2)你的朋友说最近咨询的人变多了,但是他做的是小本生意,没有能力再去请多一个客服,所以导致自己回复用户速度下降,很多人就走了没有下单,请你帮他想一下解决方案
答:能请多一个人更好,不能的话就看一看哪些时间段成交率比较高,在这些时段提高自己的效率,其他时间段可以稍微放松。或者重点服务信誉高,成交率高的用户。然后面试官又问还有吗,我实在想不到,沉默了一会....后来面试官说可以设置自动回复。
(3)你的朋友按照你的建议去做,生意变好了,他赚钱了,然后他一下子请了5个客服,请你设计指标去考核客服的KPI。
说了一些成交率,回复率,服务态度等,想不到别的啥。

我觉得业务题有点难回答吧,而且看其他面经都是一个或两个不相关的业务题,我这个一环套一环,没电商行业实习经历真的觉得这方面挺缺乏的,希望有小伙伴在底下交流下你们的思路,还有如何积累业务题的经历。

8.20二面 48分钟

1.先自我介绍
2.讲了一个实习的项目,问的提别细,每个细节都问的特别清楚,我做了什么工作,怎么做的,具体实现。
3.做个sql题。意思就是有些人一个人开了好几个小号,你要用ip登录次数识别出来。大家可以讨论下,我没做出来正确方法,但最后问了面试官怎么做


4.有没有用过拼多多,怎么评价砍价活动的广告效果?有哪些指标?
5.有没有想问我的?

二面主要是那个题目有点难,想不到怎么表现共同出现,楼下可以交流讨论一下,还有业务题,一起提高进步!
这两面我都搞不清楚哪个是偏业务面,哪个偏技术,而且面试都约的太急,没什么时间准备,秋招第一个面试的公司,积累经验了!

#拼多多##面经##数据分析师#
全部评论
二面碰到了一样的SQL题,我是用t1 join t2 on t1.ip=t2.ip where t1.uid != t2.uid group by t1.uid, t2.uid having count(*)>=3
点赞 回复
分享
发布于 2019-08-21 00:24
二面的sql看文字和图片描述对不上来,我的理解是只要一个uid有2个以上的ip地址的就把他筛选来
1 回复
分享
发布于 2019-08-21 00:12
阿里巴巴
校招火热招聘中
官网直投
select uid from log where ip in(select ip from log group by uid having count(uid)>1) group by uid having count(ip)>=3;
1 回复
分享
发布于 2020-06-21 14:09
感觉业务题有难度
点赞 回复
分享
发布于 2019-08-21 01:22
一面业务题,对于少根筋的我来说,可能就真的回答是客服的问题还有自动回复了😑
点赞 回复
分享
发布于 2019-08-21 09:10
想问下,第一题为什么要用sum开窗 直接sum(金额) group by 类别1,类别2 这样不可以吗
点赞 回复
分享
发布于 2019-08-22 04:47
今晚上二面,特来看面经😂
点赞 回复
分享
发布于 2019-08-22 09:36
请问一下楼主是投的北京还是上海的呀
点赞 回复
分享
发布于 2019-08-22 17:08
请问楼主有面hr吗
点赞 回复
分享
发布于 2019-09-18 12:02
我认为是通过IP来识别是不是同一个人,uid是注册的时候生成的,所以假如你有三个小号的话,你是有三个uid的但是呢,你登录访问的时候你传过去的机器的IP地址是唯一的,所以我觉得应该是按照IP分组统计uid 的个数,然后把大于3的UID输出
点赞 回复
分享
发布于 2019-09-29 17:44
第一题sql可以这样写吗? select  first_volumn, second_volumn, row_number over (partion by first_volumn,second_volumn order by sum(amount) desc ) as paixu  from order_list where data_diff(now(),datetime)<=7 group by 1,2,3 where paixu<=3
点赞 回复
分享
发布于 2020-06-11 14:44

相关推荐

9 249 评论
分享
牛客网
牛客企业服务