【20210113】京东数科-数据分析实习生面经

面试官人超好!会引导也会给出更好的答案,你有不清楚的地方也会深入解释。
1.自我介绍
2.SQL笔试
2.1按照年月对用户消费数据分组聚合:sum(), group by, year(), month()等日期函数;
2.2按照权重(用户消费金额占该月总金额比重)计算年月平均单价:sum(单价✖金额)/sum(总金额), group by;
2.3求出每个月新增用户数及新增用户的总消费金额:窗口函数对每个用户按登录年月排序row_number() over(partition by ID order by year(), month()), 每月中排序为1的用户消费记录进行分组聚合;
2.4按名称取出总消费金额排名前10的客户及其消费金额:inner join, order by, limit 10;
2.5将登录时间晚于实名时间的数据进行清洗,使用登录时间取代实名时间:case when 实名时间<登录时间 then 登录时间 when 实名时间>=登录时间 then 实名时间 else null end as 实名时间。
3.简历挖掘
3.1数据挖掘项目的思路:数据处理、模型、结果;
3.2所用模型的原理,如何调参,优缺点。
4.反问
#实习##京东数科##数据分析师##面经#
全部评论
lz你好,请问实习生一共几面呀
点赞 回复
分享
发布于 2021-01-13 15:57
请问lz 收到offer了吗
点赞 回复
分享
发布于 2021-01-26 11:26
滴滴
校招火热招聘中
官网直投

相关推荐

#美团暑期[话题]##美团暑期[话题]##美团数据开发#4.8美团数据开发一面,记录一下面经供大家参考,同时积攒人品,希望顺利OC。(25暑期转正实习)面试官人很好,整个面试过程约一小时十五分钟,非常nice,面试官全程视频,也给了我很多建议,受益匪浅,整个过程八股较少,都是穿插项目问八股,感觉面试官一直在从我会的角度深入。具体如下:1.你知道hive的窗口函数吗,窗口函数有哪些,都是干什么用的,知道lag函数吗,做什么的2.平时用Spark的时候关注过内存管理吗(没了解,面试官说可以多看看这个)3.Spark算子类型了解吗,种类和具体的算子案例4.Spark内存管理了解吗,内存管理的机制介绍一下5.Spark&nbsp;sql调优是怎么做的6.使用过scala语言吗,用在什么地方,在编写代码过程中有什么挑战7.spark缓存机制了解吗,有那几个函数(cache、persist)Spark缓存级别有几个,具体内容是什么8.Spark一般用在什么场景,了解Spark图计算的框架吗(这里因为我项目里有一个图计算的项目,就问了一些图计算的内容,比如用到的算法,还有一个中心度算法,可以多了解一下)9.Spark的数据倾斜问题,map-side-join,spark的spill机制,如果内存不够了要怎么办,如果手动设置了某个参数呢(这里具体的参数名忘掉了)10.SQL题,牛客SQL&nbsp;16题,较难,一开始没啥思路,就把那些SQL语句都写上了,包括limit啥的,测试没跑通,刚刚想重新分析一下,面试官说没关系,题比较难,也基本上写出来了,就没让我再继续改了。之后又问了我一些问题,比如base北京能不能来,居住问题,了解美团的业务群吗,中间还问了我一些项目管理的问题,感觉都不像技术面了。整场面试感觉题目答上来百分之95吧,SQL题没做出来有点遗憾,不过感觉好像面试官不是很在意。反问问了一下base,是不是在望京那边,然后问了一下面试官对于大数据学习的一些建议,面试官建议我可以先区分一下大数据的具体内容,比如离线在线、源码开发还是数据仓库等等,然后根据具体的方向学习对应知识。最后总结一句,面试很nice,面试官也很nice,大家都说美团的面试让人感觉很好,现在看来的确如此。分享一下,积点德,希望能顺利二面然后OC
点赞 评论 收藏
转发
6 38 评论
分享
牛客网
牛客企业服务