京东 数据分析 流程走完,分享面经攒人品
部门是***零售,希望有机会给东哥当兄弟呀!
一面:40min
首先是30分钟的笔试,六道大题。
1. Linux基础
2-4, HiveSql
5. MapReduce的步骤和作用
6. 请从以下角度介绍一个你的项目,不用写,口述即可。
面试环节10分钟左右,主要是问简历细节,每一次实习的主要工作,Python和MySQL的使用占比。
最后介绍了一下他们的部门和业务,主要工作是大数据相关的BI。
二面:40min
总体来说就是:我玄学地通过了jd的玄学二面。
1. 自我介绍。
2. 最近的一次实习,你用到了ABtest,你是怎么用的。
2.1 为什么按城市划分,有考虑到不同城市的不同情况吗2.2 回收的结果确定能验证你的结论吗
3. 最近的一次实习,你用到了因子分析和主成分,但是做的是综合评价,这两种方***导致的指标信息损失你怎么处理?
3.1 你的结果得到了评价对象的认同吗,怎么跟他们解释你用到的方法?3.2 如果想要一个不损失信息的办法,你怎么改进3.2 想过用复杂模型训练,去得到更好的结果吗
4. 上一次实习,你提到了数据提取和清洗,讲一下如何提取和如何清洗的。
4.1 提取之后的数据如何储存?4.2 对非结构化数据处理有接触吗4.3 对自然语言和文本处理有接触吗4.4 数据校正的过程中,你用到了几种校验结果的逻辑?4.5 如果你用到了多种逻辑,就比如说是两种吧,请问你是串行还是并行?4.6 如果两种逻辑,一个验证通过,说数据没问题,一个说有问题,你怎么判断?4.7 如果业务人员现在告诉你,两种逻辑对他们来说权重一样,没差别,你怎么判断?
5. 讲一个你最熟悉的项目吧。(讲了最近实习的数据挖掘,关于广告主的)
5.1 你提到你选择了三个方面的指标,第一,你考虑客户自身的属性,请问会考虑到他自身的经营情况吗?(并没有…)5.1.1 给你一点建议,关于客户自身经营情况的数据怎么获取。5.2 第二个方面的指标,客户行为,只考虑他在你们这个平台的行为吗?客户在整个市场的行为是不是也会有影响?5.2.1 继续深入客户的其他行为,会如何影响,怎样获取这些行为数据5.3 第三个方面的指标,详述一下你怎么构建的特征。5.3.1 如果现在让你在这方面构建更多的特征,你会想到哪些(我提到了投资回报率)5.3.2 你提到的指标,比如ROI,属于结果指标,一般增量市场会更多地考虑结果指标,那现在客户面临一个存量市场,更应该关注过程指标,你怎么考虑他的广告效果,可以从你这个投放平台的角度来说,也可以从客户自身的角度来说(这里我说了转化漏斗那些,并且最终还是提到了ROI,23333)5.3.3 解释他为什么关注过程指标,以及他们当前的业务情况。
6. 提问环节
问了我跟这个岗位招聘需求的差距,面试官提了三个方面的建议,有一个是关于过程指标的,另一个是提到应该关注数据本身的价值。
三面:hr面,15min左右
1. 租房,有没有关系好的朋友在北京,会不会一起租房,租在公司附近比较偏能接受吗
2. 在流程中的公司,怎么选择
3. 为什么选择京东
4. 你在选择就业平台的时候,觉得平台能给你提供的哪些东西是重要的,请排序说明
5. 讲一个你性格中的缺点
大概就是这些,hr面记得不太清楚了。
现在状态是面试已完成,hr说9月中旬会出结果,希望好运!