顺丰大数据挖掘与分析暑期实习面经

一面:

  • 自我介绍
  • 从实习出发提问:
    • 说一说你实习过程中使用 hive sql 的一些心得
    • 你处理字符串字段的时候会使用到哪些函数?需要匹配特定模式字符串可以使用哪些函数?
    • 你刚刚说到的把太多数据分到一个服务器上处理导致运行太慢是什么现象?(数据倾斜)
    • 当两个表相连接,出现数据倾斜,你怎么处理?如果是两个大表连接出现数据倾斜又能怎么处理?
  • 从数据挖掘角度出发:
    • 用通俗的语言解释一下 bagging 和 boosting
    • 假设现在我们想根据公司以前的快递数据训练一个模型用来预测公司以后每个月的快递量,并且向公司提供这项服务,在公司的相关属性数据可以获得的情况下,你会怎么选择模型?
  • 从业务角度出发:
    • 知道 gmv 是什么吗?
    • 假设现在想判断一个市场是不是优势市场,你可以怎么办?(当时也不懂优势市场是什么,反问请面试官解释了一下才回答)

二面(hr面):

  • 实习经历、个人性格、兴趣爱好、家庭情况等常规问题
#顺丰科技##数据挖掘##春招##实习#
全部评论
老哥一面完多久发的二面啊😭
1 回复
分享
发布于 2021-06-11 22:58
面试官问了我数仓我说不会😂也给我过了一面
点赞 回复
分享
发布于 2021-06-11 20:44
百信银行
校招火热招聘中
官网直投

相关推荐

面试只接受线下,位置在望京的五八集团总部,位置还挺偏的,地铁不能直达,得转公交。    第一轮面试是和产品进行了一下沟通,先是就经历做了一个简述,然后面试官重点就过往经历进行了一些提问,包括技术工具也问了一些,也问到了简历里写的一些细节问题,比如我简历里提到ab实验,面试官让简述一下流程,然后问样本量的一个选择。问了一个日活下降从什么角度分析的问题,本人没有互联网工作经历,回答从趋势、外部因素和内部活动、版本升级等方面回答,答得可能不是让她很满意。    第二轮面试是和数据分析师进行的沟通,这轮环节比较长,沟通也很深入。    先是简述了一下过往经历,然后重点提问是在技术方面,sql方面,问了使用sql的种类,hsql和mysql的用法区别,sql优化方法,最多写的嵌套层数,union和union all的区别,连续活跃时间的算法,然后问了连续活跃时间和每月的总活跃天数是否可以在一个查询完成,还有窗口函数,问了几个排序的区别。python方面问了一下使用场景,问了两个问题,都偏向于python原理方面的,第一个问题没有了解过就直说没了解过了,第二个问题问的是可变和不可变的数据类型,我只记得一个元组是不可变的,然后问了元组是相对不可变还是绝对不可变,当时也没答上来,应该是相对不可变的。    之后谈到业务方面,面试官问了两个问题,一个是用简单统计指标如何监控异常趋势变化,我先是回答了同比环比,与昨日比较,又回答了移动平均值,标准差等,然后面试官说出他比较认可的是平均值,问到平均值的特点,答容易受极值影响。第二个问题是问的开机广告,描述了开机广告传输用户信息——广告商竞价——确认展示内容——渲染加载等过程,然后提问有广告商想要将广告预加载在用户本地,问拒绝的理由,一个是不好协调不同广告商之间的利益关系,再一个占用计算资源等,最主要原因是不能确定预加载广告对获利的影响。本轮面试还问到了一些沟通协调的问题,问遇到的难协调的人/事等。还提到互联网行业有较大风险,可能面临裁员或者试用期不过这种,问是否有准备。然后就是反问环节,我问了一下这个岗位看重的素质、工作内容等,然后就没问什么问题了。    总体下来虽然没过,但也心服口服吧,面试官水准还是很高的,没过只能说比较可惜,也开拓了思路,对后续面试也有帮助。
点赞 评论 收藏
转发
1 24 评论
分享
牛客网
牛客企业服务