数据分析师精选面经合集
51家公司
179篇面经
最新 热门
小米大数据开发3.29一面冰经
我是学数学的2024应届,本科阶段有选过大数据的专业选修课,但是编程语言真的不太会,跟科班出身的计院同学没法比,今年数分岗又卷到爆炸,双选会问了几个公司都说数分岗爆满(快手中移信息技术中心),只好一并找找其他方向,上周笔试以为铁挂了就没怎么准备,结果昨天晚上22点发今天的一面邀,一个晚上加上午恶补大数据知识。面试官非常和蔼:问项目:大数据技术实验做了什么东西?是为了实现什么?(本科课程里的实验)有学到什么东西吗?(linux操作经验和Hadoop架构搭建)你对Hadoop的理解到什么程度?机器学习算法实验用了什么算法?(朴素贝叶斯和随机森林)这两个算法分别是用来干什么的?回归还是分类?你用的是什么数据集?(Python sklearn自带数据集)这两个的具体原理知道吗?有监督学习和无监督学习是什么?区别在哪里?你用的这两种是有监督还是无监督?数据库设计用什么实现的?(MS Access)主要用什么语言?你说SQL比较熟练,那select where having执行顺序是什么样的?其余记得不太完整了,有印象的有:MR里的shuffle你知道吗?有什么操作?你知道事务吗?事务的四个性质知道吗?叙述一下?重磅:你本科是数学,那你有学过计组和网络吗?(没有,大一的时候有学习计基,但是培养方案比重不大所以学的不深…汗流浃背…)算法题:链表反转(怕我不知道链表是什么问了我一下知不知道),我问我只有C语言比较熟练可以用C写吗(可以,用你熟悉的语言写)C语言的结构体和指针对我来说还是很复杂的,10分钟左右(我还差主函数打印没写完)ok差不多了(您刚刚不是说还有一道SQL)没事,不用了我看你这个思路还是可以的,时间快到了SQL就不用你做了反问:后续流程大概要多久?(需要整合所有人的表现才能评估,要一段时间)我是数学专业的话想往大数据开发方向发展您觉得我还应该在哪里深入学习?(要多深入学习计组,网络等等计算机专业的课程,搞大数据开发的这些不能不熟练,另外你的机器学习算法的理解不可以流于表面,重点不仅要放在懂得用,编码这块,原理也要深入研究。对了你这些关于大数据和机器学习的东西是自学的还是专业课程学的)哦哦,这些是专业选修课,有计院的老师给我们上的。后面我自己有点研究兴趣所以自己也有学习。结束,现在就是等挂…算是积攒了面试经验吧,春招刚开始找工作处女面给了小米。
点赞 评论 收藏
转发
/feed/main/detail/c3c152295a374525a671a931f3df9ff0/discuss/602996206930784256/feed/main/detail/8992823148ee446c888ca952b53af3e5/discuss/602558188965167104/feed/main/detail/42d84e4b81e142edb55a4ee89c9b1e90/discuss/602540990724915200/discuss/602536180843827200/feed/main/detail/66061fb1e3a34c0ea4857a174afdac2f/feed/main/detail/a9d54a4fcddf4cd999dc404946bd8e2c
3.26五八驾考数据分析面经(二面挂)
面试只接受线下,位置在望京的五八集团总部,位置还挺偏的,地铁不能直达,得转公交。    第一轮面试是和产品进行了一下沟通,先是就经历做了一个简述,然后面试官重点就过往经历进行了一些提问,包括技术工具也问了一些,也问到了简历里写的一些细节问题,比如我简历里提到ab实验,面试官让简述一下流程,然后问样本量的一个选择。问了一个日活下降从什么角度分析的问题,本人没有互联网工作经历,回答从趋势、外部因素和内部活动、版本升级等方面回答,答得可能不是让她很满意。    第二轮面试是和数据分析师进行的沟通,这轮环节比较长,沟通也很深入。    先是简述了一下过往经历,然后重点提问是在技术方面,sql方面,问了使用sql的种类,hsql和mysql的用法区别,sql优化方法,最多写的嵌套层数,union和union all的区别,连续活跃时间的算法,然后问了连续活跃时间和每月的总活跃天数是否可以在一个查询完成,还有窗口函数,问了几个排序的区别。python方面问了一下使用场景,问了两个问题,都偏向于python原理方面的,第一个问题没有了解过就直说没了解过了,第二个问题问的是可变和不可变的数据类型,我只记得一个元组是不可变的,然后问了元组是相对不可变还是绝对不可变,当时也没答上来,应该是相对不可变的。    之后谈到业务方面,面试官问了两个问题,一个是用简单统计指标如何监控异常趋势变化,我先是回答了同比环比,与昨日比较,又回答了移动平均值,标准差等,然后面试官说出他比较认可的是平均值,问到平均值的特点,答容易受极值影响。第二个问题是问的开机广告,描述了开机广告传输用户信息——广告商竞价——确认展示内容——渲染加载等过程,然后提问有广告商想要将广告预加载在用户本地,问拒绝的理由,一个是不好协调不同广告商之间的利益关系,再一个占用计算资源等,最主要原因是不能确定预加载广告对获利的影响。本轮面试还问到了一些沟通协调的问题,问遇到的难协调的人/事等。还提到互联网行业有较大风险,可能面临裁员或者试用期不过这种,问是否有准备。然后就是反问环节,我问了一下这个岗位看重的素质、工作内容等,然后就没问什么问题了。    总体下来虽然没过,但也心服口服吧,面试官水准还是很高的,没过只能说比较可惜,也开拓了思路,对后续面试也有帮助。
点赞 评论 收藏
转发
/feed/main/detail/1c6bdfd6bf7b4147aa5e24f441708316/discuss/602447165797007360/feed/main/detail/0c3619f3b4524b8088d80091485362a8/discuss/602277120567492608/feed/main/detail/cc8b7573aa5548b0b5722eefd4dbe3a0/discuss/602232527721357312/feed/main/detail/eed24cba5edf4c86bc603ab64bab5381/feed/main/detail/19cf0fe14e1b4ea8b5dcf9118dcccd81/discuss/602174402578395136
3.26 美团 数据开发 二面
3.26 美团 数据开发 到店(暑期实习二面)- 面试官是一个温柔的小姐姐- 自我介绍- 之前工作经历介绍- 你觉得什么是好的数仓- 要达到你说的好数仓的标准,应该如何建设?- 小文件具体怎么治理的(预防/滚动式 + 自动脚本)- 小文件有哪些危害- 给你一个数据倾斜的场景,可能有点难,答不出来也没事:大表 Join 大表(10 亿级别的,比如订单 Join 商品表)可能有一些商品销量特别好,数据倾斜,要如何解决?(采样热点 key,一张表 1-N 加盐,一张表扩容 N 倍)- 上面的题是美团的数据倾斜经典问题了,具体可以参考他们自己的技术博客:[Spark性能优化指南——高级篇 - 美团技术团队 (meituan.com)](https://tech.meituan.com/2016/05/12/spark-tuning-pro.html)- 更熟悉 Java 还是 Python?写一个冒泡排序- 写一道 SQL:SQL276 牛客的课程订单分析(六)- 讲一个你之前项目中遇到的一个困难,你是如何解决的- 讲一个你的缺点- 假如这次面试失败,你觉得会是什么问题- 你是如何学习新知识的- 国外工作还是选择回国- 什么时候能够实习- 反问:具体做什么业务的?到店-数据智能(好像是),最近在做的项目是特价团购,面试官说了超级多,离线、实时数仓建设、数据分析、数据应用都有,然后总结说是个好组好业务(“可以去看财报”)。- 反问:只有两面吗?面试官:对。什么时候可以知道结果?面试官:一周之内。🍡团子拜托啦  许愿 OC
点赞 评论 收藏
转发
/feed/main/detail/3e9325433f44449490246925d23671ac/discuss/602106532829900800
玩命加载中
写面经
发动态
发动态
发帖子
写文章

全站热榜

牛客网
牛客企业服务