铁憨憨梦碎拼多多寻梦批数据分析一面

9.18 晚19点 微信视频面试 时长1h15min
1. 自我介绍
2. 实验室有没有相关项目,是做什么的
3. 毕设做什么的,然后追问了一些毕设的东西
4. sql题:一个表格s,属性列有学生学号uid,学生某门课课程名cname,该课程成绩score,求:有两门课成绩低于60分的学生的学号,和他们所有课程平均成绩在整体的排名,并给出所有人在课程名为‘k’的课程的成绩排名。
写了好久......我问面试官是给具体代码还是思路就行,可能面试官不是很满意,和我说课程名的那个排名先不写了,先写前面的条件。
select a.uid uid,d.avg avg,d.rank rank from
(select uid,count(case when score<60 then 1 else null end) not_larger from s)a
left join
(select c.uid uid,c.avg avg,rank()over(order by c.avg desc) rank from(
    select uid,avg(score) avg from s group by uid
    )c
)d 
on a.uid=d.uid where a.not_larger>=2;
当时大概就是这样写的,面试官看了以后也没说对不对.......搞的我很慌
5. 概率题:红黄蓝三个球,有放回地取三次,问取三次都是同种颜色的概率和三次都是不同颜色的概率。
6. 又sql题:一个商城下单数据表格s,属性列有用户uid,下单金额cost,下单购买的商品品牌shop,下单购买的商品名称goods,下单时间d,求:最近30天用户消费金额的排名并给出该用户购买了多少家品牌的产品(有重复品牌,只求购买品牌数,不是商品数)
select b.uid uid,b.sum_cost sum_cost,b.cost_rank cost_rank,b.sum_shop sum_shop from(
    select a.uid uid,a.sum_cost sum_cost,rank()over(order by sum_cost desc) cost_rank from(
        select uid,sum(cost) sum_cost,count(distinct shop) sum_shop from s 
        where datediff(current_date(),date(d))<=30 group by uid
    )a
)b;
又是做完没有评价,我也不知道对不对,太难受了.......懒得建表自己跑了
7. 又概率题:八个队伍,四个强队,四个弱队,问至少有一场比赛是强强对决的概率。可以求四场比赛都是强弱对决的概率,再用1减去这个概率。这道题是牛客网概率统计专项练习原题,我一开始做个答案出来面试官没有肯定,一直问我可不可以有别的思路,我直接蒙了,做了四个答案,他也不说谁对谁错,也怪当时自己练习的时候没有好好琢磨这道题。
解题思路:把8支队伍分成强队(A,B,C,D)和弱队(A‘,B’,C‘,D’),分母就是所有队伍组合,分子就是只能强弱组合:
分母:A可以选择剩下的7支队伍,B可以选择剩下的5支队伍,C可以选择剩下的3支队伍,D没的选就是1;
分子:只能强弱对决的话,A可以选择四支队伍(a,b,c,d),B可以选择三支队伍(去掉A选择的弱队)C可以选择两支队伍,D没得选也是1
最后概率=1-=(我中途做出了这个答案,他又问我思路是什么,有没有别的做法,我以为我错了就又算成别的去了)
8. 问我简历上的每一个算法:
  • 决策树和xgboost的区别是什么
  • 决策树做特征选择的时候怎么确定(答:信息增益、信息增益比、基尼指数),写基尼指数公式
  • xgboost和lightbgm的区别是什么
  • xgboost在gbdt上的优化体现在哪里(答提高了计算精度,并且把模型复杂度作为正则项加到优化目标中),追问:怎么提高了精度?复杂度怎么考虑的,就作为正则化就完了?
  • xgboost在adaboost上的优化是什么
  • boosting算法是如何利用串行来提升的
  • 为什么xgboost那么多人用,好在哪
  • L1、L2正则化是什么
  • svm干什么的,什么时候用,为什么要用svm
  • 你还知道机器学习什么算法,(答聚类kmeans、DBSCAN、高斯混合聚类、层次聚类巴拉巴拉),说一下kmeans和DBSCAN的区别,为什么用DBSCAN不用kmeans
9. 你有什么问题问我
只敢问了一下面试流程(反问我你面试过吗,我说是pdd还是其他公司,他说肯定pdd啊我不关心其他公司),多久给消息,什么部门
面试官说面试是交叉面,每一面的部门可能不一样,两面或三面技术面,然后HR面,最后是统一分配,数据分析师的岗位是不变的。

面试体验:全程瑟瑟发抖,完全不知道自己说的对不对,面试官也没有表情,就一直看着我,我写sql的时候他就一直盯着屏幕看,搞得我敲键盘手都是抖的;我不知道是我理解有点问题还是什么,有些问题还得再确认一下他问的什么意思,问得仔细的仿佛他什么都不懂要我给他解释,但又好像他什么都知道,给人感觉我知道你说的是错的你也知道你说的是错的,但是我也不反驳你说的内容。最后都不敢问对我有什么建议,感觉我问了他会说就你这水平回去重新学吧不过都是我自己的脑补,可能人家什么都没想,只是想面完赶紧下班而已

铁憨憨的梦估计又一次碎了,九月中旬了,还没有offer,我可咋办啊...........
#数据分析师##拼多多##面经##校招#
全部评论
不用慌,我一面完一直没消息,以为都凉啦,前几天刚通知了二面,昨天面的
点赞 回复
分享
发布于 2019-09-28 23:13
小姐姐加油,数分竞争今年贼大
点赞 回复
分享
发布于 2019-09-19 00:30
小红书
校招火热招聘中
官网直投
9月中了,数分的我连个面试都没有
点赞 回复
分享
发布于 2019-09-19 00:31
感觉问的好偏机器学习哇...
点赞 回复
分享
发布于 2019-09-19 00:34
有一说一 这简直是要全能型啊
点赞 回复
分享
发布于 2019-09-19 00:37
老妹稳的 不慌
点赞 回复
分享
发布于 2019-09-19 01:44
抓住一只小🐟 不会的不会的,会给你二面的 相信我好了
点赞 回复
分享
发布于 2019-09-19 07:23
感觉我们是同一个面试官
点赞 回复
分享
发布于 2019-09-19 10:17
小姐姐是10号通知笔试通过嘛?什么时候约的面试哇,祝拿到offer~
点赞 回复
分享
发布于 2019-09-19 13:00
这么难的吗
点赞 回复
分享
发布于 2019-09-19 13:12
感觉你的好难!
点赞 回复
分享
发布于 2019-09-19 22:16
老哥有二面了么
点赞 回复
分享
发布于 2019-09-22 18:31

相关推荐

点赞 评论 收藏
转发
8 109 评论
分享
牛客网
牛客企业服务