猿辅导数据分析一面凉透经

海外党伤不起。
凌晨三点多惊醒做了个笔试,然后六点一面。
面试官感觉很着急问问题的样子,但是问得特别全面,我第一次遇到这么全面的。

1. 自我介绍
2. 简历深挖,时间序列如何评估稳定性,ACF和PACF
3. 一个模型最后结果R方值很大,可以说明模型很好吗,为什么?
然后让我叙述模型的评估过程,评估方法,我真的不会,如果有会的,求分享资源,我去学学。
ROC曲线问题:得到了样本概率结果(模型结果)和真实分类情况,描述怎么画出ROC曲线,我说就根据概念酸楚TPR和FPR就行了,条件很全。他说关键就是怎么求TPR FPR,我就晕了,我总感觉条件很完美了。有人知道求告诉一下,感谢。
4. 假设检验,概率分布,原谅我真的当时困的一点精神没有,脑子都不转,让简述了解的概率分布,问了正态分布和泊松分布关系,t分布和正态分布的关系,我统计很差估计答得很烂
5. 一个贝叶斯的题:
某城市发生了一起汽车撞人逃跑事件,该城市只有两种颜色的车,蓝20%绿80%,事发时现场有一个目击者,他指证是蓝车,但是根据专家在现场分析,当时那种条件能看正确的可能性是80%,那么,肇事的车是蓝车的概率是多少?
但是他又问我,如果想确切知道这个数据,在实际情况下还需要什么条件,或者还需要知道什么数据
6. SQL: 有一个表 order_id, userid, goods_type, paid_time (还有个字段忘了是啥了但是这个题没用),对于每个goods_type, 每一个user_id只能购买一次,如果对于某个goods_type下,存在userid购买多次,则输出除了第一次购买之后的所有购买订单的order_id. 不算难,我少有会的题,我的做法是先group by userid, goods_type, 求出所有count(order_id)>1的userid, goods_type, min(paid_time),然后在总表查询输出paid_time不在我自查询结果里的就ok
7. 业务题:一个辛普森悖论题:有一天,在语文数学英语三门课上,二年级的出勤率都比三年级高,但是总出勤率三年级比二年级高,请问是为什么。我知道是辛普森悖论,但是当时脑子已经不会思考了,就没说出来为什么,求大佬告知。

总体来说,看反应应该是凉了,欠缺的还很多,这里面的问题除了sql我都不太会,入门不太久,如果有会的求讨论和指导,万分感谢。
#面经##数据分析师##校招#
全部评论
5 https://zhuanlan.zhihu.com/p/42448375 感觉这个解释是对的
3 回复 分享
发布于 2020-08-16 13:57
3.模型评估的问题周志华西瓜书应该讲了,我也刚看这本记不太清… 7.辛普森悖论产生原因是两组样本的分配比例不同,比如这个例子可能是二年级语文很多但是三年级英语很多,然后英语的出勤率远高于语文 第5题不会答,求大佬告知😁
1 回复 分享
发布于 2020-08-16 13:25
7.
点赞 回复 分享
发布于 2020-08-21 09:36
我感觉咱两是一个面试官,有几道问题是一模一样的
点赞 回复 分享
发布于 2020-08-17 10:18
可以多看看以前的面经,这些问题都是老题目了
点赞 回复 分享
发布于 2020-08-16 12:14
楼主你好,请问你是实习、校招还是社招?
点赞 回复 分享
发布于 2020-08-16 11:04

相关推荐

头像
10-13 18:10
已编辑
东南大学 C++
。收拾收拾心情下一家吧————————————————10.12更新上面不知道怎么的,每次在手机上编辑都会只有最后一行才会显示。原本不想写凉经的,太伤感情了,但过了一天想了想,凉经的拿起来好好整理,就像象棋一样,你进步最快的时候不是你赢棋的时候,而是在输棋的时候。那废话不多说,就做个复盘吧。一面:1,经典自我介绍2,项目盘问,没啥好说的,感觉问的不是很多3,八股问的比较奇怪,他会深挖性地问一些,比如,我知道MMU,那你知不知道QMMU(记得是这个,总之就是MMU前面加一个字母)4,知不知道slab内存分配器->这个我清楚5,知不知道排序算法,排序算法一般怎么用6,写一道力扣的,最长回文子串反问:1,工作内容2,工作强度3,关于友商的问题->后面这个问题问HR去了,和中兴有关,数通这个行业和友商相关的不要提,这个行业和别的行业不同,别的行业干同一行的都是竞争关系,数通这个行业的不同企业的关系比较微妙。特别细节的问题我确实不知道,但一面没挂我。接下来是我被挂的二面,先说说我挂在哪里,技术性问题我应该没啥问题,主要是一些解决问题思路上的回答,一方面是这方面我准备的不多,另一方面是这个面试写的是“专业面试二面”,但是感觉问的问题都是一些主管面/综合面才会问的问题,就是不问技术问方法论。我以前形成的思维定式就是专业面会就是会,不会就直说不会,但事实上如果问到方法论性质的问题的话得扯一下皮,不能按照上面这个模式。刚到位置上就看到面试官叹了一口气,有一些不详的预感。我是下午1点45左右面的。1,经典自我介绍2,你是怎么完成这个项目的,分成几个步骤。我大致说了一下。你有没有觉得你的步骤里面缺了一些什么,(这里已经在引导我往他想的那个方向走了),比如你一个人的能力永远是不够的,,,我们平时会有一些组内的会议来沟通我们的所思所想。。。。3,你在项目中遇到的最困难的地方在什么方面4,说一下你知道的TCP/IP协议网络模型中的网络层有关的协议......5,接着4问,你觉得现在的socket有什么样的缺点,有什么样的优化方向?6,中间手撕了一道很简单的快慢指针的问题。大概是在链表的倒数第N个位置插入一个节点。————————————————————————————————————10.13晚更新补充一下一面说的一些奇怪的概念:1,提到了RPC2,提到了fu(第四声)拷贝,我当时说我只知道零拷贝,知道mmap,然后他说mmap是其中的一种方式,然后他问我知不知道DPDK,我说不知道,他说这个是一个高性能的拷贝方式3,MMU这个前面加了一个什么字母我这里没记,别问我了4,后面还提到了LTU,VFIO,孩子真的不会。
走呀走:华子二面可能会有场景题的,是有些开放性的问题了
点赞 评论 收藏
分享
评论
12
82
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务