PDD数据分析一面面经

一小时,好多统计学相关的忘了,稍微整理一下
针对之前的实习,里面每个操作都进行了深入的质问
Q:对部分账号采取曝光优先的策略,怎么判断之后ctr的上升是因为这个曝光增加的策略
A:ab-test,假设检验,我只会解释原理,问我具体怎么做,晕
Q:怎么判断账号CTR、时长等指标的有没有异常值
A:假设服从正态分布,看大于均值1/2/3个方差
Q:讲一下箱型图,怎么根据箱型图判断异常值
A:箱型图略,第二个不会
Q:除了正态分布,还有什么方法找出异常值
A:机器学习,回归
Q:回归分析的时候,怎么判断异常点
A:库克距离,杠杆值
Q:回归分析,变量间有相关性怎么办
A:降维,主成分分析PCA
Q:讲一下PCA原理,如果降维后发现维度没有下降,为什么,怎么办
A:不可能,降维根据特征值排的,可以根据人工选;如果降维后的变量要很多个才能让总方差超过80%,那之前的相关性也不大吧
Q:聚类算法的原理,怎么确定k,怎么确定停止条件。
A:略
Q:随机森林和xgboost有什么区别;随机森林的随机性体现在哪两个步骤
A:略;样本抽样、特征抽样
Q:boosting和bagging有什么区别,模型融合除了boosting和bagging还有什么方法
A:减小偏差和减小方差;不会
Q:怎么判断机器学习模型的好坏,解释一下ROC、AUC,如果过拟合,roc曲线会长什么样
A:略,不清楚
Q:特征工程,怎么判断这个特征好不好,怎么筛选特征
A:随机森林变量的重要性排序,其他忘了
Q:python深浅拷贝,什么时候用等号赋值是浅拷贝,什么时候是深拷贝
A:深浅拷贝知道,但是只知道dataframe用等号赋值是浅拷贝
Q:GMV下降怎么分析,怎么判断gmv波动是否异常
A:定位到具体渠道,分内部和外部原因分析(当时忘了gmv是啥,但还是按照指标异动模板答了);异常?还是正态分布那些。。
Q:手撕sql:一列时间(202008112030),一列状态(1/0),选出最新的状态连续为0的数据
202008111920 0
202008111921
0
202008111930
1
202008111931
1
202008111923
0
202008111924
0
假如这样则输出最下面两条
A:我当时排序之后写了个自连接,但是面试官说会把最上面两条也选出来



#面经##校招##拼多多##数据分析师#
全部评论
lz基础知识挺扎实的, 是之前那个拼越计划的面试吗?
1 回复 分享
发布于 2020-08-12 14:48
校招一面这么难嘛
1 回复 分享
发布于 2020-08-12 00:58
我也是周一,楼主你是几点面的。我们好多题一样😀你收到2面通知了吗
点赞 回复 分享
发布于 2020-08-20 11:34
楼主,你是什么时候收到一面邀请的呀?
点赞 回复 分享
发布于 2020-08-14 17:24
楼主视频面试用的什么呀,牛客嘛?
点赞 回复 分享
发布于 2020-08-13 11:39
大佬最后那个sql题应该怎么写啊
点赞 回复 分享
发布于 2020-08-12 22:47
请问楼主,是现场面还是视频面呀?
点赞 回复 分享
发布于 2020-08-11 23:38
楼主你好,请问你是实习、校招还是社招?岗位是什么?开发的话,是Java方向还是C++方向?或者其他语言方向~
点赞 回复 分享
发布于 2020-08-11 22:16

相关推荐

06-19 13:40
武汉大学 Java
点赞 评论 收藏
分享
叶扰云倾:进度更新,现在阿里云面完3面了,感觉3面答得还行,基本都答上了,自己熟悉的地方也说的比较细致,但感觉面试官有点心不在焉不知道是不是不想要我了,求阿里收留,我直接秒到岗当阿里孝子,学校那边的房子都退租了,下学期都不回学校,全职猛猛实习半年。这种条件还不诱人吗难道 然后现在约到了字节的一面和淘天的复活赛,外加猿辅导。华为笔试完没动静。 美团那边之前投了个base广州的,把我流程卡麻了,应该是不怎么招人,我直接简历挂了,现在进了一个正常的后端流程,还在筛选,不知道还有没有hc。
点赞 评论 收藏
分享
头顶尖尖的程序员:我也是面了三四次才放平心态的。准备好自我介绍,不一定要背熟,可以记事本写下来读。全程控制语速,所有问题都先思考几秒,不要急着答,不要打断面试官说话。
点赞 评论 收藏
分享
评论
13
79
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务