滴滴数据分析笔试题目记录。
选择题大量的都是统计相关,考的很深,概念性的东西比较多。
考点,ANOVA,假设检验,罗辑回归,线性回归等。
问答:1.因果性与相关性关系
2.kmeans步骤,标准化公式,标准化作用,以及局限性
3.业务分析
4.假如两个预测变量高度相关,问罗辑思地回归的系数会如何?系数的置信区间会如何?
编程:
1.我copy下来了,引擎是sqllite3,没做出来。
有3张表,分别存放用户信息,已知uid是每个用户的唯一身份标识字段,同一用户在三个数据表中的uid值相同。表名A的表存放的是每个人的等级信息,该表包含两列数据:uid, level;表名B的表存放的是每个用户的历史里程信息,该表包含两列数据:uid, mileage;表名C的表存放的是每个用户的投诉次数信息,该表包含两列数据:uid, complaint_cnt。每个用户可能存在于其中的一个或者两个或者全部表中。
解题要求:
1)写出SQL语句得到一个用户的全量表,若存在用户不存在于某子表中,最终的全量表响应字段以0填充。
2)输出4列,输出列变量的名称分别为:uid, level,mileage,complaint_cnt。
3)所有在线SQL编程中,可以用 union 、left join 、case when 等语法, 不能用 右链接 、全连接、row_number() 、 rank()
输出是['a','b','c','a_0','a_1' ....]后面不写了,就是如果前面重复了,那么就加一个下划线标示。蛮简单的。
#滴滴##数据分析师##笔试题目##笔经#