小鹏汽车 数据分析 一面凉经
1、
表有四个字段:
A B C D
1 2 3 1
3 4 2 2
1 2 6 3
1 3 3 4
如果 任意两行的A 列 B 列是相同的,保留其中任意一行,即输出
A B C D
1 2 3 1
3 4 2 2
1 3 3 4
【这里把题目理解错了 害 看成任意2列相同了 】
2、 表有三个字段:
A B C
1 2 3
3 4 2
1 2 6
1 3 3
用一条 SQL 统计表的行数及 C 字段等于3的行数,即输出
4 2
【很简单】
3、 推荐中的排序的效果一般使用 AUC 这个指标来计算,例如对于以下排序:
样本排序号 得分 是否正样本
4 0.98 1
3 0.93 0
2 0.85 1
1 0.65 1
AUC 是计算 所有正样本和负样本两两对比,正样本得分比负样本得分大的概率,
计算公式为
(S-M*(M+1)/2) /(M*N)
其中 M 为正样本个数,N 为负样本个数,S 为所有正样本排序号之和
上述例子,AUC 为 1/3
请推导这个公式怎么来的?
【这题懵了,脑子没转过来 感觉面试好像没办法很冷静的思考 】