拼多多数据分析岗笔试一些可能用到的知识点

1.排名函数

ROW_NUMBER

他会为查询出来的每一行记录生成一个序号,依次排序且不会重复。示例代码如下:

select ROW_NUMBER() OVER(order by [price] desc) as row_num,* from [Order]

原始数据为

id price
1 200
2 400
3 300
4 700
5 500

执行结果为:

row_num id price
1 4 700
2 5 500
3 2 400
4 3 300
5 2 200


RANK

rank函数用于返回结果集的分区内每行的排名,简单来说rank函数就是对查询出来的记录进行排名,与row_number函数不同的是,rank函数考虑到了over子句中排序字段值相同的情况,也就是并列的情况,如果两行数据并列,他们的名次一样,下一行记录的名次不是简单的增加1,而是由已排完的记录数决定。示例代码如下:

select RANK() OVER(order by [id]) as rank,* from [Order]

原始数据为

id price
1 200
1 400
2 300
2 700
3 500

执行结果为:

rank id price
1 1 200
1 1 400
3 2 300
3 2 700
5 3 500

DENSE_RANK

dense_rank函数的功能与rank函数类似,dense_rank函数在生成序号时是连续的,而rank函数生成的序号有可能不连续。dense_rank函数出现相同排名时,将不跳过相同排名号,rank值紧接上一次的rank值。示例代码如下:

select DENSE_RANK() OVER(order by [id]) as den_rank,* from [Order]

原始数据为

id price
1 200
1 400
2 300
2 700
3 500

执行结果为:

den_rank id price
1 1 200
1 1 400
2 2 300
2 2 700
3 3 500


NTILE

ntile函数可以对序号进行分组处理,ntile 将返回此行所属的组的编号。示例代码如下:

select NTILE(3) OVER(order by [price] desc) as ntile,* from [Order]

原始数据为

id price
1 200
2 400
3 300
4 700
5 500

执行结果为:

ntile id price
1 4 700
1 5 500
2 2 400
2 3 300
3 2 200

2.日期类型处理

DATE_ADD()

向日期添加指定的时间间隔。

时间间隔类型包括:

时间间隔类型值
MICROSECOND
SECOND
MINUTE
HOUR
DAY
WEEK
MONTH
QUARTER
YEAR
SECOND_MICROSECOND
MINUTE_MICROSECOND
MINUTE_SECOND
HOUR_MICROSECOND
HOUR_SECOND
HOUR_MINUTE
DAY_MICROSECOND
DAY_SECOND
DAY_MINUTE
DAY_HOUR
YEAR_MONTH

示例如下:

  1. SELECT OrderId,DATE_ADD(OrderDate,INTERVAL 45 DAY) AS OrderPayDate
  2. FROM Orders


执行前:

OrderId ProductName OrderDate
1 Jarlsberg Cheese 2008-11-11 13:23:44.657


执行后:

OrderId OrderPayDate
1 2008-12-26 13:23:44.657


DATEDIFF()

函数返回两个日期之间的天数。

代码示例:

SELECT DATEDIFF('2008-11-30','2008-11-29') AS DiffDate

返回结果1。

DATE_FORMAT()

函数用于以不同的格式显示日期/时间数据。

示例代码:

DATE_FORMAT(NOW(),'%b %d %Y %h:%i %p')
DATE_FORMAT(NOW(),'%m-%d-%Y')
DATE_FORMAT(NOW(),'%d %b %y')
DATE_FORMAT(NOW(),'%d %b %Y %T:%f')

结果如下:

Nov 04 2008 11:45 PM
11-04-2008
04 Nov 08
04 Nov 2008 11:45:34:243

其中,NOW()返回当前日期时间。

3.LAG()

这个函数可以取出某个字段前N条记录的值。

示例代码:

SELECT *,LAG(price,1) OVER(ORDER BY id) AS lag FROM Orders


原始数据为

id price
1 200
2 400
3 300
4 700
5 500

执行结果为:

id price lag
1 200
2 400 200
3 300 400
4 700 300
5 500 700

4.LEAD()

与LAG()类似,区别是查询某字段的后N条记录的值。

如有错误,欢迎指正


#拼多多#
全部评论
最好再加个percentile系列的取分位数的函数
点赞 回复
分享
发布于 2018-08-06 12:30
计算各用户user_id 购买商品总数,分别是一天,一周,一个月,每半年 请问这个怎么做
点赞 回复
分享
发布于 2018-08-06 15:49
滴滴
校招火热招聘中
官网直投
999好棒😋
点赞 回复
分享
发布于 2018-08-06 16:56
666
点赞 回复
分享
发布于 2018-08-10 21:04
不同数据库函数不同,请问以上总结是用什么数据库??有谁知道吗
点赞 回复
分享
发布于 2018-08-29 15:58
不错不错。谢谢分享了。
点赞 回复
分享
发布于 2018-08-29 17:25
DATEDIFF(datepart,startdate,enddate) eg: SELECT DATEDIFF(dd, '2008-11-30','2008-11-29') AS DiffDate 是返回 -1
点赞 回复
分享
发布于 2018-08-30 17:02
谢谢大佬 
点赞 回复
分享
发布于 2019-01-02 13:11

相关推荐

22 166 评论
分享
牛客网
牛客企业服务