题解 | #每篇文章同一时刻最大在看人数#

每篇文章同一时刻最大在看人数

https://www.nowcoder.com/practice/fe24c93008b84e9592b35faa15755e48

# 第一步

# 首先要把In 和 out提取出来 作为一个cnt  in 加1, out 减1

# 先将提取出的表Union 合并   

# 选择union all 因为可能会存在同一个视频观看时间相同的情况

# 如果有要筛选的条件 先筛选完再合并

 

# 第二步

# 将第一步的总表创建一个临时表 记为t1

# 使用滑动窗口 计算出每个时刻的总在线人数  

# 易错点:sum(cnt) over(partition by artical_id order by time, cnt desc) as sumcnt

# cnt desc# 需要注意的是, 当同一时刻有人退出又有人进入时, 先计算进入的. 则还需要根据code 进行降序

 

# 第三步

# 分组 再选择 最大在线人数

# 第一步和第二步要分开 不能  max(sum(cnt) over) 这样不对 窗口函数和聚合函数 的嵌套、

# 窗口函数不能嵌套在窗口函数或其他聚合中,但分组聚合函数可以嵌套在窗口函数中,比如

# select b,c

# --,SUM( SUM(c) over() ) over() --错误,窗口函数不能嵌套于窗口函数中

# ,SUM(SUM(c)) OVER() --正确,因为内部的SUM(c)没有OVER子句,所以该函数 --是分组聚合函数而非窗口函数,这种情况的嵌套是允许的

# from T4 group by b,c

# 第一次写的代码  where artical_id !=0 这个限定条件写在了 最后】
# 最好的方法 是 在一开始合并数据集的时候 就把条件筛选完
/*
with t1 as 
	(
	select id,uid,artical_id, in_time as time ,1 as cnt from tb_user_log   
    union all
    select id,uid,artical_id ,out_time as time,-1 as cnt from tb_user_log
	),

t2 as 
(SELECT * ,
sum(cnt) over(partition by artical_id order by time) as sumcnt
from t1
)

SELECT artical_id,max(sumcnt) as max_uv
from t2 
where artical_id !=0
group by artical_id 
order by max_uv desc;
*/

# 还有一个情况是 
# 需要注意的是, 当同一时刻有人退出又有人进入时, 先计算进入的. 则还需要根据code 进行降序
# sum(cnt) over(partition by artical_id order by time) as sumcnt 需要再order by cnt (当同一世界有人进有人出 先算进入的 所以要降序排列)
with t1 as 
	(
	select id,uid,artical_id, in_time as time ,1 as cnt from tb_user_log   where artical_id !=0
    union all  ## 这里需要使用union all, 可能会存在同一个视频观看时间相同的情况
    select id,uid,artical_id ,out_time as time,-1 as cnt from tb_user_log   where artical_id !=0
	),

t2 as 
(SELECT * ,
# sum(cnt) over(partition by artical_id order by time) as sumcnt
# # 需要注意的是, 当同一时刻有人退出又有人进入时, 先计算进入的. 则还需要根据code 进行降序
sum(cnt) over(partition by artical_id order by time, cnt desc) as sumcnt
from t1
)

SELECT artical_id,max(sumcnt) as max_uv
from t2 
# where artical_id !=0  不写在这
group by artical_id 
order by max_uv desc;


全部评论

相关推荐

1 收藏 评论
分享
牛客网
牛客企业服务