开窗函数有多能打?

大家好,我是阳仔。

SQL是数据分析师的必备技能,无论大厂还是小厂,在技术面试轮经常会考到开窗函数。

在这里我就结合面试和工作经验,聊聊开窗函数都有哪些应用场景。


入门 - 排名、占比问题

涉及知识点:排序窗口函数、聚合窗口函数


举个例子:

现有客户消费统计表 user_agreement_table,字段 user_id 用户id、product 产品名称、gmv 交易额

问题1:找出每个用户消费金额最大的产品

思路:用row_number( ) over( )求每个用户产品购买数量排序,然后取出第一行

SELECT
  T1.user_id
  , T1.product
  FROM
  (SELECT user_id
    , product
    , row_number() over(partition by user_id order by gmv desc) as rank
    FROM user_agreement_table
    ) as T1
  WHERE T1.rank = 1

问题2:每个用户在各个产品消费金额的占比分布

思路:用sum( ) over( )求每个用户消费总金额,然后计算每个产品消费金额占比(这个问题还可以用子查询解决)

SELECT
  user_id
  , product
  , sum(gmv) over(partition by user_id) as total_all     -- 消费总金额
  , gmv/sum(gmv) over(partition by user_id) as p    -- 占比
  FROM user_agreement_table


进阶 - 同比、环比、连续活跃问题
涉及知识点:偏移窗口函数


举个例子:

现有活跃用户明细表 user_active_table,字段 date 日期、user_id 用户id,假设日期是连续的

问题1:每天活跃用户量的环比值

思路:计算每天活跃用户量,并用lag( ) over( )求昨天活跃用户数

SELECT
  date
  , count(user_id) as a    -- 活跃用户量
  , lag(count(user_id),1) over(partition by date order by date) as b    -- 昨天活跃用户量,这里partiton by 可以省略
  , count(user_id)/lag(count(user_id),1) over(partition by date order by date) as yoy    -- 环比
  FROM user_active_table
  GROUP BY date    -- 如果开窗函数中含有聚合函数,需要接group by

问题2:连续活跃7天的用户有哪些(这个问题还可以用子查询解决)

思路:用偏移窗口函数,计算用户向前偏移7行的日期,如果当前日期减7天等于用户向前偏移7行的日期,说明用户连续7天活跃

SELECT
  T1.user_id
  FROM
  (SELECT
    date
    , user_id
    , lag(date,7) over(partition by user_id order by date) as date2 -- 向前偏移7行
    FROM user_active_table) as T1
  WHERE date_sub(T1.date,7) = T1.date2

高级 – 移动平均

及知识点:截取部分行 rows between ...... and ......

我们需要先了解完整的开窗函数:表达式 + over ( partition by 分区依据 order by 排序依据  rows between ......  and ...... )


比如我们在做指数的时候经常会用到3月移动平均,此时可以先求连续3期数据和再平均

sum(字段) over(partition by 分区 order by 排序依据 rows between 3 preceding and current row) / 3

总结:

窗口函数是衡量数据分析师SQL水平的重要标识,一般面试最难也就到这一层级。

如果你是刚入门或者想转行做数据分析师,一定多刷题库,不要在这个环节掉链子。



这次就分享到这里啦,想参加腾讯秋招、社招的小伙伴可以加我v15201344924。
#腾讯提前批##腾讯##内推##校招##社招#
全部评论
哈哈哈😓
点赞 回复 分享
发布于 2024-03-08 11:57 湖南

相关推荐

点赞 评论 收藏
分享
避坑恶心到我了大家好,今天我想跟大家聊聊我在成都千子成智能科技有限公司(以下简称千子成)的求职经历,希望能给大家一些参考。千子成的母公司是“同创主悦”,主要经营各种产品,比如菜刀、POS机、电话卡等等。听起来是不是有点像地推销售公司?没错,就是那种类型的公司。我当时刚毕业,急需一份临时工作,所以在BOSS上看到了千子成的招聘信息。他们承诺无责底薪5000元,还包住宿,这吸引了我。面试的时候,HR也说了同样的话,感觉挺靠谱的。于是,我满怀期待地等待结果。结果出来后,我通过了面试,第二天就收到了试岗通知。试岗的内容就是地推销售,公司划定一个区域,然后你就得见人就问,问店铺、问路人,一直问到他们有意向为止。如果他们有兴趣,你就得摇同事帮忙推动,促进成交。说说一天的工作安排吧。工作时间是从早上8:30到晚上18:30。早上7点有人叫你起床,收拾后去公司,然后唱歌跳舞(销售公司都这样),7:55早课(类似宣誓),8:05同事间联系销售话术,8:15分享销售技巧,8:30经理训话。9:20左右从公司下市场,公交、地铁、自行车自费。到了市场大概10点左右,开始地推工作。中午吃饭时间大约是12:00,公司附近的路边盖饭面馆店自费AA,吃饭时间大约40分钟左右。吃完饭后继续地推工作,没有所谓的固定中午午休时间。下午6点下班后返回公司,不能直接下班,需要与同事交流话术,经理讲话洗脑。正常情况下9点下班。整个上班的一天中,早上到公司就是站着的,到晚上下班前都是站着。每天步数2万步以上。公司员工没有自己的工位,百来号人挤在一个20平方米的空间里听经理洗脑。白天就在市场上奔波,公司的投入成本几乎只有租金和工资,没有中央空调。早上2小时,晚上加班2小时,纯蒸桑拿。没有任何福利,节假日也没有3倍工资之类的。偶尔会有冲的酸梅汤和西瓜什么的。公司的晋升路径也很有意思:新人—组长—领队—主管—副经理—经理。要求是业绩和团队人数,类似传销模式,把人留下来。新人不能加微信、不能吐槽公司、不能有负面情绪、不能谈恋爱、不能说累。在公司没有任何坐的地方,不能依墙而坐。早上吃早饭在公司外面的安全通道,未到上班时间还会让你吃快些不能磨蹭。总之就是想榨干你。复试的时候,带你的师傅会给你营造一个钱多事少离家近的工作氛围,吹嘘工资有多高、还能吹自己毕业于好大学。然后让你早点来公司、无偿加班、抓住你可能不会走的心思进一步压榨你。总之,大家在找工作的时候一定要擦亮眼睛,避免踩坑!———来自网友
qq乃乃好喝到咩噗茶:不要做没有专业门槛的工作
点赞 评论 收藏
分享
评论
8
35
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务