SQL连续N天活跃用户

题目描述:查询连续登陆不少于3天的新注册用户

某产品在2022年2月8日各端口用户注册信息及后几日登录信息如下:

该题有两种解题方法,使用row_number排序或者lead窗口函数

方法1(row_number):

1.先筛选出login_tb中的user_id在register_tb的user_id,确保都是新注册用户,并考虑对login_tb进行去重,作为t1

2.对t1使用窗口函数row_number排序,作为t2,通过date_sub生成辅助时间列result,作为t3

3.对t3按照user_id和result进行group by,通过having筛选出数量大于等于3,最后加上排序

易错点:

1.忘记筛选新注册用户

2.最后外层表需要groupby到辅助时间列result

3.date_sub里面使用的是interval rn day

WITH
    reg_login AS (
        SELECT DISTINCT
            l.user_id,
            DATE(l.log_time) AS login_date
        FROM
            login_tb l
        WHERE
            l.user_id IN (
                SELECT
                    user_id
                FROM
                    register_tb
            )
    )
select
    user_id
from
    (
        select
            user_id,
            date_sub(login_date, interval rn day) result
        from
            (
                select
                    user_id,
                    login_date,
                    row_number() over (
                        partition by
                            user_id
                        order by
                            login_date
                    ) rn
                from
                    reg_login
            ) t1
    ) t3
group by
    user_id,
    result
having
    count(*) >= 3
order by
    user_id

方法2(lead):

1.先筛选出login_tb中的user_id在register_tb的user_id,确保都是新注册用户,并考虑对login_tb进行去重,作为t1

2.对t1使用窗口函数lead(login_date, n),n为连续的天数,作为t2

3.对t2使用where判断datediff相减是否为n-1,并且对user_id进行去重,因为没有group by

易错点:

1.忘记筛选新注册用户

2.lead中最关键的是order by log_date

3.最后一步是去重distinct user_id

with
    login_tb_fliter as (
        select
            user_id,
            date(log_time) log_date
        from
            login_tb
        where
            user_id in (
                select
                    user_id
                from
                    register_tb
            )
    )
select
    distinct user_id
from
    (
        select
            user_id,
            log_date,
            lead(log_date, 2) over (
                partition by
                    user_id
                order by
                    log_date
            ) lead_date
        from
            login_tb_fliter
    ) t1
where datediff(lead_date,log_date) = 2
order by user_id

全部评论

相关推荐

头像
04-16 17:40
已编辑
武汉大学 Java
bg9本,暑期投了大概二十家,只有五家约了面,xhs笔试没过,华为今天晚上笔试,蚂蚁笔试过了不约面,剩下应该都是简历挂了。昨天晚上网易二面,感觉面试官全程严肃感觉不到情绪,没介绍组内业务,还是我反问环节提问才大概介绍了一下。面试大概三十多分钟,说hr3-5个工作日给结果,感觉凉了。美团面完快一周了也没消息,估计是要横向挂了。字节二面约到明天下午,如果没过就又要从零开始了。已经四月中旬,大厂的hc估计也快招够了。感觉鼠鼠的得失欲太重了,明知道面试是一件很看运气的事,自己的水平也没达到大佬级别,但是还是对每次面试抱有很大的期望,特别想要拿到一个offer,不自觉的给了自己很大的压力。npy也指出过我的问题,但是鼠鼠还是忍不住的去期望,因为暑期实习找不到大厂,秋招就又落后一大截了。最近一个月午休都睡不着,一闭上眼就是面试问到问题不会,手撕撕不出来的场景。早上也连着三天七点多梦见面试面的不好被吓醒了。每次洗澡都发现掉了一堆头发。开始找暑期实习以来最大的感触就是学历只能当敲门砖,在约到面以后学历就没有任何作用了,能不能进下轮面还是看知识储备,思维能力,代码水平。鼠鼠只恨自己目标规划不清楚,大一大二没怎么刷算法题学开发,想保研又不坚定,去导师组里做做研究又做不下去(也可能是我对cv实在不感兴趣),加上一门3学分的公选因为网课忘刷绩点爆炸了(本来在保研边缘线上努努力还是有机会的),于是直接放弃了。去年十一月去导师公司里实习了一个月,然后又开始左右脑互搏,到底是考研还是考公还是找工作。一直到二月底才终于下定决心准备找工作,只是时间已经太匆忙。一晃眼大学的时光竟然已经快要结束了,虽然忙忙碌碌但也一事无成,后悔的事多到数不清。当然鼠鼠也知道相比于双非的同伴们的处境已经好太多了,但还是忍不住抒发一下内心的想法。最重要的还是看开吧,如果网易和字节都寄了,就继续投继续面,实在面不到中大厂就去银行,就去小厂,我相信总能找到一份实习的。祝各位牛友们运气爆棚,都能拿到自己满意的offer后续更新:网易互娱4.16上午hr面,当天下午oc,祝大家跟鼠鼠一样好运
Wannamai:照镜子了😭
我的求职进度条
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务