牛客343137315号

2025-11-06 20:36 中国人民大学数据分析师发布于北京

关注

经典典中典：计算用户的平均次日留存率（自留）

计算用户的平均次日留存率

https://www.nowcoder.com/practice/126083961ae0415fbde061d7ebbde453

首先放一下自己没有参考任何东西写出来的：

with tb as(
    select q1.device_id as d1 , q2.device_id as d2
    from question_practice_detail as q1 
    left join question_practice_detail as q2
    on q2.date = date_add(q1.date,interval 1 day) and q1.device_id = q2.device_id

)
select round(count(distinct(d2))/count(distinct(d1)),4) as avg_ret
from tb
where d2 is not null

想的是取出两列，对应第一天和第二天的device_id，用于计数。写出这样代码的几个想法

1.保留前一天的所有数据，让第二天有数据的和前一天的匹配，所以使用left join；

2.使用date_add(q1.date,interval 1 day) 连接到第二天也有记录的device_id，同时也采用device_id作为连接键。

但是运行之后的结果恒为1，肯定是逻辑上出了问题，其实我自己也觉得取两列device_id做连接怪怪的，但是也一时间想不到太好的其他办法。

先看一下官方给出的正确答案：

SELECT 
    ROUND(
        SUM(CASE WHEN p2.device_id IS NOT NULL THEN 1 ELSE 0 END) / COUNT(*) , 
        4
    ) AS avg_ret
FROM 
    (SELECT DISTINCT device_id, date FROM question_practice_detail) p1
LEFT JOIN 
    (SELECT DISTINCT device_id, date FROM question_practice_detail) p2
ON 
    p1.device_id = p2.device_id 
    AND p2.date = DATE_ADD(p1.date, INTERVAL 1 DAY);

乍一看，好像我自己写出来的和官方答案基本一样啊...可以注意到，表连接的部分是基本一致的，但是去重不一样！（问题就出在这里）还有计算留存率的公式不一样，我是自己写了个很奇怪的，官答是用优雅的case when来完成的，显然后者更好，简洁且准确。

我让豆包看了二者的区别，它给我举了个例子，数据如下：

以下是相差的地方：

我理解的官答的几个key points:

1.不单独select device_id作一个cte，再从cte作主查询；而是select from( select)直接做嵌套，而且直接在内层子查询里用distinct去重，这样避免了后续因为重复数据导致的麻烦。我的方法一开始也是在select的时候用distinct，但是后面变成了计算留存率的时候才用，可能两个都不对。

这里获得的启示是，在最主要的查询/计算层尽量只专注于取数/计算本身，避免无关的操作，可以把其放在嵌套的子查询中。

2.多用case when ... then 1 else 0 end这种类似“计数器”/“示性函数”的工具，在计算比率指标的时候非常好用！

虽然刚开始刷sql，但是对于“留存率”计算这个经典问题早有耳闻，貌似是大厂sql笔面试的重点，所以写个自用文档mark一下。

全部评论

推荐最新楼层

05-27 19:27

已编辑

门头沟学院算法工程师

AI Infra学不完学不完

最近读了腾讯写的文章，简单自己做了下总结和理解，又有了新的输入，不愧是腾讯👍 一、学到的核心知识 1. 大模型推理的两大基石  Continuous Batching（连续批处理）：传统批处理要求一个 batch 内所有请求"同时开始、同时结束"，但 LLM 输出长度不可预测，会浪费 GPU。vLLM 把调度粒度从 request level 下沉到 token level——每一步看哪些请求"差几个 token"，就调度几个 token，把短请求填进 batch 的空隙里。 Paged Attention：传统做法一次为请求申请全部显存，碎片严重；P...

点赞评论收藏

分享

05-26 09:28

武汉大学 C++

要进大厂需要学到啥程度才行

不吹不黑，就讲讲我自己看到的。2024届本科上岸，目前在上海张江某原厂写BSP，裸机/RTOS/Linux内核都碰，年包税前45w base。在这一行不算多猛，但摸爬滚打这一年多，多少有点东西可以聊。背景前情学校是某985的异地校区，大一大二参加过一些嵌入式比赛，成绩一般般，主要是给简历凑点东西。那段时间其实心思在C++上，琢磨着转互联网。大三才意识到该找实习了，套了个模板把简历填完，海投几天捞了几个offer，最后去了北京某RISC-V厂——虽然进去之后做的还是ARM SoC那套。本来想拿转正，但卡在本科学历上没成，刚好赶上九月，干脆回学校冲秋招。那时候手里已经有几个offer兜底了，心态没...

点赞评论收藏

分享

04-07 17:08

广东工业大学 Java

27届找后端开发，agent开发

要简历的不少，但没面😥同学都在实习，好焦虑😢

🐂1🐂2：徐新曜你小时候我还抱过你呢

点赞评论收藏

分享

04-24 14:21

扬州大学广陵学院 Java

这简历能不能抓住春招的尾巴呀😔

点赞评论收藏

分享

05-27 16:45

长沙理工大学 C++

985本清华研二，无实习无论文代码全靠AI，秋招想进大厂该选哪条赛道？

网友提问：您好，本人研二，985本+清华研究生，无实习经历、无论文，目前在实验室跟着老师做一个工业缺陷检测的项目，主要基于yolo进行小修改和尝试一些数据增强方法，代码能力较差，全靠ai coding。个人目标是秋招能进大厂，向您咨询具体方向的可行性。1.退出导师现在的项目，开始准备八股leetcode等，找一个算法岗实习（大模型或搜广推），暑期实习来不及就找日常实习，刷个履历准备秋招。2.继续现在的项目，秋招去找cv方面的岗位（这个没有论文竞争压力是否很大）3.零基础学习C/C++，准备两个项目秋招找后端开发由于现在时间很紧，想向您咨询一下这些路线哪些可行，谢谢指导。Yt回复：一、你的开局：...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 发面经攒人品 #

8927626次浏览 98950人参与

# 体制内上岸心路历程 #

39378次浏览 226人参与

# 27届实习投递记录 #

168758次浏览 1695人参与

# 担心入职之后被发现很菜怎么办 #

308033次浏览 1226人参与

# 求职遇到的搞笑事件 #

198900次浏览 1007人参与

# 你收到了团子的OC了吗 #

1640473次浏览 11870人参与

# 万物皆可发面经 #

6278次浏览 81人参与

# 扒一扒那些奇葩实习经历 #

161168次浏览 1184人参与

# 现在还是0offer，延毕还是备考 #

1434749次浏览 7969人参与

# 查收我的offer竞争力报告 #

303945次浏览 1763人参与

# 招聘要求与实际实习内容不符怎么办 #

227272次浏览 1078人参与

# 实习生的蛐蛐区 #

1013314次浏览 5164人参与

# 实习，不懂就问 #

233372次浏览 1773人参与

# HR问：你期望的薪资是多少？如何回答 #

103473次浏览 841人参与

# AI了，我在打一种很新的工 #

213067次浏览 2392人参与

# 父母对你找工作是助力还是阻力？ #

54421次浏览 481人参与

# 地方国企笔面经互助 #

43507次浏览 113人参与

# 秋招盘点:机械人值得去的企业 #

109062次浏览 746人参与

# 美团秋招笔试 #

222274次浏览 1203人参与

# 实习最想跑路的瞬间 #

148058次浏览 787人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务