有意思的sql: 直播间抽奖

今天和同事排队做核酸时,讨论了个问题:

直播间发起弹幕抽奖,会将用户每一次参与分配一个id,最后需要抽取3个中奖用户;

如果用程序实现比较简单,如果用sql如何实现呢

下面将实现细节分享下,只做了关键点的说明,其他的复现下应该可以理解

-- 场景转化后的sql题如下
-- 1. 10张彩票 被超过3个人买 一个人可以买多张 想找到3张彩票号码正好让3人中奖
-- 2. 在1的基础上 如果1个人买了多张彩票 应该让其中奖概率大一点 满足吗

-- 在hive中建表并插入数据

create table temp_hyk_20220711(
    tid bigint comment '彩票号码',
    uid String comment '用户ID'
);

insert into table temp_hyk_20220711 values
(1,'a')
,(2,'a')
,(3,'b')
,(4,'b')
,(5,'c')
,(6,'d')
,(7,'e')
,(8,'a')
,(9,'f')
,(10,'c')
;

-- 查看数据是否正常
select * from temp_hyk_20220711;


-- 问题1 主要是随机抽取 通过随机函数rand()加一个随机数 按照大小排序 
select
uid,
rand(unix_timestamp(getdate())) as num, 
-- rand() num,   
max(tid)
from temp_hyk_20220711
group by uid
order by num
limit 3
;

-- 遇到的问题 
执行下面sql 发现多次执行 num2的值是不变的 导致如果用num2的话 如果抽取三次,每次抽到的都是同样的三个人 

使用rand(seed)使每次的结果不相同

看了下rand函数感觉没啥问题,猜测是缓存的问题,即多次执行时,只执行了一次,后面都是从缓存
但getdate()函数又会每次取执行时的时间,感觉应该会重新执行sql 而不是走缓存,。 
暂时就不讨论了 两次执行的结果见末尾图
select   
tid, 
uid,
rand(unix_timestamp(getdate())) as num, 
rand() as num2
from temp_hyk_20220711
order by tid 
;


问题2:
上面的解法等于是一个用户只生成了一次rand() 按照这个取 
如果需要增加多次参与的人的概率  修改为一个用户参与一次就生成一次rand()

select
uid,
tid,
num
from
(
    select 
    tid,
    uid,
    num,
    row_number()over(partition by uid order by num desc) as rn  -- 用户买的多 其产生大的随机数的可能性就越大 
    from 
    (
        select
        tid,
        uid,
        rand(unix_timestamp(getdate())) as num -- 如果用户买多次 产生多次随机数 
        from temp_hyk_20220711
    )t1
)t2
where rn = 1
order by num desc
limit 3;

补充
rand()函数还可以用作抽样
select 
*
from 
(
    select 
    *,
    rand() as num
    from temp_hyk_20220711
)t 
where num between 0 and 0.2; 

rand()函数导致两次结果不同

rand函数导致两次结果不同1

rand函数导致两次结果不同2

最后别忘了删除临时表

drop table temp_hyk_20220711;

#数仓开发##SQL面试#
全部评论
我就从来没中过,总怀疑他们的实现方式
点赞 回复 分享
发布于 2022-07-14 09:13

相关推荐

就前几天旅游的时候,打开抖音就经常刷到这类视频:以前是高学历学生、老师、主持人,现在做着团播、擦边主播的工作,以及那些经过精心包装的“职业转型”故事——从铺天盖地的VLOG到所谓的“04年夜场工作日记”,这些内容在初中升学、高考放榜等关键时间节点持续发酵。可以说非常直接且精准地在潜移默化地影响着心智尚未成熟的青少年,使其对特殊行业逐渐脱敏。那我就想问了:某些传播公司、平台运营者甚至某些夜场的老板,你们究竟在传递怎样的价值观?点开那些视频,评论区里也是呈现明显的两极分化:一种是​​经济下行论​​:“现在就业市场已经艰难到这种程度了吗?”​​一种是事实反驳派​​:这些创作者往往拥有名校背景,从事着...
牛客刘北:被环境教育的,为了能拿到足够的钱养活自己,不甘心也得甘心,现在的短视频传播的思想的确很扭曲,但是很明显,互联网玩上一年你就能全款提A6,但你全心全意不吃不喝工作一年未必能提A6,但是在高考中考出现这个的确很扭曲,在向大家传播“不上学,玩互联网也可以轻松年入百万”,不是人变了,是社会在变
预测一下26届秋招形势
点赞 评论 收藏
分享
自由水:笑死了,敢这么面试不敢让别人说
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务