首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
数据攻略有六哥
北京航空航天大学 数据分析师
关注
已关注
取消关注
AB实验中评估指标傻傻分不清 | AB系列(六)
@数据攻略有六哥:
DA/DS/BI 必考AB实验知识点
哈喽大家好,我是六哥~最近在面试中我发现一个共性问题:虽然关于AB实验的基础原理、步骤大家了然于胸但只要问到一些稍微深的东西,例如:AB实验中评估指标的相关细节很多人的回答多少还是差那么点意思之前已分享过『AB实验』系列专题(见主页往期分享):数据分析岗 | AB实验框架+高频考点(一)【数据分析岗】| AB实验之方案设计(二)数据分析岗 | AB实验之实验分流(三)AB高频考点!大白话讲懂『多重检验』常被忽略的『AA测试』| AB系列(五)概率论系列考点 — 统计功效 | 最小样本量本篇,咱就来唠一唠AB实验中常见指标分类有哪些?咋用?内含注意事项tips,可收藏慢看[yeah]------正文手动分割线------本文结构速览:一、搞清概念二、计算差异三、选择原则四、注意事项&case自查💡一、搞清概念AB实验中的常见指标,按照业务方式分类:目标指标:又被称为北极星指标,即一般是公司业务核心KPI驱动指标:又被称为间接指标,与目标指标之间在逻辑上有因果关系,但比它更快更灵敏护栏指标:顾名思义,作为“保护型”指标,是每个测试都需要观察的指标,一般有两种类型:保证目标指标不会违背重要的限制:一般为衡量用户不好体验的指标,如加载率、崩溃率等等,一般而言不能对其有显著负向影响才可以评估实验结果的可信赖度和内部有效性:常见的如SRM,如若出现问题实验中其他指标评估结果基本不可信如果按照统计类型分类:计数求和型:即样本的指标之和,比如有uv、pv、总时长复合计算型:均值类、比例类、比率类均值类:即样本的均值,如uv价值、人均时长比例类:即每个样本服从二项分布,如用户点击率、用户购买转化率比率类:即两类指标的比值,如pv点击率、ROI等等二、计算差异在抛公式前,需要有个大致概念:一般情况下,不同指标的差异主要体现在假设检验时方差的计算方式上。这是因为不同指标的计算方法往往考虑了不同的信息,从而导致了方差的计算方式也会有所不同。因此,正确估计指标的方差是获得可靠的实验结果的前提。在实际业务中,常用的是参数检验中关于均值类、比例类 这类统计量的组间差异检验。另外,多说一嘴:有关计数求和型指标,只有当实验对照组样本一致的情况下,这类绝对值指标的对比才更具意义,否则还是需要转换成以上指标才可以对比。讲具体每个指标的差异前,抛出一张脑图,供大家概览:▌均值类:均值类指标是基于正态分布做计算大多数情况下,样本充足,选用Z检验:(因假设实验对照组均值分布无差异,即:u1-u2=0)▌比例类:比例型指标是基于伯努利分布做近似计算:如果实验对照组样本比例相同,即:▌比率类:如上,无论是均值类指标的检验采用正态分布计算方差,还是比例型指标的检验采用二项分布方式计算方差,其实这里有个适用前提假设,即:需要满足样本独立同分布但这里比率型指标是不满足的。AB测试一般在用户层面进行随机化分流,如若指标的分析单元不是用户,例如pv点击率,是点击pv/曝光pv,这里分析单元中的每个曝光Yi可能来源同一个用户,各样本点不满足独立性,所以方差计算需要做下修正,不可以直接套用。关于这类指标,业界常用的方式例如有:delta method进行修正,或者bootstrap方式计算方差的无偏估计。① Delta method:优点:计算简便,需满足一些基本假设,大多数情况下即可利用一阶泰勒展开,在很低的计算成本下获得准确的方差估计,效率更高缺点:仅适用于大样本,且对统计量形式有限制② bootstrap方式:优点:形式简单,容易理解,适合任一统计量,且对样本量没有限制缺点:成本高,耗时长,需要较大算力来支持重抽样次数其中Delta method方式,计算修正后的样本方差:ps.有关此方法的推导感兴趣可私信留言~三、选择指标原则通常情况下,在实际工作中,大多数人会按照过往经验或者业务感觉来选择实验评估指标,虽然很少出现问题,但还是需要清楚底层关键需要满足以下几个原则:易懂性:指标是为了反应某种事物和现象的一种量化方式,所以需要容易理解且可衡量实验效果一致性:需要和AB实验采取策略的目标保持一致,方便衡量干预措施和数据结论有一定因果逻辑灵敏性:AB实验本质是为了利用数据驱动的方式为业务策略探路验证用的评估方法,倘若选取的指标很难检测到差异,可能会错失增长良机,或者没及时发现问题止损而付出更大代价,所以需要选取的实验指标保证灵敏性四、注意事项▌指标个数指标不在多,否则会出现多重检验的问题,置信度会下降。(详见👉:AB高频考点!大白话讲懂『多重检验』)最好先有预期目标,制定评估标准以及预计提升值,而后AB实验更多发挥的是因果验证作用。▌指标识别指标计算时要注意:随机分流的实验单元和分析单元需保持一致,否则不满足假设检验中的前提条件:独立性。如果不满足,则需要对方差计算进行修正,否则检验结论出错概率较大。▌case自查:实验组和对照组uv价值的相对差异,是否可以用传统计算方差方式?答案:不可以,需要进行方差修正。提示:可以将该指标列出,观察分母:对照组的uv价值是常数还是随机变量,可以发现新的统计量需要计算的是实验对照组uv价值比值的方差,即需要用到比率型指标的估计方差方式。以上就是为大家分享的AB实验中关于:评估指标差异的定义、分类、注意事项面试官亲自出的『56道AB实验真题』,求职不迷茫
点赞 4
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
07-11 22:11
滴滴_运维开发工程师(准入职员工)
滴滴内推
薪资: 我是运营岗,本科生 150/d,工作时间是早10晚7,弹性打卡(但其实每天打卡四小时就算一天),午休 2 小时(不过中午休息区比较难抢) 交通: 我在东软职场,每天上下班有西二旗到公司往返的摆渡车,不同职场之间往来打车可以报销,21:00 下班回家也可以报销(但我从来没用过,没加过班) 福利: 开水畅饮,特定节假日有礼盒,公司经常会举办各种活动,参加会有小礼品和积分,积分可以在商城兑换物品。 吃饭: 午饭需要自己解决,每晚有 30 的餐补,可以去周边餐馆点餐,也可以在内部软件点餐,直接送到所在楼层茶水间 总体感觉在滴滴很舒服,工作强度不大,我所在的部门也没有太多dirty wo...
滴滴公司福利 1026人发布
点赞
评论
收藏
分享
07-15 11:51
门头沟学院 Java
百度提前批一面凉经
面的很差,面试官也很冷漠的感觉1.介绍实习,介绍投入比较多的项目2.go的进程,线程,协程,为什么go的协程很轻量化3.python的GIL什么作用4.强变量类型和GIL什么作用5.中断是什么,如何执行,什么时候执行6.CNN,RNN7.反向传播8.可微,可导9.TCP为什么四次挥手,三次行不行10.FLASK用的什么IO模型11.mysql的索引是什么数据结构?为什么不用红黑树或者B树12.mysql有哪些日志,有什么作用算法题:k个一组翻转链表,要求只翻转id为奇数的组
面试问题记录
点赞
评论
收藏
分享
05-30 10:50
湖南大学 C++
求拷打27届
想大三上找一个大厂的日常,想大三下争取大厂暑期转正已经看完jvm juc了,项目换成一个Spring+AI /12306会不会好一些?或者还有什么热门的方向推荐学习吗?不想读研
Code溪:
985放大
点赞
评论
收藏
分享
07-09 12:43
广东工业大学 Java
小红书二面(第二天oc)
几乎都答出来了简单问了一下实习Java 的hash函数是怎样的hash函数有什么降低hash冲突的方法吗垃圾回收算法标记复制的缺点是什么?标记复制为什么是8:1:1jvm的软引用和弱引用的区别为什么jvm会有这几种引用的区分讲一下协程线程和协程区别,哪个上下文切换开销大协程的上下文切换开销主要在哪里?协程栈大小是多大,线程呢?springboot的优势除了约定俗成的配置,你知道springboot在初期是怎样发展起来的吗,有什么优势spring是如何解决循环依赖的?三级缓存为什么能解决循环依赖算法寻找第k大的数字(口述)手撕:链表位移(应该是叫这么名字,简单题)最长回文子串面试评价:很好有转正,部门活比较多,1095,如果实习生能力强,会安排比较重要的需求,但一开始还是以打杂为主部门是个很不错的部门,可惜我答辩推迟了,只能拒了😭😭😭
看到我请叫我别焦虑:
跪了,我的一辈子
查看19道真题和解析
点赞
评论
收藏
分享
07-16 13:45
门头沟学院 Java
秋招小鹏第二挂
小鹏ai面做完,两天后即挂我秋招还能找到工作吗
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
1
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
玛勒戈壁得秋天到了吗就秋招。恨不得搁产房外面招聘
7649
2
...
我和妈妈讲以后我可能给不了她一个月1500
6337
3
...
后端实习到底该干什么啊
4966
4
...
王侯将相宁有种乎!
4360
5
...
双非本应届是如何拿到30
4316
6
...
明天五场面试,加油
4008
7
...
从外包到正式工,从Java开发到私有云运维:我的职场逆袭之路
3391
8
...
实习,别太较真
3119
9
...
卷王的风气还是吹到了实习
2868
10
...
滴滴提前批一面
2621
创作者周榜
更多
正在热议
更多
#
如何提高实习转正率?
#
10537次浏览
154人参与
#
打工人的工作餐日常
#
50649次浏览
392人参与
#
26届的你们有几段实习?
#
36355次浏览
410人参与
#
追觅科技求职进展汇总
#
17435次浏览
119人参与
#
月薪多少能在一线城市生存
#
19038次浏览
251人参与
#
哪些公司真双非友好?
#
14616次浏览
80人参与
#
你后悔自己读研吗?
#
15264次浏览
219人参与
#
你以为的实习VS真实的实习
#
21067次浏览
195人参与
#
双非能在秋招上岸吗?
#
220402次浏览
1166人参与
#
你认为哪些项目算烂大街?
#
14700次浏览
256人参与
#
机械校招之路总结
#
93200次浏览
1893人参与
#
非技术2023笔面经
#
248040次浏览
2411人参与
#
当下环境,你会继续卷互联网,还是看其他行业机会
#
116615次浏览
807人参与
#
你觉得技术面多长时间合理?
#
98385次浏览
713人参与
#
你被哪些公司秒挂过?
#
27457次浏览
230人参与
#
最难的技术面是哪家公司?
#
8085次浏览
68人参与
#
网申一定要掌握的小技巧
#
10399次浏览
66人参与
#
找工作时的取与舍
#
82255次浏览
588人参与
#
拼多多求职进展汇总
#
649032次浏览
5189人参与
#
海康威视求职进展汇总
#
489340次浏览
3619人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务