首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
数据攻略有六哥
北京航空航天大学 数据分析师
关注
已关注
取消关注
AB实验中评估指标傻傻分不清 | AB系列(六)
@数据攻略有六哥:
DA/DS/BI 必考AB实验知识点
哈喽大家好,我是六哥~最近在面试中我发现一个共性问题:虽然关于AB实验的基础原理、步骤大家了然于胸但只要问到一些稍微深的东西,例如:AB实验中评估指标的相关细节很多人的回答多少还是差那么点意思之前已分享过『AB实验』系列专题(见主页往期分享):数据分析岗 | AB实验框架+高频考点(一)【数据分析岗】| AB实验之方案设计(二)数据分析岗 | AB实验之实验分流(三)AB高频考点!大白话讲懂『多重检验』常被忽略的『AA测试』| AB系列(五)概率论系列考点 — 统计功效 | 最小样本量本篇,咱就来唠一唠AB实验中常见指标分类有哪些?咋用?内含注意事项tips,可收藏慢看[yeah]------正文手动分割线------本文结构速览:一、搞清概念二、计算差异三、选择原则四、注意事项&case自查💡一、搞清概念AB实验中的常见指标,按照业务方式分类:目标指标:又被称为北极星指标,即一般是公司业务核心KPI驱动指标:又被称为间接指标,与目标指标之间在逻辑上有因果关系,但比它更快更灵敏护栏指标:顾名思义,作为“保护型”指标,是每个测试都需要观察的指标,一般有两种类型:保证目标指标不会违背重要的限制:一般为衡量用户不好体验的指标,如加载率、崩溃率等等,一般而言不能对其有显著负向影响才可以评估实验结果的可信赖度和内部有效性:常见的如SRM,如若出现问题实验中其他指标评估结果基本不可信如果按照统计类型分类:计数求和型:即样本的指标之和,比如有uv、pv、总时长复合计算型:均值类、比例类、比率类均值类:即样本的均值,如uv价值、人均时长比例类:即每个样本服从二项分布,如用户点击率、用户购买转化率比率类:即两类指标的比值,如pv点击率、ROI等等二、计算差异在抛公式前,需要有个大致概念:一般情况下,不同指标的差异主要体现在假设检验时方差的计算方式上。这是因为不同指标的计算方法往往考虑了不同的信息,从而导致了方差的计算方式也会有所不同。因此,正确估计指标的方差是获得可靠的实验结果的前提。在实际业务中,常用的是参数检验中关于均值类、比例类 这类统计量的组间差异检验。另外,多说一嘴:有关计数求和型指标,只有当实验对照组样本一致的情况下,这类绝对值指标的对比才更具意义,否则还是需要转换成以上指标才可以对比。讲具体每个指标的差异前,抛出一张脑图,供大家概览:▌均值类:均值类指标是基于正态分布做计算大多数情况下,样本充足,选用Z检验:(因假设实验对照组均值分布无差异,即:u1-u2=0)▌比例类:比例型指标是基于伯努利分布做近似计算:如果实验对照组样本比例相同,即:▌比率类:如上,无论是均值类指标的检验采用正态分布计算方差,还是比例型指标的检验采用二项分布方式计算方差,其实这里有个适用前提假设,即:需要满足样本独立同分布但这里比率型指标是不满足的。AB测试一般在用户层面进行随机化分流,如若指标的分析单元不是用户,例如pv点击率,是点击pv/曝光pv,这里分析单元中的每个曝光Yi可能来源同一个用户,各样本点不满足独立性,所以方差计算需要做下修正,不可以直接套用。关于这类指标,业界常用的方式例如有:delta method进行修正,或者bootstrap方式计算方差的无偏估计。① Delta method:优点:计算简便,需满足一些基本假设,大多数情况下即可利用一阶泰勒展开,在很低的计算成本下获得准确的方差估计,效率更高缺点:仅适用于大样本,且对统计量形式有限制② bootstrap方式:优点:形式简单,容易理解,适合任一统计量,且对样本量没有限制缺点:成本高,耗时长,需要较大算力来支持重抽样次数其中Delta method方式,计算修正后的样本方差:ps.有关此方法的推导感兴趣可私信留言~三、选择指标原则通常情况下,在实际工作中,大多数人会按照过往经验或者业务感觉来选择实验评估指标,虽然很少出现问题,但还是需要清楚底层关键需要满足以下几个原则:易懂性:指标是为了反应某种事物和现象的一种量化方式,所以需要容易理解且可衡量实验效果一致性:需要和AB实验采取策略的目标保持一致,方便衡量干预措施和数据结论有一定因果逻辑灵敏性:AB实验本质是为了利用数据驱动的方式为业务策略探路验证用的评估方法,倘若选取的指标很难检测到差异,可能会错失增长良机,或者没及时发现问题止损而付出更大代价,所以需要选取的实验指标保证灵敏性四、注意事项▌指标个数指标不在多,否则会出现多重检验的问题,置信度会下降。(详见👉:AB高频考点!大白话讲懂『多重检验』)最好先有预期目标,制定评估标准以及预计提升值,而后AB实验更多发挥的是因果验证作用。▌指标识别指标计算时要注意:随机分流的实验单元和分析单元需保持一致,否则不满足假设检验中的前提条件:独立性。如果不满足,则需要对方差计算进行修正,否则检验结论出错概率较大。▌case自查:实验组和对照组uv价值的相对差异,是否可以用传统计算方差方式?答案:不可以,需要进行方差修正。提示:可以将该指标列出,观察分母:对照组的uv价值是常数还是随机变量,可以发现新的统计量需要计算的是实验对照组uv价值比值的方差,即需要用到比率型指标的估计方差方式。以上就是为大家分享的AB实验中关于:评估指标差异的定义、分类、注意事项面试官亲自出的『56道AB实验真题』,求职不迷茫
点赞 4
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
04-20 21:54
门头沟学院 Java
简历上体现AI能力,这么写才不踩坑
现在找工作,不管是后端、算法还是运营,简历上不写点AI能力都不好意思投,但很多人写得太笼统,要么是“会用AI工具”,要么是“熟悉AI相关技术”,等于白写,HR根本不看!翻了一圈网友分享的干货,总结了几个实测有用的技巧。首先,千万别写空话!网友都在吐槽,“熟悉LLM、会用LangChain”这种话,等于没说,HR每天看几百份简历,根本没耐心猜你的能力。正确的写法是:问题→方案→结果,还要加可量化指标。比如你做过AI相关项目,别写“用AI做了知识库问答系统”,要写“利用RAG技术+LangChain搭建行业知识库问答系统,解决业务咨询效率低的问题,将咨询响应时间缩短60%,减少人工回复工作量30%...
简历上如何体现你的“AI...
点赞
评论
收藏
分享
04-22 21:21
门头沟学院 测试工程师
"普通"和"理所当然"是什么呢?
最近也是很依旧倒霉,求职到处碰壁和失败,最终病急乱投医选了一家,明知有坑,但依然往里面栽进去,没想到越栽越深,以至于我没有办法承受这样最终的结果。 在与HR的沟通当中,我已多次确认办公地点是否在A点,后续是否会涉及出差或地点变动类似的调整,她的回答是"都是在那边,基本没有出差",所有入职流程办完之后,到岗当天PM告诉我,后续每天的工作都会在B点进行,而我完全不知道这一回事,HR反馈的信息全是错误的,我租的房子离A大概3-4公里左右,而且城市地铁也不像广深这么发达,出行完全只能靠电动车和汽车,巴士也是少得可怜,原本接受的通勤时间是在40分钟以内,现在直接变成了来回走完,需要整...
如果再来一次,你还会选择...
点赞
评论
收藏
分享
04-19 18:50
已编辑
字节跳动_全栈开发(实习员工)
学院二本圆梦字节,提前结束暑期啦
个人背景:学院二本计科专业 大二开始实习个人经历:安克创新 、理想汽车、字节跳动碎碎念:我做事只有三分钟热度。看到进了大厂的同学,我会羡慕,也会跟着努力上进;但遇到好看的小说,我又会放下手头的事沉迷其中,之前的坚持也就中断了。我有些自卑,总觉得自己学历和外貌都不够好。之前偶然在网上受到关注,我就喜欢上了上网,因为这里有很多人认可我。但我也很在意别人的评价,偶尔看到嘲讽的言论,会触发我的自卑情绪,让我感到愤怒。有时候我会强硬地回怼,有时候又会懦弱地选择无视。我也有虚荣心。不管是拿到安克、理想还是字节的机会,我在分享的时候都会带着这份心思。我会特意强调自己学历不好,是为了衬托出过程的艰难,以此显得自己更厉害。我知道,人往往会炫耀自己缺少的东西,来掩盖内心的空洞。我总想着走捷径,不太喜欢踏踏实实地做事。找实习的时候,我花了更多时间在研究面试技巧上,而不是提升专业能力。我会反复听面试录音分析技巧,看面试教程学习怎么和不同的面试官沟通,还会每天自言自语练习语言表达,同学都觉得我有点奇怪。我的实习生涯里,侥幸和运气占了很大一部分。我总在想,如果有一天我失去了这份幸运,这些特质可能会让我一蹶不振。ps: 很多人会问我学习路线和经验 但是就像我上面说的 我的实习过程靠的很多是关键节点的运气 技术上面我可能不如很多人 所以请大家理性求助和理性参考我的回答 附上我的投递记录
我的offer在哪里...:
从去年看到现在,飞升哥就是榜样
我的求职进度条
点赞
评论
收藏
分享
04-20 20:55
西安电子科技大学 算法工程师
字节内容消费团队一面
1.自我介绍2.论文拷打3.手撕题:(面试官已经不知道问啥了,让我先写个题,他再想想问什么)给定一个数组和k,问能不能把这数组换分成k份,每份的总和都相同。(想到问什么了)4.transformer的多头是如何划分的5.讲讲位置编码有哪些6.讲讲diffusion的原理,flow matching了解吗讲讲,ODE呢?(ODE是啥,可能没听清,反问了下ODE的全称 他说他也不清楚)(有可能是我听错了)7.Qwen Image-Edit讲讲(不知道,只用过)反问:1.业务2.手撕题的算法优化(我用的dfs+剪枝,面试官说应该可以用状压,不会)3.面试整体评价(面试官说字节大部分面试官看重聪明度+...
查看7道真题和解析
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
1
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
前端手撕总结
1.1W
2
...
放弃其他大厂,我为什么选择携程机票BU?
8268
3
...
第一次面试被压力了,以为是kpi
2718
4
...
得物后端AI面
2641
5
...
地狱四月
2500
6
...
你总挂在同一轮,其实是因为...
2431
7
...
我的前途全被学校毁了!!!
2153
8
...
28届双非本oc鹅厂
1989
9
...
25届入职互联网大厂的老登,总结了几点心里话
1653
10
...
最近在做Agent面试,我发现了很多共性的问题...
1466
创作者周榜
更多
正在热议
更多
#
你的实习产出是真实的还是包装的?
#
74210次浏览
594人参与
#
你是怎么和mt相处的?
#
102006次浏览
496人参与
#
华泰星战营,提前锁定校招offer
#
13804次浏览
389人参与
#
打工人的工作餐日常
#
96085次浏览
550人参与
#
拼多多集团-PDD笔试
#
86852次浏览
594人参与
#
网易游戏雷火笔试
#
11576次浏览
108人参与
#
26届秋招投递记录
#
123529次浏览
683人参与
#
招银网络科技(深圳)有限公司成都分公司笔试
#
5159次浏览
20人参与
#
毕业论文怎么查AI率
#
85436次浏览
1963人参与
#
网易笔试
#
171583次浏览
812人参与
#
简历上如何体现你的“AI”能力?
#
17581次浏览
383人参与
#
找不到大厂实习可以去小厂吗?
#
23383次浏览
279人参与
#
你总挂在第__面?
#
12610次浏览
150人参与
#
哪些AI项目值得做?
#
27535次浏览
663人参与
#
如何准备秋招
#
81902次浏览
871人参与
#
0offer互助地
#
770180次浏览
4725人参与
#
实习时最怕听到的一句话
#
24331次浏览
226人参与
#
多益网络工作体验
#
70135次浏览
312人参与
#
没有面试的日子里,你在做什么
#
15119次浏览
388人参与
#
秋招被挂春招仍然能投的公司
#
31809次浏览
241人参与
#
秋招开始捡漏了吗
#
244598次浏览
1058人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务