首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
数据攻略有六哥
北京航空航天大学 数据分析师
关注
已关注
取消关注
AB实验中评估指标傻傻分不清 | AB系列(六)
@数据攻略有六哥:
DA/DS/BI 必考AB实验知识点
哈喽大家好,我是六哥~最近在面试中我发现一个共性问题:虽然关于AB实验的基础原理、步骤大家了然于胸但只要问到一些稍微深的东西,例如:AB实验中评估指标的相关细节很多人的回答多少还是差那么点意思之前已分享过『AB实验』系列专题(见主页往期分享):数据分析岗 | AB实验框架+高频考点(一)【数据分析岗】| AB实验之方案设计(二)数据分析岗 | AB实验之实验分流(三)AB高频考点!大白话讲懂『多重检验』常被忽略的『AA测试』| AB系列(五)概率论系列考点 — 统计功效 | 最小样本量本篇,咱就来唠一唠AB实验中常见指标分类有哪些?咋用?内含注意事项tips,可收藏慢看[yeah]------正文手动分割线------本文结构速览:一、搞清概念二、计算差异三、选择原则四、注意事项&case自查💡一、搞清概念AB实验中的常见指标,按照业务方式分类:目标指标:又被称为北极星指标,即一般是公司业务核心KPI驱动指标:又被称为间接指标,与目标指标之间在逻辑上有因果关系,但比它更快更灵敏护栏指标:顾名思义,作为“保护型”指标,是每个测试都需要观察的指标,一般有两种类型:保证目标指标不会违背重要的限制:一般为衡量用户不好体验的指标,如加载率、崩溃率等等,一般而言不能对其有显著负向影响才可以评估实验结果的可信赖度和内部有效性:常见的如SRM,如若出现问题实验中其他指标评估结果基本不可信如果按照统计类型分类:计数求和型:即样本的指标之和,比如有uv、pv、总时长复合计算型:均值类、比例类、比率类均值类:即样本的均值,如uv价值、人均时长比例类:即每个样本服从二项分布,如用户点击率、用户购买转化率比率类:即两类指标的比值,如pv点击率、ROI等等二、计算差异在抛公式前,需要有个大致概念:一般情况下,不同指标的差异主要体现在假设检验时方差的计算方式上。这是因为不同指标的计算方法往往考虑了不同的信息,从而导致了方差的计算方式也会有所不同。因此,正确估计指标的方差是获得可靠的实验结果的前提。在实际业务中,常用的是参数检验中关于均值类、比例类 这类统计量的组间差异检验。另外,多说一嘴:有关计数求和型指标,只有当实验对照组样本一致的情况下,这类绝对值指标的对比才更具意义,否则还是需要转换成以上指标才可以对比。讲具体每个指标的差异前,抛出一张脑图,供大家概览:▌均值类:均值类指标是基于正态分布做计算大多数情况下,样本充足,选用Z检验:(因假设实验对照组均值分布无差异,即:u1-u2=0)▌比例类:比例型指标是基于伯努利分布做近似计算:如果实验对照组样本比例相同,即:▌比率类:如上,无论是均值类指标的检验采用正态分布计算方差,还是比例型指标的检验采用二项分布方式计算方差,其实这里有个适用前提假设,即:需要满足样本独立同分布但这里比率型指标是不满足的。AB测试一般在用户层面进行随机化分流,如若指标的分析单元不是用户,例如pv点击率,是点击pv/曝光pv,这里分析单元中的每个曝光Yi可能来源同一个用户,各样本点不满足独立性,所以方差计算需要做下修正,不可以直接套用。关于这类指标,业界常用的方式例如有:delta method进行修正,或者bootstrap方式计算方差的无偏估计。① Delta method:优点:计算简便,需满足一些基本假设,大多数情况下即可利用一阶泰勒展开,在很低的计算成本下获得准确的方差估计,效率更高缺点:仅适用于大样本,且对统计量形式有限制② bootstrap方式:优点:形式简单,容易理解,适合任一统计量,且对样本量没有限制缺点:成本高,耗时长,需要较大算力来支持重抽样次数其中Delta method方式,计算修正后的样本方差:ps.有关此方法的推导感兴趣可私信留言~三、选择指标原则通常情况下,在实际工作中,大多数人会按照过往经验或者业务感觉来选择实验评估指标,虽然很少出现问题,但还是需要清楚底层关键需要满足以下几个原则:易懂性:指标是为了反应某种事物和现象的一种量化方式,所以需要容易理解且可衡量实验效果一致性:需要和AB实验采取策略的目标保持一致,方便衡量干预措施和数据结论有一定因果逻辑灵敏性:AB实验本质是为了利用数据驱动的方式为业务策略探路验证用的评估方法,倘若选取的指标很难检测到差异,可能会错失增长良机,或者没及时发现问题止损而付出更大代价,所以需要选取的实验指标保证灵敏性四、注意事项▌指标个数指标不在多,否则会出现多重检验的问题,置信度会下降。(详见👉:AB高频考点!大白话讲懂『多重检验』)最好先有预期目标,制定评估标准以及预计提升值,而后AB实验更多发挥的是因果验证作用。▌指标识别指标计算时要注意:随机分流的实验单元和分析单元需保持一致,否则不满足假设检验中的前提条件:独立性。如果不满足,则需要对方差计算进行修正,否则检验结论出错概率较大。▌case自查:实验组和对照组uv价值的相对差异,是否可以用传统计算方差方式?答案:不可以,需要进行方差修正。提示:可以将该指标列出,观察分母:对照组的uv价值是常数还是随机变量,可以发现新的统计量需要计算的是实验对照组uv价值比值的方差,即需要用到比率型指标的估计方差方式。以上就是为大家分享的AB实验中关于:评估指标差异的定义、分类、注意事项面试官亲自出的『56道AB实验真题』,求职不迷茫
点赞 4
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
04-24 19:01
湖南农业大学 产品经理
双非渣本的逆袭:最后两周,我是怎么把简历匹配度从20%干到80%的
兄弟们,别刷了,说的就是你还在牛客上刷面经、背八股?还在为0 offer焦虑到睡不着?我,双非一本,计算机专业,GPA 3.2,一个像样的大厂实习都没有。就在上个月,我的状态跟你们现在一模一样。海投了30多家,笔试做了一堆,面试就进了3次,全挂了。那感觉,真的,每天睁眼就是绝望。直到我悟了。我发现我们很多人,包括当时的我,都陷入了一个致命的误区:我们以为求职是考“实力”,其实它考的是“匹配度”。你算法题刷得再溜,八股文背得再熟,如果你的简历上没写,或者写得不对,HR连让你笔试的机会都不会给。大厂HR一天看几百份简历,一份简历平均停留时间不到10秒。他不是在找“最优秀”的人,他是在找“最匹配”的...
你的秋招简历被谁挂了?
点赞
评论
收藏
分享
04-24 14:01
门头沟学院 Java
能让双非bg拿下offer的AI项目有什么特点?
先交代背景:双非院校,非科班。无大厂实习,没有顶会论文。秋招时拿到了一家互联网公司AI应用开发的offer。回过头看,我能从前几轮面试中突围出来,最大的筹码就是我亲手做出来的那个AI项目。我把我做这个项目的完整思路和心法分享给大家,希望对牛友们有所帮助。一、我靠它突围的那类项目长什么样先说说我选的这类项目有什么特征——它不是一个具体的项目,而是一类具备“面试穿透力”的项目模板。它具备这四个特征:真实问题 + 落地闭环 + 技术亮点 + 量化结果。我再具体展开一下这四个特征。1. 做真实场景的小应用——不要做空中楼阁面试官一天的面试会听无数个“我开发了一个系统用于……”,而你的项目一旦让他觉得“...
哪些AI项目值得做?
点赞
评论
收藏
分享
04-24 11:10
已编辑
荆州职业技术学院 Java
暑期完结!
本人bg双非➕百度实习,经过漫长的两个月在职求职,暑期终上岸字节,在这里感谢节子收留以下是一些timeline:3.5 米哈游一面 凉3.10 字节飞书一面 凉3.17 腾讯teg一面 凉3.17 京东支付一面 凉3.25 字节国际化广告一面 几天后告知过4.7 腾讯数据计算平台一面秒过4.8 字节国际化广告二面 面完秒挂秒捞4.9 美团一面 凉4.9 腾讯数据计算平台二面完到hr面,泡了几天一直没约hr面然后流程结束,这是最难受的一个4.13 字节国际化一面秒过4.15 快手主站一面挂4.17 字节国际化二面面完过一会告知通过4.23 字节正式offer从以上总结早期准备的实在不足,对于八股对于简历上实习内容准备的都不够充分,所以许多倒在了一面,后面面着面着才慢慢进入状态,可能也由于在职面试的原因吧,一边上班一边复习实在痛苦,本来想着找不到就继续赖着百度,其实到最后活也不想干,面试准备的也不充分,也算给自己一个教训吧,最好时时刻刻准备好面试的状态,八股算法不能停,祝🐮友暑期也一切顺利!
励志成为双港第一ja...:
太强了大佬,我想问一下如果在职的话怎么面试啊
点赞
评论
收藏
分享
04-20 16:24
北京大学 Java
AI员工推荐系统小程序 AI员工推荐系统是应用程序开发属于用户开发层面的三级应用程序开发
AI员工推荐系统小程序AI员工推荐系统是应用程序开发属于用户开发层面的三级应用程序开发。每个用户的系统操作情况提供消费市场推荐消费电子商场商城区域模块组建不同的系统消费群体。 2019年碧桂园集团博智林机器人建筑研究院人脸速通门后端主程序。业务使用中间件和C++项目组消息队列技术通信采集硬件人脸机器扫描仪器每天的人脸扫描数据。区域配置情况设备监控情况员工打卡情况智慧园区建设情况6个月项目组平台组成一个版本测试上线。参考华为智慧园区区块链接开始分配社区软件操作平台开发开发开放接口平台。 下一代数据架构主流系统内部程序员主要使用sql编程。开发平台接入时尚流行的NoSQL数据库承接一部分开放平台产...
Java技术
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
1
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
求问:有没有真的能上手做大模型/Agent的实战项目?
2.5W
2
...
巨人网络游戏开发一面面经
1.1W
3
...
#网易游戏雷火笔试#题量好大,个人能力原因吧,现想现写好多没有写完...
3238
4
...
游戏客户端的碎碎念
2714
5
...
最近在做Agent面试,我发现了很多共性的问题...
2321
6
...
我的前途全被学校毁了!!!
1617
7
...
地狱四月
1479
8
...
腾讯云智HR面多久出结果呀?
1468
9
...
腾讯云智二面挂
1365
10
...
#拼多多集团-PDD笔试#a出4道题 累爆,第三题太难了
1307
创作者周榜
更多
正在热议
更多
#
你和你的mentor相处模式是__
#
1854次浏览
10人参与
#
如果公司降薪,你会跳槽吗?
#
159907次浏览
931人参与
#
华泰星战营,提前锁定校招offer
#
16701次浏览
738人参与
#
实习第一天,你在干什么
#
1437次浏览
8人参与
#
机械人与华为的爱恨情仇
#
158351次浏览
1053人参与
#
你会因为行情,降低找工作标准吗?
#
934次浏览
9人参与
#
联宝杯大学生创新大赛,你的技术值得产业级答案
#
15606次浏览
316人参与
#
联想求职进展汇总
#
356181次浏览
2262人参与
#
华为工作体验
#
321843次浏览
1407人参与
#
0offer互助地
#
771982次浏览
4746人参与
#
你是怎么和mt相处的?
#
102799次浏览
507人参与
#
非技术2024笔面经
#
501659次浏览
5037人参与
#
26年哪些行业会变好/更差
#
66105次浏览
534人参与
#
蚂蚁求职进展汇总
#
170801次浏览
1291人参与
#
打工人的工作餐日常
#
96815次浏览
558人参与
#
你总挂在第__面?
#
14072次浏览
161人参与
#
工作不开心辞职是唯一出路吗
#
18482次浏览
60人参与
#
简历上如何体现你的“AI”能力?
#
19006次浏览
395人参与
#
外出实习被同学举报
#
27528次浏览
100人参与
#
拼多多集团-PDD笔试
#
89233次浏览
600人参与
#
哪些AI项目值得做?
#
29051次浏览
684人参与
#
找不到大厂实习可以去小厂吗?
#
24435次浏览
282人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务