首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
牛客174243101号
复旦大学 数据分析师
发布于上海
关注
已关注
取消关注
@Grace13:
数据分析必问题——AB实验(2)
在上一篇文章中,我主要介绍了AB实验是什么、运用场景以及如何设计和评估实验,在这篇文章中,我主要介绍AB实验中经常被问到的一些问题,我大致将这些问题分为两类:1.统计学相关问题重点考察统计学知识第一类错误和第二类错误是什么?两者有关系吗?应该控制第一类错误还是第二类错误?假设检验的基本原理是啥?p值是什么?2.实操的问题重点考察是否对AB实验的实际运用有一定了解说一下AB实验的流程?AB实验底层用到哪些检验方法?各类方法分别适用于哪些场景?如何保证或者检验流量分配是否合理?为什么实验有效果,全量上线后没有效果(或者反向)?实验结果不显著怎么办?实验样本量不足怎么办?实验运行中可以新增实验组吗?3.部分问题答案 1)实验分组需要注意些什么?实验单一变量原则:保证对照组和每个实验组间 “有且仅有一个变量”,以确保对实验效果进行准确归因或量化;保证分流均匀随机:可通过AA实验帮助检验分组的随机性 2)如何确定实验指标?核心指标:实验最想要提升的指标,公司或者业务的核心指标,比如日活、营收或时长;观察指标:包含实验会直接影响的过程指标,以及实现最终指标所需要的关键环节指标,比如某个功能的曝光量或者转化率;全局指标:包含实验策略可能带来的一些负向影响,比如有些策略可能会损害用户体验,导致用户流失,可以看卸载率指标,还包含一些实验可能带来的正向效果评估指标,是策略好坏的直接评价,比如留存率、点击率等。 3)如何确定实验所需的样本量? 理论上,样本量越多越好;现实操作中,样本量应该越少越好(置信前提下),更大的样本量和更长的实验周期能获得更大的统计功效(power)和更准确的测试。根据「实验核心观测指标预计的变动量」、「指标方差」、「实验允许犯第一类错误和第二类错误的概率」来确定所需的最小样本量,Z检验下的样本计算量公式如下: 不同检验所需要的样本量计算方式不同,具体场景需要具体分析。样本量公式推导是通过假设检验中对统计功效(Statistical power)的计算推导而来,具体推导公式不在这儿展开,数据分析面试一般不会深入展开。 4)AB实验中第一类错误、第二类错误和统计功效分别是什么?原假设:A组和B组无显著差异备择假设:A组和B组有显著差异第一类错误:去真,原假设为真,拒绝原假设。A和和B组本身无差异,但实验结论是有差异。第二类错误:取伪,原假设为假,没拒绝原假设。A组和B组本身有差异,但实验结论是没有差异。统计功效:当原假设为假,拒绝原假设的概率,也就是【1-犯第二类错误的概率】。A组和B组有差异且实验结论是有差异。样本量一定的情况下,第一类错误和第二类错误有着此跌彼涨的关系,具体应该控制第一类错误还是第二类错误需要视情况而定,看哪类错误的成本更高。 5)实验观察周期如何确定?至少一周,以便不同活跃周期的用户都能被观测到,比如有的用户习惯工作日活跃,有的用户习惯周末活跃;排除新奇效应的影响,对于一些前段UI更改实验,用户很容易感知到,实验前期用户可能出于好奇心会去体验,这时候观测的指标其实是有偏的,一段时间后新奇效应消失后,实验的效果才会趋于稳定,因此针对这一类型的实验需要一个较长周期的观测来避免新奇效应;观测核心指标在实验后的变动趋势,当核心指标变动相对稳定时才能关闭实验。[yeah]关注我,下一篇会继续补充关于AB实验的高频问题~欢迎大家评论区讨论~大家后续想了解数据分析或者商业分析哪些方面的内容可以再评论区留言告诉我哦~🍻一起成长吧~
点赞 17
评论 1
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
昨天 23:41
已编辑
中南大学 Java
AI是牛马打工人的天敌
有个真相可能不符合大家的认知:AI不是牛马打工人的好朋友,而是打工人的天敌。原因很简单:AI让管理者重新思考员工的工作价值,可裁可不裁者必裁。打工人真正应该关心的从来就只有自己在老板心中的工作价值。这其中还有个认知的代沟:假如一个人在之前完成一件工作要5天,ai提效后现在只要3天,但是老板觉得现在ai这么强大,半小时就应该搞完的事你为什么还是要用这么久?是不是你不会用ai?不肯懂脑子去学习ai?企业这样子下去会不会被淘汰?再代入老板的视角:ai这么强,原来3个人才能完成的事现在1个人就能搞定,那公司为什么还要留着2个闲人?一个冷知识:一个员工的企业用工成本大概是他薪资的1.4倍,裁员后会把用工...
点赞
评论
收藏
分享
05-07 10:09
蚌埠坦克学院 嵌入式软件开发
嵌入式面试常考八股文汇总
嵌入式岗位面试中,除了项目经历,面试官也很喜欢围绕基础知识、单片机原理、RTOS、通信协议、Bootloader、C语言底层细节等内容展开提问。下面给大家整理了 40 个嵌入式面试高频题目,适合用来查漏补缺、系统复习。一、C语言与基础知识volatile 关键字的作用是什么?哪些场景必须使用?const 和 #define 的区别是什么?指针和数组的区别是什么?malloc、calloc、realloc 的区别是什么?结构体内存对齐的原理是什么?为什么要进行内存对齐?大端模式和小端模式有什么区别?如何判断当前平台的字节序?static 关键字在局部变量、全局变量、函数中分别有什么作用?什么是野...
点赞
评论
收藏
分享
04-01 17:56
南开大学 Web前端
腾讯为什么一直挂我 然后秒捞
要招就招,每次一脚踢开,挂完一两小时后 发面试邀请,我又乖乖接受 还有机会吗
recul:
我们鹅孝子是这样的。我已4战腾讯
点赞
评论
收藏
分享
04-02 20:03
字节跳动_DA(实习员工)
暑期结束,字节offer的战线太长了
Timeline3.5一面3.8 二面3.12 三面3.18 hr面4.2 offer
嵌入式的小白:
战线长归长,至少是有个好结果
点赞
评论
收藏
分享
05-04 17:22
已编辑
兰州大学 C++
某量化1面
各种拷打项目,由于和之前实习岗位挺类似的,拷打的很细 C++中,unordered_map和普通的map有什么区别? unordered_map什么时候触发扩容(rehash)?解决哈希冲突的算法是什么? 首先明确哈希的本质目标——将键(key)快速映射到存储位置(数组索引)。实现步骤可分为四层: (1)定义键值对结构; (2)设计哈希函数,将key转为非负整数索引; (3)处理哈希冲突(多个key映射到同一索引); (4)当负载因子(load factor = 元素数 / 数组长度)超过阈值(如0.75)时,触发扩容与重哈希(rehashing),保证性能稳定。 重哈希的过程(以链...
查看9道真题和解析
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
毕业啦!我们要一起去广州打拼啦!
1.7W
2
...
毕业了,有些话只能藏在心里了
1.4W
3
...
2026春招到底卷成什么样了?填问卷说出真相,最高领200元现金红包
1.2W
4
...
字节 中国交易与广告 后端一面
1.1W
5
...
211本,130投0面,agent应用开发,简历求助!
7959
6
...
从阿里被裁到快手升P6,我花了四年
7933
7
...
别人:阿里 字节 腾讯
7042
8
...
在携程的一天
6477
9
...
从腾讯到阿里感,谢一路走来的自己
5535
10
...
华为暑期实习
5153
创作者周榜
更多
正在热议
更多
#
这个offer值得去吗?
#
32091次浏览
232人参与
#
校招薪资来揭秘
#
960959次浏览
4063人参与
#
在爱玛,骑向未来
#
20474次浏览
395人参与
#
如果春招能重来,我会___
#
29633次浏览
296人参与
#
24秋招避雷总结
#
1020274次浏览
7098人参与
#
你会因为行情,降低找工作标准吗?
#
45455次浏览
328人参与
#
机械人还在等华为开奖吗?
#
339272次浏览
1652人参与
#
米哈游求职进展汇总
#
688779次浏览
3348人参与
#
华为池子有多大
#
178170次浏览
931人参与
#
26届春招投递记录
#
8735次浏览
72人参与
#
25届网易互娱暑实进度
#
109127次浏览
802人参与
#
通信/硬件求职避坑tips
#
172121次浏览
1170人参与
#
记录我的毕业季
#
4797次浏览
120人参与
#
机械人,你的秋招第一份简历被谁挂了
#
268828次浏览
2451人参与
#
远程面试的尴尬瞬间
#
363925次浏览
2062人参与
#
大学最后一个寒假,我想……
#
103331次浏览
846人参与
#
机械求职避坑tips
#
103713次浏览
589人参与
#
你认为小厂实习有用吗?
#
145096次浏览
763人参与
#
运营商笔面经互助
#
219680次浏览
1833人参与
#
美团秋招笔试
#
216459次浏览
1192人参与
#
网易求职进展汇总
#
213205次浏览
1524人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务