mark
TimeLine:一面20211102当时的BG:北邮本硕,管理类专业,一段实习经历:美团商业分析师写在前面的话:该文档记录日常实习面试的相关问题,面试时间为2021年。以下问题的答案可能存在错误,敬请读者批评指正一面1. 介绍一下假设检验假设检验是用来判断样本与样本之间的差异究竟是抽样误差导致还是存在本质差别的统计推断方法,本质上是反证法(证实一个命题需要穷尽所有可能,证伪一个命题只需要一个反例)1)需要先构造原假设和备择假设,其中,原假设是”差异是抽样误差所致“(例如AB测试中:”新功能/新策略没有效果“),备择假设是”差异是因为存在本质差别“(例如AB测试中:”新功能/新策略有效果“)2)根据样本情况构造合适的统计量3)根据样本数据计算统计量的值,根据显著性水平判定是否落入拒绝域内,若落入拒绝域,则根据小概率原理(小概率事件一般不会发生,如果我们观察到某一事件发生了,则说明这个事件不是小概率事件)拒绝原假设2. 简要介绍一下AB测试为了科学合理地评价产品的新功能或新的产运策略可否上线,应从大盘中命中一定比例的用户,使用合理的分流机制将命中的用户尽可能均匀地分配到不同的组内,其中,体验线上配置的用户群体被称为”对照组“,体验新功能的用户群体被称为”实验组“,在相同的观察周期内,观察对照组和实验组在关键的业务指标和性能指标上的显著差异,根据观察结果来判断新功能能否上线3. 简述一下p值的概念定义1:根据检验统计量的样本观察值得出的概率,此概率为原假设可被拒绝的最小显著性水平本质上是一种概率,可以由统计量的样本观察值计算出来,与显著性水平作比较时可以得出拒绝/不拒绝原假设的判断,这种检验方法也被称为p值法(1.中所介绍的是临界值法)定义2:当原假设为真时,比所得到的样本观察结果更极端结果出现的概率拿抛硬币为例子,假设A手上有一个两面都是字的硬币,想通过抛硬币的方式让B来猜自己手上的硬币是不是正常硬币(指一面字一面花)B作假设检验,原假设为”硬币正常“,备择假设为”硬币不正常“当抛硬币抛到第5次时,概率已经很小了(甚至小于显著性水平0.05),则B可根据小概率原理拒绝原假设(如果硬币是正常的,那么”连续出现5次字“的概率非常低,若实验时观察到”连续5次字“的现象,则说明”连续5次字“不是小概率事件,因此拒绝原假设”硬币是正常的“)这里的概率就是我们通常所说的p值,联动定义2再理解一遍:当原假设为真(硬币正常)时,比所得到的样本观察结果更极端结果出现的概率(连续出现5次及以上次字的概率),一旦观测到”连续出现5次及以上次字“这一现象,则根据小概率原理拒绝原假设4. SQL考察数据表:用户关注表user,字段有:user_id '用户id',target_user_id'关注用户的id'1)互关的人数 with a as ( select t1.user_id from user t1 where exists (select 1 from user t2 where t1.user_id = t2.target_user_id and t1.target_user_id = t2.user_id  ) ) select count(user_id) / 2 from a2)粉丝量在10-100的用户select target_user_idfrom usergroup by target_user_idhaving(count(user_id)) between 10 and 1005. SQL中partition by和group by的区别1)从SQL的执行顺序来看group by的执行顺序优先,partition by是在select子句中2)group by只保留参与分组字段和聚合函数的结果,partition by可保留所有字段,并给出针对某字段的窗口函数结果6. 简述一下一类错误和二类错误的概念?注:建议画图进行辅助讲解一类错误:原假设H0为真时,作出”拒绝原假设“的错误决策,也被称为弃真错误二类错误:原假设H0为假时,作出”接受原假设“的错误决策,也被称为取伪错误该图出自贾俊平、何晓群、金勇进编著的《统计学(第7版)》第158页(a)图中,阴影部分为一类错误,概率大小等于显著性水平α;(b)图中,阴影部分为二类错误,概率大小通常命名为β,非阴影部分面积为1-β,通常命名为统计功效由上图可知,一类错误的概率由显著性水平α决定,减小显著性水平会降低一类错误概率(即拒绝域向右移动,(a)图中阴影部分面积减小),但会提升二类错误概率(拒绝域向右移动,(b)图中阴影部分面积增大)7. 如何降低二类错误?1)降低置信度,提高显著性水平(但这样会提高一类错误概率)2)增大数据量,减小方差,进而提升统计功效,降低二类错误概率3)在保证样本量不变的前提下,增大MDE(Minimum Detectable Effect,最小检测效应,被定义为期望观察到的最小差异)将会提升统计功效,降低二类错误概率MDE的概念参见下图:8. 请简述一下t检验、z检验和方差分析的区别?先区分t检验和z检验,区别在于构造不同的统计量:1)t检验适用于样本量较小,总体方差未知2)z检验适用于样本量大,或样本量小,但总体方差已知再区分t检验和方差分析:1)t检验:研究两组分类型自变量对数值型因变量的影响,通过判定两组均值是否相等2)方差分析:研究两组或多组分类型自变量对数值型因变量的影响,直接检验各组均值是否相等例如,假设这里有来自4个总体的样本,想探究这4类样本的均值差异,如果采用t检验,则需要做共计6次假设检验,6次实验至少犯一次一类错误的概率为而方差分析可以直接比较这4类样本均值差异(通过均值计算组间平方和SSA和组内平方和SSE,构造F统计量进行假设检验)此处有追问:t检验共有哪几种形式?三种——单样本t检验、独立样本t检验和配对样本t检验9. 日均活跃时长下降,怎么分析?
点赞 26
评论 3
全部评论

相关推荐

咦哟,从去年八月份开始长跑,两处实习转正都失败了,风雨飘摇,终于拿到offer了更新一下面试记录:秋招:多部门反复面试然后挂掉然后复活,具体问了啥已经忘了,只是被反复煎炸,直至焦香😋春招:base北京抖音hr打来电话说再次复活,准备面试,gogogo北京抖音一面:六道笔试题:1.promise顺序2.定义域问题3.flat展开4.并发请求5.岛屿数量算法(力扣)深度,广度都写6.忘记了,好像也是算法,难度中等其他问题多是框架底层设计,实习项目重难点~~~秒过😇北京抖音二面:三道笔试题:(为什么只有三道是因为第三道没做出来,卡住了)1.中等难度算法(忘记啥题了,应该是个数组的)2.认识js的继承本质(手写继承模式,深入js的面相对象开发)3.手写vue的响应式(卡在了watch,导致挂掉)---后知后觉是我的注册副作用函数写得有问题,有点紧张了其他题目多是项目拷打,项目亮点,对实习项目的贡献~~~第二天,挂,but立马复活转战深圳客服当天约面深圳客服一面:六道笔试题,由于面过太多次字节,面试官叫我直接写,不用讲,快些写完😋,具体都是些继承,深拷贝(注意对数组对象分开处理,深层次对象,循环引用),加中等难度算法题~~~秒过深圳客服二面:口诉八股大战:大概囊括网络,浏览器渲染原理,动画优化,时间循环,任务队列等等(你能想到的简单八股通通拉出来鞭尸😋)算法题:笔试题6道:1:找出数组内重复的数,arr[0]-arr[n]内的数大小为[1-n],例如[1,2,2,3,3]返回[2,3],要求o(n),且不使用任何额外空间(做到了o(n),空间方面欠佳,给面试官说进入下一题,做不来了)2:原滋原味的继承(所以继承真滴很重要)3:力扣股票购买时机难度中等其他滴也忘记了,因为拿到offer后鼠鼠一下子就落地了,脑子自动过滤掉可能会攻击鼠鼠的记忆😷~~~秒过深圳客服三面:项目大战参与战斗的人员有:成员1:表单封装及其底层原理,使用成本的优化,声明式表单成员2:公司内部库生命周期管理成员3:第三方库和内部库冲突如何源码断点调试并打补丁解决成员4:埋点的艺术成员5:线上项目捷报频传如何查出内鬼成员6:大文件分片的风流趣事成员7:设计模式对对碰成员8:我构建hooks应对经理的新增的小需求的故事可能项目回答的比较流利,笔试题3道,都很简单,相信大家应该都可以手拿把掐😇~~~过过过无hr面后续煎熬等待几天直接hr打电话发offer了,希望大家也可以拿到自己心仪的offer
法力无边年:牛哇,你真是准备得充分,我对你没有嫉妒,都是实打实付出
查看19道真题和解析
点赞 评论 收藏
分享
xwqlikepsl:感觉很厉害啊,慢慢找
点赞 评论 收藏
分享
有没有友友知道hr面会问什么我应该反问什么?还有如何防止hr套话啊?还有应该如果催hr推进快一点#字节#OPPO#hr面
牛客989988346号:职业规划,优缺点,为什么选择这个岗,对应聘公司产品的了解和满意度,如果让你改进公司产品你会怎么做,对ai(新技术)的了解,有无其他offer,什么时候能到岗
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务