日常实习面经：腾讯-技术研究（数据科学方向）_牛客网

清华大学产品经理

关注

mark

@子虚乌有先生：日常实习面经：腾讯-技术研究（数据科学方向）

TimeLine：一面20211102当时的BG：北邮本硕，管理类专业，一段实习经历：美团商业分析师写在前面的话：该文档记录日常实习面试的相关问题，面试时间为2021年。以下问题的答案可能存在错误，敬请读者批评指正一面1. 介绍一下假设检验假设检验是用来判断样本与样本之间的差异究竟是抽样误差导致还是存在本质差别的统计推断方法，本质上是反证法（证实一个命题需要穷尽所有可能，证伪一个命题只需要一个反例）1)需要先构造原假设和备择假设，其中，原假设是”差异是抽样误差所致“（例如AB测试中：”新功能/新策略没有效果“），备择假设是”差异是因为存在本质差别“（例如AB测试中：”新功能/新策略有效果“）2)根据样本情况构造合适的统计量3)根据样本数据计算统计量的值，根据显著性水平判定是否落入拒绝域内，若落入拒绝域，则根据小概率原理（小概率事件一般不会发生，如果我们观察到某一事件发生了，则说明这个事件不是小概率事件）拒绝原假设2. 简要介绍一下AB测试为了科学合理地评价产品的新功能或新的产运策略可否上线，应从大盘中命中一定比例的用户，使用合理的分流机制将命中的用户尽可能均匀地分配到不同的组内，其中，体验线上配置的用户群体被称为”对照组“，体验新功能的用户群体被称为”实验组“，在相同的观察周期内，观察对照组和实验组在关键的业务指标和性能指标上的显著差异，根据观察结果来判断新功能能否上线3. 简述一下p值的概念定义1：根据检验统计量的样本观察值得出的概率，此概率为原假设可被拒绝的最小显著性水平本质上是一种概率，可以由统计量的样本观察值计算出来，与显著性水平作比较时可以得出拒绝/不拒绝原假设的判断，这种检验方法也被称为p值法（1.中所介绍的是临界值法）定义2：当原假设为真时，比所得到的样本观察结果更极端结果出现的概率拿抛硬币为例子，假设A手上有一个两面都是字的硬币，想通过抛硬币的方式让B来猜自己手上的硬币是不是正常硬币（指一面字一面花）B作假设检验，原假设为”硬币正常“，备择假设为”硬币不正常“当抛硬币抛到第5次时，概率已经很小了（甚至小于显著性水平0.05），则B可根据小概率原理拒绝原假设（如果硬币是正常的，那么”连续出现5次字“的概率非常低，若实验时观察到”连续5次字“的现象，则说明”连续5次字“不是小概率事件，因此拒绝原假设”硬币是正常的“）这里的概率就是我们通常所说的p值，联动定义2再理解一遍：当原假设为真（硬币正常）时，比所得到的样本观察结果更极端结果出现的概率（连续出现5次及以上次字的概率），一旦观测到”连续出现5次及以上次字“这一现象，则根据小概率原理拒绝原假设4. SQL考察数据表：用户关注表user，字段有：user_id '用户id'，target_user_id'关注用户的id'1)互关的人数 with a as ( select t1.user_id from user t1 where exists (select 1 from user t2 where t1.user_id = t2.target_user_id and t1.target_user_id = t2.user_id  ) ) select count(user_id) / 2 from a2)粉丝量在10-100的用户select target_user_idfrom usergroup by target_user_idhaving(count(user_id)) between 10 and 1005. SQL中partition by和group by的区别1)从SQL的执行顺序来看group by的执行顺序优先，partition by是在select子句中2)group by只保留参与分组字段和聚合函数的结果，partition by可保留所有字段，并给出针对某字段的窗口函数结果6. 简述一下一类错误和二类错误的概念？注：建议画图进行辅助讲解一类错误：原假设H0为真时，作出”拒绝原假设“的错误决策，也被称为弃真错误二类错误：原假设H0为假时，作出”接受原假设“的错误决策，也被称为取伪错误该图出自贾俊平、何晓群、金勇进编著的《统计学（第7版）》第158页(a)图中，阴影部分为一类错误，概率大小等于显著性水平α；(b)图中，阴影部分为二类错误，概率大小通常命名为β，非阴影部分面积为1-β，通常命名为统计功效由上图可知，一类错误的概率由显著性水平α决定，减小显著性水平会降低一类错误概率（即拒绝域向右移动，(a)图中阴影部分面积减小），但会提升二类错误概率（拒绝域向右移动，(b)图中阴影部分面积增大）7. 如何降低二类错误？1)降低置信度，提高显著性水平（但这样会提高一类错误概率）2)增大数据量，减小方差，进而提升统计功效，降低二类错误概率3)在保证样本量不变的前提下，增大MDE（Minimum Detectable Effect，最小检测效应，被定义为期望观察到的最小差异）将会提升统计功效，降低二类错误概率MDE的概念参见下图：8. 请简述一下t检验、z检验和方差分析的区别？先区分t检验和z检验，区别在于构造不同的统计量：1)t检验适用于样本量较小，总体方差未知2)z检验适用于样本量大，或样本量小，但总体方差已知再区分t检验和方差分析：1)t检验：研究两组分类型自变量对数值型因变量的影响，通过判定两组均值是否相等2)方差分析：研究两组或多组分类型自变量对数值型因变量的影响，直接检验各组均值是否相等例如，假设这里有来自4个总体的样本，想探究这4类样本的均值差异，如果采用t检验，则需要做共计6次假设检验，6次实验至少犯一次一类错误的概率为而方差分析可以直接比较这4类样本均值差异（通过均值计算组间平方和SSA和组内平方和SSE，构造F统计量进行假设检验）此处有追问：t检验共有哪几种形式？三种——单样本t检验、独立样本t检验和配对样本t检验9. 日均活跃时长下降，怎么分析？

点赞 26

评论 3

全部评论

推荐最新楼层

07-17 12:09

门头沟学院 Java

小鹏ai测评太长了吧

讲的口干舌燥，头都晕了怎么要讲这么长啊

码农索隆：没事，你口干舌燥，他不一定会看，

投递小鹏汽车等公司7个岗位

点赞评论收藏

分享

07-14 12:29

门头沟学院 Java

字节暑期实习三周跑路会被拉黑吗

后端岗，实习三周感觉有点想跑路了，担心秋招被拉黑，有没有佬是字节HR知道情况的

从零开始的转码生活：你实习三周都想跑路，将来拿到offer真的愿意在这干十几二十年吗

投递字节跳动等公司8个岗位

点赞评论收藏

分享

06-12 17:08

天津理工大学 Java

求大佬点评简历，刚开始投好焦虑

27届双非，第一次投简历😭😭😭

想按时下班的大菠萝在...：隔壁学校的，加油多投，实在不好找可以下个学期开学找，把算法八股准备好，项目有空再换换

投了多少份简历才上岸

点赞评论收藏

分享

06-09 11:28

湖北师范大学 Java

醉蟀：你不干有的是人干

点赞评论收藏

分享

07-13 14:16

蚌埠坦克学院嵌入式软件开发

工作多年再来吐槽实习

那时候是实习生，想说又不敢说的很多。现在工作了几年，回头一看，发现一些问题早已超出了“实习期”的范畴。我所在的公司有一个很明显的问题：论资排辈的文化非常严重。不管你的能力、贡献、效率，很多时候评估和机会的关键，取决于“你在这儿多久”。不是说经验不重要，而是那种不看能力只看年限的逻辑，会直接打击新人的积极性。明明可以干得更好、做得更快、解决更复杂的问题，但最终的话语权却始终握在年限长、但技术停滞不前的人手中。其次是形式主义的“日报文化”。每天都要写日报，但很多时候只是为了写而写。不是总结工作，也不是梳理问题，而是填表凑字数。有时候一天处理了一个重要的难点问题，但写出来却显得无足轻重；相反，一些边...

实习生的蛐蛐区

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 26届的你们有几段实习？ #

33841次浏览 394人参与

# 机械人，你拿到几个offer啦 #

38419次浏览 318人参与

# 你被哪些公司秒挂过？ #

25789次浏览 221人参与

# 面试体验感最好的是哪家？ #

223188次浏览 2378人参与

# 如何提高实习转正率？ #

9814次浏览 147人参与

# 双非能在秋招上岸吗？ #

220036次浏览 1165人参与

# 哪些公司校招卡第一学历 #

63629次浏览 240人参与

# 初创公司值得加入吗？ #

26155次浏览 189人参与

# 大疆的机械笔试比去年难吗 #

74933次浏览 636人参与

# 月薪多少能在一线城市生存 #

17125次浏览 229人参与

# 你后悔自己读研吗？ #

13867次浏览 212人参与

# 大家每天通勤多久？ #

48357次浏览 353人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

116329次浏览 804人参与

# 你认为哪些项目算烂大街？ #

13688次浏览 255人参与

# 你以为的实习VS真实的实习 #

18832次浏览 181人参与

# 设计人的面试记录 #

129312次浏览 1355人参与

# 比亚迪求职进展汇总 #

735786次浏览 3095人参与

# 网申一定要掌握的小技巧 #

10213次浏览 66人参与

# 你小时候最想从事什么职业 #

103904次浏览 1787人参与

# 机械校招之路总结 #

93058次浏览 1891人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务