首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
腾讯内推
清华大学 产品经理
关注
已关注
取消关注
mark
@子虚乌有先生:
日常实习面经:腾讯-技术研究(数据科学方向)
TimeLine:一面20211102当时的BG:北邮本硕,管理类专业,一段实习经历:美团商业分析师写在前面的话:该文档记录日常实习面试的相关问题,面试时间为2021年。以下问题的答案可能存在错误,敬请读者批评指正一面1. 介绍一下假设检验假设检验是用来判断样本与样本之间的差异究竟是抽样误差导致还是存在本质差别的统计推断方法,本质上是反证法(证实一个命题需要穷尽所有可能,证伪一个命题只需要一个反例)1)需要先构造原假设和备择假设,其中,原假设是”差异是抽样误差所致“(例如AB测试中:”新功能/新策略没有效果“),备择假设是”差异是因为存在本质差别“(例如AB测试中:”新功能/新策略有效果“)2)根据样本情况构造合适的统计量3)根据样本数据计算统计量的值,根据显著性水平判定是否落入拒绝域内,若落入拒绝域,则根据小概率原理(小概率事件一般不会发生,如果我们观察到某一事件发生了,则说明这个事件不是小概率事件)拒绝原假设2. 简要介绍一下AB测试为了科学合理地评价产品的新功能或新的产运策略可否上线,应从大盘中命中一定比例的用户,使用合理的分流机制将命中的用户尽可能均匀地分配到不同的组内,其中,体验线上配置的用户群体被称为”对照组“,体验新功能的用户群体被称为”实验组“,在相同的观察周期内,观察对照组和实验组在关键的业务指标和性能指标上的显著差异,根据观察结果来判断新功能能否上线3. 简述一下p值的概念定义1:根据检验统计量的样本观察值得出的概率,此概率为原假设可被拒绝的最小显著性水平本质上是一种概率,可以由统计量的样本观察值计算出来,与显著性水平作比较时可以得出拒绝/不拒绝原假设的判断,这种检验方法也被称为p值法(1.中所介绍的是临界值法)定义2:当原假设为真时,比所得到的样本观察结果更极端结果出现的概率拿抛硬币为例子,假设A手上有一个两面都是字的硬币,想通过抛硬币的方式让B来猜自己手上的硬币是不是正常硬币(指一面字一面花)B作假设检验,原假设为”硬币正常“,备择假设为”硬币不正常“当抛硬币抛到第5次时,概率已经很小了(甚至小于显著性水平0.05),则B可根据小概率原理拒绝原假设(如果硬币是正常的,那么”连续出现5次字“的概率非常低,若实验时观察到”连续5次字“的现象,则说明”连续5次字“不是小概率事件,因此拒绝原假设”硬币是正常的“)这里的概率就是我们通常所说的p值,联动定义2再理解一遍:当原假设为真(硬币正常)时,比所得到的样本观察结果更极端结果出现的概率(连续出现5次及以上次字的概率),一旦观测到”连续出现5次及以上次字“这一现象,则根据小概率原理拒绝原假设4. SQL考察数据表:用户关注表user,字段有:user_id '用户id',target_user_id'关注用户的id'1)互关的人数 with a as ( select t1.user_id from user t1 where exists (select 1 from user t2 where t1.user_id = t2.target_user_id and t1.target_user_id = t2.user_id ) ) select count(user_id) / 2 from a2)粉丝量在10-100的用户select target_user_idfrom usergroup by target_user_idhaving(count(user_id)) between 10 and 1005. SQL中partition by和group by的区别1)从SQL的执行顺序来看group by的执行顺序优先,partition by是在select子句中2)group by只保留参与分组字段和聚合函数的结果,partition by可保留所有字段,并给出针对某字段的窗口函数结果6. 简述一下一类错误和二类错误的概念?注:建议画图进行辅助讲解一类错误:原假设H0为真时,作出”拒绝原假设“的错误决策,也被称为弃真错误二类错误:原假设H0为假时,作出”接受原假设“的错误决策,也被称为取伪错误该图出自贾俊平、何晓群、金勇进编著的《统计学(第7版)》第158页(a)图中,阴影部分为一类错误,概率大小等于显著性水平α;(b)图中,阴影部分为二类错误,概率大小通常命名为β,非阴影部分面积为1-β,通常命名为统计功效由上图可知,一类错误的概率由显著性水平α决定,减小显著性水平会降低一类错误概率(即拒绝域向右移动,(a)图中阴影部分面积减小),但会提升二类错误概率(拒绝域向右移动,(b)图中阴影部分面积增大)7. 如何降低二类错误?1)降低置信度,提高显著性水平(但这样会提高一类错误概率)2)增大数据量,减小方差,进而提升统计功效,降低二类错误概率3)在保证样本量不变的前提下,增大MDE(Minimum Detectable Effect,最小检测效应,被定义为期望观察到的最小差异)将会提升统计功效,降低二类错误概率MDE的概念参见下图:8. 请简述一下t检验、z检验和方差分析的区别?先区分t检验和z检验,区别在于构造不同的统计量:1)t检验适用于样本量较小,总体方差未知2)z检验适用于样本量大,或样本量小,但总体方差已知再区分t检验和方差分析:1)t检验:研究两组分类型自变量对数值型因变量的影响,通过判定两组均值是否相等2)方差分析:研究两组或多组分类型自变量对数值型因变量的影响,直接检验各组均值是否相等例如,假设这里有来自4个总体的样本,想探究这4类样本的均值差异,如果采用t检验,则需要做共计6次假设检验,6次实验至少犯一次一类错误的概率为而方差分析可以直接比较这4类样本均值差异(通过均值计算组间平方和SSA和组内平方和SSE,构造F统计量进行假设检验)此处有追问:t检验共有哪几种形式?三种——单样本t检验、独立样本t检验和配对样本t检验9. 日均活跃时长下降,怎么分析?
点赞 26
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
04-18 21:32
广西大学 算法工程师
快手 AIAgent开发 一面(日常)
1. 自我介绍2. 介绍下你简历上这个项目3. 聊聊记忆系统模块设计,你会怎么拆记忆系统至少要拆成写入、索引、检索、融合和淘汰五层。写入层不是把所有对话都存下来,而是先判断值不值得记;索引层要同时支持按用户、会话、任务、实体和时间切片检索;检索层通常要把结构化过滤和语义召回结合起来;融合层负责把召回结果转成当前 prompt 可消费的上下文;淘汰层解决过期、冲突和污染。好的记忆系统不是“记得多”,而是“能在正确时刻拿回正确事实”。4. 记忆检索到底应该用 user_id、session_id,还是别的主键不能只用一个主键。session_id 更适合短期上下文恢复,能还原当前任务过程;user...
AI-Agent面试实战...
点赞
评论
收藏
分享
04-16 17:20
黑龙江工商学院 物流经理
找工作
大家好 我是交通运输专业 当过两年兵 适合什么工作
我的求职进度条
点赞
评论
收藏
分享
04-17 14:31
江苏大学 Java
小厂真恶心
面试迟到,还在面试前偷偷降100待遇,浪费我时间
点赞
评论
收藏
分享
03-31 21:47
东南大学 C++
愚人节血战阿里
吓哭了,明天被面试塞满了
彭于晏前来求offe...:
吓晕了
点赞
评论
收藏
分享
04-18 20:34
门头沟学院 C++
腾讯 云平台架构 二面
1.你这个项目是哪来的,网上找的吗2. 你的网络框架大致架构是怎样的3. epoll 能监听磁盘文件吗,为什么普通文件和 socket 在事件模型上表现不同答案:epoll 从接口上看可以把很多 fd 加进去,但并不是所有 fd 都能像 socket 一样带来有意义的事件驱动收益。普通磁盘文件通常总是“可读”“可写”,因为它们不具备网络连接那种等待对端、等待缓冲区状态变化的语义,所以即使加入 epoll,也不会像网络 fd 那样随着数据到达不断产生值得等待的边缘事件。真正适合 epoll 的通常是 socket、pipe、eventfd、timerfd 这类“状态会变化”的 fd。如果业务是“...
C++ 常考面试题总结
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
没个“能打”的项目,简历关都过不去
5.3W
2
...
建发 vs 象屿 vs 工行厦门 vs 厦门银行
3.6W
3
...
刷了3段实习,我发现90%的“金融科技项目”都是假的
5728
4
...
滴滴一面agent
3073
5
...
字节27agent开发实习一面凉经分享
2904
6
...
字节前端一面
2798
7
...
多益网络三面
2498
8
...
虾皮五面(提前挂)
2420
9
...
整组的实习生全被干掉了...
2396
10
...
恒生电子春招
2324
创作者周榜
更多
正在热议
更多
#
你简历上最心虚的一句话
#
4586次浏览
29人参与
#
简历上如何体现你的“AI”能力?
#
790次浏览
25人参与
#
华泰星战营,提前锁定校招offer
#
6424次浏览
300人参与
#
我的求职进度条
#
1260486次浏览
9325人参与
#
哪些AI项目值得做?
#
655次浏览
25人参与
#
你知道最慷慨和最抠的公司分别是
#
742次浏览
19人参与
#
实习时最怕听到的一句话
#
829次浏览
19人参与
#
找不到大厂实习可以去小厂吗?
#
1387次浏览
18人参与
#
没有面试的日子里,你在做什么
#
1188次浏览
23人参与
#
工作丧失热情的瞬间
#
388378次浏览
2581人参与
#
考公VS就业,你怎么选?
#
100428次浏览
526人参与
#
商战,最累的是我们
#
31813次浏览
99人参与
#
机械笔面试考察这些知识点
#
18051次浏览
126人参与
#
字节7000实习来了,你投了吗?
#
45190次浏览
353人参与
#
大学生该如何认清当下的就业环境?
#
166654次浏览
916人参与
#
26届春招投递记录
#
5393次浏览
54人参与
#
找工作的破防时刻
#
289989次浏览
2066人参与
#
小红书求职进展汇总
#
238764次浏览
1397人参与
#
机械求职避坑tips
#
100510次浏览
580人参与
#
卷__卷不过你们,只能卷__了
#
60449次浏览
760人参与
#
硬件人求职现状
#
529462次浏览
4830人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务