数据分析岗面经还愿

都说2022年是互联网寒冬，亲身真正经历后来看，深圳寒冬这说法完全不过分。深圳互联网厂太少了，动不动就是锁hc。历时近2个月，本人面了大部分深圳、一点点上海岗位，把所有的面经做了整合后分享给其他牛牛们，以此感谢这两个月从平台也获得的他人经验，也是对最后获得的offer的还愿啦～

写在开头的建议：

真心建议面试前/投简历时先了解清楚在招的岗位是否和自己的能力、职业规划匹配！！如果JD信息不明确，建议先提前沟通清楚，避免面试过程发现不是自己想做的，会很浪费精力（面不过影响情绪，面过也容易被养鱼），还错过了投其他岗位的黄金时间。综合我自己本阶段的几次面试经历，有些公司对数据分析岗的定位是当数据工程来用，工作内容偏数仓搭建、数据治理等；有些是纯业务分析（偏BI），还有一些偏数挖。
自我介绍部分大概准备3分钟，涵盖自己简历上最近一份工作的内容、项目。面试官大多不会提前看简历的，所以自我介绍的时候其实是给对方留时间看你的简历，这样有助于对方基于简历问你的项目。我试过自我介绍的时间太短，面试官只够看我一个项目的内容，后面就只问了我这个项目的一些信息后就开始考他们的业务题了，完全没有机会让你展示自己以前的丰功伟绩。。。后面调整后，和面试官对于简历上的项目聊的也更多了。
准备一个自己做过的比较完整的数分项目/数分例子的介绍。包括项目背景、自己负责什么、怎么做了、效果怎么样。（最好能完整的讲一个故事出来，有些公司会在意和业务方的合作模式，做个主动推动的数分。。）
还是得稍微刷下sql题的。。。太久没用有点生疏第一次被考的时候懵了。。。主要是窗口函数，考来考去都是它。基本上字节、虾皮、富途都会考。

2个月里，一边面试一边完善自己的知识库（大概是过去和未来3年的知识巅峰吧hhh），前前后后面试了10+公司吧。。

面经正文：

字节

（我共面了3个部门的岗位，有不合适的，也有到谈薪阶段的，面试题都混来在一起了。字节的hr有多热情，面试官就有多无情hhh。只要不是能力问题，都会被秒换部门继续约面。。所以要有不怕挂的精神，毕竟面试官觉得你适不适合也是很玄学的事）

基于我的项目里的指标体系的建设讲解：为什么选择渗透率而不是DAU？双边市场的指标，认为哪方更重要，为什么？
怎么选择北极星指标
举个自己做数据分析有落地的例子（挑自己的一个项目，把前因后果讲清楚）
aha moment的拐点分析，为什么选择留存指标作为y轴？
项目里的分群划分标准和方式。
推荐效果指标不好，产品说推荐算法不准，没有把内容精准推给用户；算法说是内容质量问题，怎么评估这个问题？
AB两个人，A有100个硬币，B有99个硬币，正1分，负0分，最后得分A>B的概率。（答案：1/2。参考答案）
如果要提升复购率怎么做分析？
项目里做了实时看板，问看板的设计逻辑？
怎么判断用户流失？流失周期怎么设定？
新用户发券ROI怎么衡量？——其实是想引申出ab实验设计、最小样本量设计（众所周知字节喜欢问ab，不过这个ab问的很有技巧。）
在印尼公交车站上广告牌，怎么衡量广告牌的转化提升？—— DID，PSM（在其他区域寻找相似人群的数据，DID对比），用新增购买UV来做衡量指标
效果评估有什么方法，怎么去除干扰因素？
不做abtest的话，对于新业务有什么评估方式？
最近常用的app，分析优势、劣势（可以挑个自己的产品好好准备下，被给自己挖坑，我挖了个我觉得推荐的内容不丰富/重复的坑，然后跳进去出不来了。。。）
针对问题（推荐的内容重复），如何通过数据分析进行证明。衡量指标怎么选择？
针对问题（推荐的内容重复），有什么改进的方法建议，推荐侧&产品侧。。（太产品了这个问题，我和运营打交道比较多）

富途

问项目（指标体系、用户分群之类的，只记得研究概率题，忘了其他。。）
公司里面男性有60人，女性有40人，男性穿皮鞋的人数有25人，穿运动鞋的人数有35人，女性穿皮鞋的人数有10人，穿高跟鞋的人数有30人。现在你只知道有一个人穿了皮鞋，请预测一下ta的性别。（我认为都是已知条件所以没用条件概率，后面用条件概率算发现答案也一样）
A，B两个人打赌，让第三人C来抛硬币，C负责拿一个硬币不停地抛，A说“只要有先出现一次正面再出现一次反面的情况就算我赢”，B说“只要出现了连续的两次反面就算我赢”，然后C开始抛，只要没出现他们所说的任何一种情况就要继续抛，出现了任一个结果则停止，请计算A的胜率。（提示后答了3/4。答案参考）
设计一个指标量化某只股票的舆情情况（已知每条咨询内容的舆情分）
富途还面了一个偏工程的岗，后面发现岗位不对口，不过面试官小姐姐很nice，讲清楚岗位不对口后两个人在唠嗑hhh互相了解对方数仓建设情况。。。

平安金融（三面的面试官和我说面试通过了很期待我加入，但还有第四面要和她的领导聊，给我打了预防针这个流程会很长。。。长到我听说平安在锁hc和裁员。。。长到我都入职其他公司了。。。也没通知第四面。。。面试题没怎么记，主要还是针对项目问）

指标体系搭建
用户分群的项目举例做了什么，模型是怎么落地和评估的
业务题：想从300亿收入提升至500亿，怎么做？
业务题：怎么对大客户做分析和运营？

顺丰-丰e足食

项目引申：指标建设-效果评估
1. psm：怎么解决无法穷尽因子的问题，证明两个群体相似，达到类ABtest？
2. 答用SMD做平衡性检验，除此还有什么办法？
业务题，某个时间点的销售提升率同比上年下降了，怎么做分析？（一步步引导你往下挖，直到你找到了原因）
怎么去衡量不同因子的影响权重？
SQL题，就是处理以上业务题对应的表，怎么生成2个时间序列？

虾皮

（也面了两个部门，也有不对口的。。心累）

北极星指标设计等
举一个数据分析有落地的案例（来了又来了）
介绍一个做用户增长的案例（又。。）
SQL题：怎么计算连续登陆三次失败后登陆成功的比例？login_table(dt, userid, flag, timestamp) ——窗口函数&left join （或者lag/lead）
看板题：设计地铁站的运营看板
业务分析题：怎么提升某个地铁站的用户满意度？（重点是要去收集数据做分析。）