字节-北京数据分析师一面面经

总的来说面试并不难，面试主要围绕自身背景，所做过的项目，考察SQL能力以及一些结合产品来分析的贴近现实的题目。面试官是个帅帅的小帅哥（感觉很年轻），人很好。Zoom面试，这里一定要指出，面试前最好准备好设备和备用设备。我当时打算用手机面试（电脑的摄像头在下方，用dell xps的都懂，面试官只能看到我鼻孔那种），提前十分钟进入链接，调试好设备后就等着面试，等面试官准时进来时，双方都听不懂彼此的声音...还好小哥哥说他重新进链接，我也顺便换成了电脑，一分钟后就没问题了。然后就是正式面试了，面试一共45分钟，期间因为术语问题耽搁了一些时间（因为我统计学和机器学习深度学习等相关知识都是在英语环境中学的。。。）

1. 自我介绍。我主动出击，面试前我把简历梳理了一遍，把简历上的东西都按照时间线大概概述了一下，面试官就没啥问题了，直接进入上一份工作的工作内容和经历；

2. 深挖简历，这里一定要明白自己做了什么，分清主次。我比较大概地介绍了公司架构，主营业务，我所在部门，我的职位与职责等。然后我交代了我做了什么，为什么这么做，达到了何种程度，最后结果如何，有什么问题。小哥哥也不打断我，等我说完他也没再问我工作相关的问题了但问到了基础技术方面的问题。因为我之前做了几个分类的项目，简历上也有提到，小哥哥就让我简要介绍了随机森林算法的实现，我说的很详细。他又问我在用python实现时会怎么调参，我回答了n_estimator，max_samples等。可能我说太细致了，小哥哥就直接让跳到下一题了；

3. 简历中有提到pandas，小哥哥就问了插补法，我回答了平均数，中文数，众数，KNN插补，贝叶斯岭（？？？我当时说的bayesianridge) 小哥哥就没问了；

4. 连续数字的分析；我当时是真没听懂的，我就问是不是Numeric data EDA，小哥哥说是，我回答了用pandas直接画出散点图，分布图，看outliers，相关系数（correlation），平均数，方差，kurtosis skewness。。小哥哥说是不是峰度和偏度，我说啊。。应该是吧，我就道歉说真的不知道这些术语的中文名词，还在学习中。他笑笑说没事，就继续了；

5. 做SQL题目；小哥哥直接共享屏幕，四道题目手撕，第一题是分组排序（存在重复数目）取出每组最大数的编号（如果有重复的就取primary key最小的那个），我用的ROW_NUMBER()；第二题是学科成绩，题目给了学号，课程成绩，分数，要求输出大于六十分的为PASS，小于六十分的为FAIL。我还没说完CASE WHEN score>= 60 THEN PASS ELSE FAIL 这样，小哥哥就说下一道。第三题是一个转换日期格式的题目，现有日期mmm-dd-yyyy，要求输出yyyy-mm-dd，我用了dateformat，但他说不对，我是真的没理解到题目，又问了一些问题还是没理解到题目我就放弃了。第四题是从[[values, strings,values]]这样的格式中查找出一个特定的值，我说抱歉，我以前完全没接触到，这题完全不会，小哥哥说没事，就直接说答案了

6. 问了业务题，大概是如何设计广告方案。我回答了页面浏览量，每个页面的平均停留时间，日活，点击率等，可以考虑做abtest来看广告位放在哪里，颜色，大小，文字图片等都可以测试。这时已经40分钟了，具体也没展开，小哥哥就快速补充了以下，就进入反问了

7. 反问；我现在面的团队的主要职责是什么，主管部门是谁，具体是什么产品

11.25面完现在也没消息，11.26问了hr小姐姐说一般要等5-7个工作日。。。感觉很奇怪

#字节跳动##数据分析师##校招##面经#