字节-北京数据分析师一面面经

总的来说面试并不难,面试主要围绕自身背景,所做过的项目,考察SQL能力以及一些结合产品来分析的贴近现实的题目。面试官是个帅帅的小帅哥(感觉很年轻),人很好。Zoom面试,这里一定要指出,面试前最好准备好设备和备用设备。我当时打算用手机面试(电脑的摄像头在下方,用dell xps的都懂,面试官只能看到我鼻孔那种),提前十分钟进入链接,调试好设备后就等着面试,等面试官准时进来时,双方都听不懂彼此的声音...还好小哥哥说他重新进链接,我也顺便换成了电脑,一分钟后就没问题了。然后就是正式面试了,面试一共45分钟,期间因为术语问题耽搁了一些时间(因为我统计学和机器学习深度学习等相关知识都是在英语环境中学的。。。)

1. 自我介绍。我主动出击,面试前我把简历梳理了一遍,把简历上的东西都按照时间线大概概述了一下,面试官就没啥问题了,直接进入上一份工作的工作内容和经历;

2. 深挖简历,这里一定要明白自己做了什么,分清主次。我比较大概地介绍了公司架构,主营业务,我所在部门,我的职位与职责等。然后我交代了我做了什么,为什么这么做,达到了何种程度,最后结果如何,有什么问题。小哥哥也不打断我,等我说完他也没再问我工作相关的问题了但问到了基础技术方面的问题。因为我之前做了几个分类的项目,简历上也有提到,小哥哥就让我简要介绍了随机森林算法的实现,我说的很详细。他又问我在用python实现时会怎么调参,我回答了n_estimator,max_samples等。可能我说太细致了,小哥哥就直接让跳到下一题了;

3. 简历中有提到pandas,小哥哥就问了插补法,我回答了平均数,中文数,众数,KNN插补,贝叶斯岭(???我当时说的bayesianridge) 小哥哥就没问了;

4. 连续数字的分析;我当时是真没听懂的,我就问是不是Numeric data EDA,小哥哥说是,我回答了用pandas直接画出散点图,分布图,看outliers,相关系数(correlation),平均数,方差,kurtosis skewness。。小哥哥说是不是峰度和偏度,我说啊。。应该是吧,我就道歉说真的不知道这些术语的中文名词,还在学习中。他笑笑说没事,就继续了;

5. 做SQL题目;小哥哥直接共享屏幕,四道题目手撕,第一题是分组排序(存在重复数目)取出每组最大数的编号(如果有重复的就取primary key最小的那个),我用的ROW_NUMBER();第二题是学科成绩,题目给了学号,课程成绩,分数,要求输出大于六十分的为PASS,小于六十分的为FAIL。我还没说完CASE WHEN score>= 60 THEN PASS ELSE FAIL 这样,小哥哥就说下一道。第三题是一个转换日期格式的题目,现有日期mmm-dd-yyyy,要求输出yyyy-mm-dd,我用了dateformat,但他说不对,我是真的没理解到题目,又问了一些问题还是没理解到题目我就放弃了。第四题是从[[values, strings,values]]这样的格式中查找出一个特定的值,我说抱歉,我以前完全没接触到,这题完全不会,小哥哥说没事,就直接说答案了

6. 问了业务题,大概是如何设计广告方案。我回答了页面浏览量,每个页面的平均停留时间,日活,点击率等,可以考虑做abtest来看广告位放在哪里,颜色,大小,文字图片等都可以测试。这时已经40分钟了,具体也没展开,小哥哥就快速补充了以下,就进入反问了

7. 反问;我现在面的团队的主要职责是什么,主管部门是谁,具体是什么产品

11.25面完现在也没消息,11.26问了hr小姐姐说一般要等5-7个工作日。。。感觉很奇怪
#字节跳动##数据分析师##校招##面经#
全部评论
12.2 问了HR,已挂
1
送花
回复
分享
发布于 2020-12-02 13:47
= =感觉回答的挺好的。能请问学长是 usyd 本科 的 data science 专业么
点赞
送花
回复
分享
发布于 2021-03-10 21:00
滴滴
校招火热招聘中
官网直投
同是美硕,感觉既然是面中国的公司还是了解下中文吧。。而且这都是常用的,一个中国人面试中国公司不会说统计上的中文术语简直不要太奇怪
点赞
送花
回复
分享
发布于 2021-04-26 08:39
😁
点赞
送花
回复
分享
发布于 2021-08-20 00:32

相关推荐

- 美团:到店事业群--平台技术部(暑期实习一面)- 上来面试官说看你简历挺匹配的,I'm like whaaaaat- 自我介绍- 为什么去读研了- 你们团队多少人- 你们数仓怎么分层- 你主要负责哪几层- ODS 数据从哪来,怎么接入数仓- ODS 表是什么事实表类型?更新方式?- ODS 到 DWD 做了哪些处理?- DWD 有哪些表,事实表如何设计的?- 你提到了数据字典,解释一下- 通过什么实现的(数据资产管理的平台)- 数据库 vs 数据仓库- 数据库为什么要减少冗余(数据更新导致数据不一致)- 数据仓库有冗余,如何保证一致性(我讲的更多需要人为的干预+平台功能)- 数仓分层的意义- Spark 的 stage 是如何划分的- 哪些算子会出现 Shuffle- 小文件优化,小文件是怎么产生的- Map 端造成的小文件问题怎么处理- 表存储优化:小文件治理、生命周期治理、下线无用表- 生命周期治理是每一层生命周期不同吗,考虑哪些方面- 分桶表的场景- MySQL 的索引一般是用什么数据结构- 介绍 B+ 树- 索引匹配原则- 写一个 SQL:[SQL270 考试分数(五)](https://www.nowcoder.com/practice/b626ff9e2ad04789954c2132c74c0513?tpId=82&tqId=35496&ru=/exam/oj)- 反问:部门业务?美团数仓建设?公司平台建设情况?- 感觉面试官明显对数仓建设、数据治理、数据一致性之类问题更感兴趣,Hive、Spark 之类的框架八股基本没问,算法题更是都没出,只出了一道中位数的 SQL(然后我写的 SparkSQL 牛客网还跑不了,面试官 be like 没事,差不多就行了 -_-||)- 心路历程:第一次面试有点紧张,虽然问题都非常简单,但我很多地方表达的不是很顺畅,有几个问题一开始都没 get 到面试官的点,感觉情况不太乐观。面试官很好,奈何我不够给力,哈哈。许愿二面 😥-------------------------------------------Update:3.25 刚刚收到电话约了二面Update:字数不够了,二面面经在动态
点赞 评论 收藏
转发
1 48 评论
分享
牛客网
牛客企业服务