【字节跳动】数据分析日常实习面经分享

社区里关于数据分析的面经比较少,分享一下自己的面试经历,希望对社区里的同学有所帮助。

一面(30-45分钟左右)
1.简单介绍一下自己
2.有没有做过数据分析相关的项目?(举了一个机器学习的例子)
3.根据数据集,怎么选择合适的算法?
4.SQL(考了好几道题,可以重点复习一下)
5.统计学:现在有十个客户,我们有十个用户包,客户对每个用户包出价(竞价排名广告),用什么统计方法判断两个用户包的价值是不是一样的?
6.你有什么想要问的吗?

二面(因为是远程面试,所以一面过了紧接着就是二面,凌晨四点起床的我精神都恍惚了……二面在45分钟左右)
1.介绍一下自己
2.介绍一个你做过的数据分析的项目(虽然和一面的面试官问的是一个问题,但是二面的面试官问的非常的细,我讲了一个做过的机器学习比赛(做分类器)的例子,在我讲的过程中面试官不断提问)
2.1既然你说了数据来源一般有三种方式(数据库,爬虫,常用的行业网站),简单讲一下爬虫。(感觉是自己给自己挖坑。。。)
2.2数据清洗中常见的问题有哪些?怎么把数值型变量变成分类变量?Pandas cut或者qcut(quantile cut)。除了这个还有其他方法吗?(根据常用的经验来划分,比如年龄)还有吗?(如实回答不知道。。。面试官说可以根据划分之后的变量与Y变量的相关性强弱来划分)
2.3常用的数据标准化和归一化方法有哪些?(max-min, Z-score,Labelencoding, One-hot encoding)
2.4 One-hot encoding 和Label encoding 的区别是什么?
2.5你比较常用的算法有哪些?(我回答根据不同的数据集用不同的算法,一般会把20多个算法都比较一下,最常用的是XGboost)
2.6你这样做的目的是为了Voting吗?(不是,还没到Ensemble那一步)
2.7XGboost你一般怎么调参?(讲了一下XGboost原理,主要是比较和GDBT的不同,然后说一般调n_estimator***ax_depth,L1,L2)
2.8你讲了这么多,但是你一开始的时候没有对数据集进行全面的分析吗?(吓出一身冷汗,忘记讲EDA了。急忙解释道,做了做了,忘记讲了,然后讲了一下常用的可视化方法,histogram, countplot, barplot, violin plot, pie chart....当然还有很fancy的correlation heatmap,这个问题我比较熟悉,讲了一下怎么用图形画出来一个五维的关系,然后我笑了,说这个其实没什么卵用,完全是为了好看,面试官也笑了)
3.你以后对自己的职业路径有什么思考?想做数据分析还是数据挖掘?(不知道为什么要问这个问题,简单讲了一下)
4.会SQL吗?
5.有什么想问的吗?

三面(HR面,前两面过了基本就稳了,HR面基本不刷人)
1.介绍一下自己
2.过了一遍简历
3.怎么评价一面,二面的面试官(我?????)
4.还在面其他公司吗?
5.有什么想问的?

总结:字节跳动的面试体验还是非常好的,每个面试官都很Nice,不会故意刁难。后来在HR面的时候问了一下一面和二面有啥区别,重点来了,HR回答:一面主要是考察技术细节,从low-level出发,看面试者到底有没有相应的能力来胜任日常工作。二面从一个High-Level的角度出发,主要考察面试者对整个数据分析的理解和思考,考的是宏观的东西(虽然我不这么认为。。。)。我感觉最重要的一点就是一定要熟悉自己的简历,把自己要说的,想说的东西都好好准备一下(项目经历以及每段经历中学到了什么),要不然就是自己给自己挖坑,特别是二面,面试官问的问题都是根据你的回答来展开的,如果你对自己说的东西都不熟悉,那肯定是要减分的,然后就是一定要诚实,不要瞎扯,我自己的SQL不是很好,如实给面试官讲了,然后表达出自己会努力学习的态度,面试官很理解。最后,愿大家能够找到满意的实习和全职,希望这篇面经对大家有所帮助:)

#字节跳动##面经##实习##数据分析师#
全部评论
所以hr面一般不刷人么,刚接到hr面, 很方
2 回复 分享
发布于 2019-08-09 18:25
大佬,你去实习了吗,具体做的是哪方面的活。感觉数据分析大部分还是sql,excel,然后调包机器学习算法就行了。咋感觉这面试问的全是机器学习。。。
1 回复 分享
发布于 2019-10-10 16:54
请问日常实习在那里投呀
点赞 回复 分享
发布于 2019-05-17 07:40
求问hr面后多久拿到的offer呀?hr面过去一周了也没动静,说加微信也木有😭
点赞 回复 分享
发布于 2019-09-12 17:01
请问这个岗位在字节是不是算在产品运营门类下的,不是技术?
点赞 回复 分享
发布于 2019-08-18 10:26
写的好认真
点赞 回复 分享
发布于 2019-08-17 21:03
看起来是广告组
点赞 回复 分享
发布于 2019-05-21 08:47
所以,大佬,One-hot encoding 和Label encoding 的区别该怎么回答比较好,谢谢解答
点赞 回复 分享
发布于 2019-05-18 16:37
请问楼主,1.5那道题该怎么答啊?
点赞 回复 分享
发布于 2019-05-17 21:44
根据数据集如何选择算法模型,大佬是如何回答的啊?
点赞 回复 分享
发布于 2019-05-17 15:02
感谢分享
点赞 回复 分享
发布于 2019-05-17 14:23
🤣🤣大佬哪里投的呀
点赞 回复 分享
发布于 2019-05-17 09:50
感谢大佬
点赞 回复 分享
发布于 2019-05-17 08:42
大佬,hr面和二面隔了多长时间?
点赞 回复 分享
发布于 2019-05-17 06:52

相关推荐

点赞 评论 收藏
分享
frutiger:逆天,我家就安阳的,这hr咋能说3k的,你送外卖不比这工资高得多?还说大厂来的6k,打发叫花子的呢?这hr是怎么做到说昧良心的话的
点赞 评论 收藏
分享
06-13 17:33
门头沟学院 Java
顺序不记了,大致顺序是这样的,有的相同知识点写分开了1.基本数据类型2.基本数据类型和包装类型的区别3.==和equals区别4.ArrayList与LinkedList区别5.hashmap底层原理,put操作时会发生什么6.说出几种树型数据结构7.B树和B+树区别8.jvm加载类机制9.线程池核心参数10.创建线程池的几种方式11.callable与runnable区别12.线程池怎么回收线程13.redis三剑客14.布隆过滤器原理,不要背八股,说说真正使用时遇到了问题没有(我说没有,不知道该怎么回答了)15.堆的内存结构16.自己在写项目时有没有遇见过oom,如何处理,不要背八股,根据真实经验,我说不会17.redis死锁怎么办,watchdog机制如何发现是否锁过期18.如何避免redis红锁19.一个表性别与年龄如何加索引20.自己的项目的QPS怎么测的,有没有真正遇到大数量表21.说一说泛型22.springboot自动装配原理23.springmvc与springboot区别24.aop使用过嘛?动态代理与静态代理区别25.spring循环依赖怎么解决26.你说用过es,es如何分片,怎么存的数据,1000万条数据怎么写入库中27.你说用limit,那么在数据量大之后,如何优化28.rabbitmq如何批次发送,批量读取,答了延迟队列和线程池,都不对29.计网知不知道smtp协议,不知道写了对不对,完全听懵了30.springcloud知道嘛?只是了解反问1.做什么的?短信服务,信息量能到千万级2.对我的建议,基础不错,但是不要只背八股,多去实际开发中理解。面试官人不错,虽然没露脸,但是中间会引导我回答问题,不会的也只是说对我要求没那么高。面完问我在济宁生活有没有困难,最快什么时候到,让人事给我聊薪资了。下午人事打电话,问我27届的会不会跑路,还在想办法如何使我不跑路,不想扣我薪资等。之后我再联系吧,还挺想去的😭,我真不跑路哥😢附一张河科大幽默大专图,科大就是大专罢了
查看30道真题和解析
点赞 评论 收藏
分享
评论
20
329
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务