数据分析师精选面经合集 - 校招实习社招 - 牛客网

数据分析师精选面经合集

4家公司

6篇面经

最新热门

07-09 16:22

同济大学数据分析师

前程无忧数据分析师面经

一面 1.自我介绍2.项目PSM-DID介绍3.举例做过的AB实验4.做过的用户画像，划分后的运营5.sql计算最大连续登录天数，口述业务问题1.我们原来有个岗位推荐算法ABC要增加一个岗位推荐算法D，怎么设计AB实验2.有个新算法要检验简历推送到HR的接受效果，我们关注的指标有哪些，不能做AB实验的情况下怎么验证效果个人问题1.为什么离职2.介绍业务，日常的工作内容面完一面挺好的，面完没几分钟hr让我做测试题，结果大无语，10个互相关联的趣味题，无论选什么都会有几个题目有错，交完测试题后第二天问hr说我测试挂了，大无语，真想招人吗

查看9道真题和解析

点赞评论收藏

分享

07-09 17:07

已编辑

西安交通大学 C++

快star-x二面凉经

一面主要是问项目，问的比较细，没有八股，算法题leetcode100里面的子数组最大和面完秒过，下午发二面通知二面面试官说他们说做数据库的，可能看我简历上没有多少数据库的东西，所以一直在拷打八股还有数据库过程如下（注:长文本来自于录音）自我介绍问题1:库场景题acid的定义，解释一下问题2:场景题问到了事务「提交可见性」与「刷盘策略」的核心本质，举了转账的例子。这个问了好久问的很深，后面挂了可能和这个有关系问题3:你刚说隔离级别有哪些啊？问题4:可重复读能解决换读问题吗？为什么？追问:换读就是相对于不可重复读一个两个区别，就是一个是在一行上，一个是在一个一段区间上是吧这个？问题5:你说比如说Repeatable Read对吧？它能够解决可重复的问题，它是怎么解决的这？问题6:什么是读写冲突，写读冲突，区别？问题7:场景题呃OK呃，我想想，比如说我现在有两个事物，对吧a事物先开始了，然后先开始我现在写呃，我现在读一条数据，然后但是它后期交就先开始后期交，然后b事务是后开始先提交那b事务跟a事务，比如b事务写了一个值a事务，先读了这个值读了个a对吧a是个旧值，然后b说我改了这个值，改了以后然后a是我后面提交了对吧，在在他之后提交了，那他们会他们这个时候这种现象是叫什么现象？追问1:你刚刚说的写偏差是什么意思追问2:如何解决？问题8: ACID的C和CAP的C一样吗？解释一下问题9:场景题呃，我聊点别的吧，我想想呃，我们聊操作系统啊，我现在有一个进程进程名，我我开两个线程，这两个线程同时去读，写一个全局的int 64，一个变量a线程去写b线程去读，那么b线程就a线程先发生b线程会发生这个绝对时间上b线程一定能够读到a线程修改以后的值吗？问题10:同步机制原理，同步原语的底层原理，为什么加锁或同步能让跨核线程看到最新值。追问:happens-before」关系问题11:场景题呃，比如说你看呃，我们回到最开始我们说redo log对吧，你写每次写的时候redo log你是需要刷盘对吧？那么我现在问题是说，比如说我假设我调redo log调redo命令对吧？他给我返回一个乘返回一个零值ST，那么我这个数据一定会落盘成功吗？问题12:场景题呃我再问个问题啊呃假设我现在一个客户端跟服务端对吧我建了个tcp连接然后呃这个时候客户端和服务端之间我现在没有消息通信对吧就连接已经进了但是没有消息通信这个是我上去我直接我直接把网线给拔了这个时候客户端能够感知到这个网线没拔了吗追问:可是我现在不是拔网线，我上去是比如说把对端进程给q了，那这个时候能感知到吗？大概就是这样的强度算法题我感觉是现出的，如下多线程读写锁（Read-Write Lock）设计（C++）给定一个普通互斥锁类 Lock，它有：void Lock() {}void UnLock() {}你需要基于它实现一个 RWLock 类（读写锁），包括：void RLock();    // 加读锁void RUnLock();  // 解读锁void WLock();    // 加写锁void WUnLock();  // 解写锁写出来了，大概讲了一下说没问题反问1:这个算法题写的对不对回答: 没啥问题，大体上反问2:研发团队里面主要是什么群体偏多回答:年轻人反问3:你觉得我和其他应届生对比有什么劣势？面试官想了一下我看他说不上来换了个问法，问我还有哪些提升都空间回答:你在应届生里面算是基础比较好的，基础不错（给的评价还可以，应该是认可了，但是第二天给我挂了）今天中午更新后，流程终止……7 月9 日发现大家喜欢看这种，那我再更新一下一面面经（注:长文本来自录音转文字）自我介绍背景经历问题:我想问的问题在于说嗯我为我看到你投的这个岗位啊，因为其实看到你之前应该也投了一些其他的岗位对吧就是就是嗯嗯想了解一下为什么想去怎么说呢为什么对这个岗位有兴趣，就看之前有一些其他方面的C++呀网络呀，好像进行实习吧。然后最近应聘的一些是容器云呀然后策略流量调度啊一些岗位就是想了解一下嗯你是对这个数据库开发或者底层开发有兴趣呢还是说出于别的考虑还说还还说先先海投一下。追问:我做数据库，做系统底层跟做业务层就做业务系统开发，因为我看你之前的有一个嗯，实习经验嘛，就是做抖音的后端服务对吧？其实这种的更偏向于说一些业务相关的一些开发，比如说像ramp像队列啊，计划部署啊，这些东西还嗯嗯诶，好像是一个比较比较比较混杂的一个项目对吧，就是你有了解过做一些偏向于业务层的开发跟偏向于底层开发他们的呃个上的区别了吗？或者说你有真的是对底层开发有有这种技术的兴趣还还是说有其他考虑面试正式开始问题1你觉得比较有深度的，或者能体现你的能力的一个一个一个项目（我讲的是一个grpc redis myspl项目）问题2我验一下你的项目啊，现在还是写的还是蛮细节的啊，包括这个本地采集含氧氢能池并发轮巡历史，为什么需要redis这个东西呢？追问1:这样的回复，我问一个问题啊，就是你用Mexico它的写入性能，就是你刚才说两个点嘛，一个是为了解有一些原子性的操作，一个是说觉得MySQL的性能更好，对吧？这个两个核心的点嘛那嗯，你在使用的时候，它的切入线怎么样呢？有有测试过吗？追问2:有没有认真思考过为什么 Redis 的写入延迟比 MySQL 低？追问3:AOF和RDB手撕leetcode原题: 子数组的最大和，要求空间复杂度核时间复杂度限时15分钟反问:你觉得我有什么改进点答:面试官大概意思就是把项目要吃透，特别是团队合作的，就算不是你的工作你也得知道为什么是什么，因为每个面试官默认你是非常了解项目的细节的。（注:在面试过程中我说了一个另他反常识的点，延迟50ms被指出来了，虽然可能记错了但是最后圆过来了，在反问过程中面试官也告诉我不能让面试官觉得反常识）下午发二面邀请

激战2025：最近好累啊，所有的事情都赶到一起了，真的觉得一眼望到头的感觉，想找个轻松的工作怎么办牛U们

查看23道真题和解析

点赞评论收藏

分享

07-08 11:05

已编辑

大连理工大学数据分析师

零垂直实习想转数分，去大公司水岗位还是投小公司数分岗(ಥ_ಥ)

📍面试公司：去哪儿🕐面试时间：2025/7/8💻面试岗位：培训实习生❓面试问题：1.自我介绍2.实习经历中你认为对你提升最大的是什么3.第一段实习的选择是出于什么考虑4.投递本岗位的想法是什么5.（被我问实习生岗位是干啥她回答了一大堆哈哈哈）🙌面试感想：感觉岗位有点水，大致工作就是统筹规划整个培训项目（实习生可能主要就是打杂），培训项目中包含了培训产品数据相关岗位的工作是少数亮点，或许能从中学习一些东西，另外实习时长较短，两个月作用应该能拿下（但不太想浪费时间，纠结...) 还有个点是薪资没有明确和我说，在实习僧上标的是面议------------------------------一小时不到通过了（感觉很急着招实习生），犹豫要不要参加二面

查看4道真题和解析

点赞评论收藏

分享

07-08 10:44

Momenta_后端开发(实习员工)

虾皮大数据开发暑期面经

📍面试公司：虾皮🕐面试时间：6.30 一面 7.4 二面 7.8感谢信💻面试岗位：大数据开发❓面试问题：主要是实习拷打数仓数据流向，具体业务介绍，业务接口跟数据的用户讲一个具体的业务，体现所用的技术栈从问题2深入，涉及到并发场景不可重复读怎么解决大数据技术栈，Spark，怎么用的，讲了怎么优化实际任务（数据倾斜/Shuffle优化）数据倾斜这里让描述下快排当前业务有没有写错数据的情况，如果当前数仓写到Kafa写错了，该怎么重新写入？比如HDFS这就错了，但写到kafa->业务表已经出问题了，怎么解决回答主要考虑一致性和重写时候服务是否可用如果让你从具体Kafka topic消费到入...

实习进度记录

点赞评论收藏

分享

07-04 22:18

平顶山学院数据分析师

📍面试公司：转转集团🕐面试时间：2025.6.27💻面试岗位：数分❓面试问题：技术面是第一个是问了我跟着导师的一个焊缝图像项目，问的比较细，然后就是写题，做sql方向的分类筛选题（现场手写，时间五分钟）还有一个做查询的然后还有一个涉及到join语句的，后续问了一些hive的知识，因为需要用hive工作（这就不得不提工作需要的学校是一点不讲，还好哥们感兴趣自学了）🙌面试感想：转转流程快很多，hr都挺好的，比铁厂好很多，铁厂打电话问三面结果一句话不说直接给我挂了

查看4道真题和解析

点赞评论收藏

分享

07-06 12:13

大连理工大学数据分析师

📍面试公司：滴滴🕐面试时间：2025/7/2💻面试岗位：国际事业群-数据分析实习生❓面试问题：1.用英文一分钟简单介绍一下自己2.你在使用滴滴时有哪些地方是做的比较好的？哪些地方是值得优化的？3.假如你要分析一个城市的活跃网约车司机的数量你要怎么做（给两分钟思考）4.职业规划是什么，第一段实习是出于什么样的选择🙌面试感想：对于面试的岗位一定要熟悉。具体要求什么技能，以及主要业务有哪些都是可能会提问的重点

查看4道真题和解析

点赞评论收藏

分享

07-04 14:04

已编辑

北方工业大学大数据开发工程师

字节数开面试-抖音

一面（面试官很好！很有耐心！）1.spark中rdd叫弹性分布式数据集，这个弹性的含义2.小文件的危害以及怎么处理3.spark中宽依赖、窄依赖4.stage的划分5.kafka怎么保证数据不重复消费（没回答上，但说了怎么重复消费数据）6.checkpoint机制7.spark的三种join（boardcast join,sort merge join,shuffle hash join）7.四道sql（前两道很简单，第三道次日留存和七日留存，第四道连续登录问题）8.算法题：移动最少区间个数 使得剩余区间无重叠1. 输入：[1,2][2,3][4,6][1,3]2. 输出：13. 解释：移除[1,3]后，剩余区间无重叠（面试后在牛客网看见有人分享这道算法题）一面最后面试官还问我以后的计划，我说打算先实习明年春招边实习边找工作，她居然问我没想留着字节吗（我当然想！）中间有些问题没想起来，耗时1小时40分钟二面（面试官很好！问的都是和数仓相关的，结合我的实习问）1.之前工作都干了什么2.之前实习搭建数仓的结构3.了解事实表吗，了解维度表吗4.怎么和其他人对接的5.你属于风控部门，但主要是构建数仓开发，那有没有和其他数据开发人员交流过6.你只有一段实习吧，那实习前后有什么感悟吗7.为什么要选择数据开发（我说因为之前实习是干数仓的，他说不要因为之前干什么就觉得以后三十年干什么，实习还是丰富点，看看干什么）8.最后反问二面耗时50分钟，感觉面试官对我回答的第七个问题不满意，只是我明年要毕业了，得多来一份垂直的实习建议多复习spark、hive方面的八股文、概念问题，实习生主要负责离线数仓开发

点赞评论收藏

分享

07-03 20:09

中国地质大学（武汉）大数据开发工程师

字节数开面经-直播业务一面

数据开发-直播业务突然被捞1.自我介绍2.项目是根据什么业务场景来划分的3.对Hadoop的理解4.讲一下MapReduce的执行过程5.shuffle的必要性6.维度建模是怎么建模的，事实表和维度表有什么区别7.星型模型和雪花模型区别8.讲一下对维度的理解，如果从视频和观看时间来看，会怎么去区分事实和维度9.手撕1)观看不同视频个数前五2)观看不同视频个数大于五十的女生用户中，视频完播率前几的用户，完播率等于视频播完的个数/观看视频总个数讲代码过程又问了一点，数据去重的方法，count distinct 和group by区别

查看12道真题和解析

点赞评论收藏

分享

07-02 21:26

武汉工程大学 Java

B站一面被狠狠拷打了

📍面试公司：bilibili🕐面试时间：7.2💻面试岗位：数据开发平台实习生❓面试问题：项目细节+手撕算法题🙌面试感想：6.28投的简历，6.30约的7.2的面试。原本只是想投着试试运气没想到过了，导致没啥时间准备，临时准备了八股文结果全部都问项目细节了。。。最后手撕算法挺熟悉但是一下子写不出来再好好准备投秋招正式批吧

查看2道真题和解析

点赞评论收藏

分享

07-02 15:39

已编辑

华南农业大学后端

腾讯pcg大数据一面

自我介绍， 进程的内存空间，虚拟内存和物理内存tcp保证传输可靠，重传机制滑动窗口机制类加载机制，怎么自定义/阻止类加载，双亲委派，集合arraylist和linkedlist，hashmap底层结构，hashtable对比，syn锁和reen..lock区别，syn锁底层怎么实现，分段锁，Threadlocal，内存泄漏，弱引用堆的结构，GC如何判断垃圾。redis数据类型，zset结构如何实现。Redis如何保证不会超卖，实现秒杀手撕：给定数组和amount，数组内每个元素无限，求最少的元素个数凑成amount。我答的依托，要寄

查看16道真题和解析

点赞评论收藏

分享

07-02 11:55

江汉大学大数据开发工程师

携程数据开发timeline

6.30一面 二面一起， 一面完了10分钟后二面一面sql题：连续登陆问题 （快写吐了，这个一定要会）求平均分（去除最高最低分）问题：请你介绍一下hadoop然后就没啥问题 面试官都在推销自己的岗位二面很多问题都不太记得了，主要是拷打实习经历，有个问题问的很好，记忆犹新，问你在实习中犯过最大的错是什么，以及你在实习中获得哪些成长，也没有问具体八股总体，面试难度一般oc

查看3道真题和解析

点赞评论收藏

分享

07-01 00:21

已编辑

西北工业大学 Java

美团数分岗面经（一面秒挂）

这次面试算是主包的大厂处女面，因为之前投递过字节的客户端但是没有认真面哈哈1.自我介绍加拷打项目，由于这个估计是大厂里面的数据清洗岗，主要问的是数据清洗方面的知识问：数据来源，爬虫是否有反爬策略，还有项目的配置关于爬虫是否有反爬策略和项目的配置，主包没有关心过这个问题，（个人项目数据主要还是离线数据），所以答的不好，尤其是第二个项目的配置，主包写了qbs的优化（gpt生成，因为当时网上推荐优化后写成多少多少qbs，我当时只记得可以用jmeter做压力测试），但是没有理解qbs的原理（如何测的qbs）。还有真正的项目部署一定不是在一个机子上面的。2.没有问八股，直接上题目了第一题相当于快排，第二...

查看11道真题和解析

点赞评论收藏

分享

06-30 19:27

门头沟学院大数据开发工程师

亚信万联数据开发面经

1.你用过哪些数据库2.那个数据库你比较熟悉3.项目数据来源4.讲一下你数仓中写过的复杂sql，都是这么写的5.如果这些复杂sql直接从原数据中进行统计，该怎么做？6.讲解一下ODS层跟DWD层7.ODS层跟DWD层之间有什么层吗？8.flink用过吗？9.flink跟spark的哪个实时处理好？10.实习单位有什么期望，在哪种环境中工作？11.你面过哪些公司，你对亚信了解吗？12.你熟悉Python吗11.反问面试官建议：加强sql能力，学会使用AI

查看12道真题和解析

点赞评论收藏

分享

06-29 15:46

中原工学院数据分析师

多点生活一面视频会议

友友们第一次接到这种规模还算可以的公司面试，求指点面试官：做一下自我介绍我：面试官您好，我叫XXX，就读与XXXXX（学院本） 软件工程专业数据与软件开发方向 目前是大三，在校期间主要学习了Hadoop Spark 等大数据相关课程面试官：hive用的多吗我：多，我在学校期间主要做的项目就是数据采集 处理分析，其中处理主要就是利用hive面试官：ok，hive的内部表和外部表有什么区别我：内部表和外部表主要是对于表结构和具体文件数据的关系，外部表的一些表操作比如删除操作，不会删除文件数据，仅仅是删除表的元数据。而内部表的操作就会影响到具体数据文件面试官：ok，hive的静态分区和动态分区的区别我：hive的静态分区主要是在建表的时候就手动指定分区，动态分区是根据表中具体的字段进行分区设置，静态分区之后会产生一个分区列在表结构的最后，但不作为表的具体数据字段。面试官：ok，动态分区主要运用到哪些场景 可以是其他数据类型吗我：主要运用到分区像时间这种，每天一份数据放到不同的日期分区里面存储，这个应该是可以，具体我没有用到过复杂数据类型，不太了解这块面试官：好，OK我这边没什么问题了，你还有什么需要问的吗我：咱们公司这个面试流程是怎么样的我会综合比对一下，如果你过了我这关我后续会联系你的我：好的，那具体薪资这些我就等后续详细再聊，我也没什么了结束断开视频会议

点赞评论收藏

分享

06-29 10:03

门头沟学院数据分析师

多点生活数据开发，处女面面经

1.自我介绍2.用过hive吗3.hive内部表外部表4.hive动态分区5.动态分区灵活性高噶，结束他好像很忙，直接到此结束了，但既然还要我问他一些问题，比如进公司谁带我，部门情况，应该不是不满意吧……

查看5道真题和解析

点赞评论收藏

分享

06-30 16:25

门头沟学院大数据开发工程师

亚信科技数据开发面经

1.你熟悉sql吗2.sql表关联有哪些3.join分类4.case when了解吗5.开窗函数中的排序函数6.问项目7.问比赛8.问几号入职9.口头offer电话面，问的挺简单的，又口头发offer，有点快，内心慌慌的

查看8道真题和解析

点赞评论收藏

分享

06-28 16:50

上海迪士尼_intern(实习员工)

小厂数据开发面经分享(秋招前保持状态)

数据开发上海小厂：1.自我介绍2.未来三年的规划--他要求实习半年以上，主要做一些驻场开发3.mysql建表怎么建4.sql分组求和5.日期函数转置6.项目介绍7.项目主题域的划分8.sql左连接右连接的区别9.介绍公司的业务，主要是写sql

查看8道真题和解析

点赞评论收藏

分享

06-25 23:12

门头沟学院大数据开发工程师

阿里，大数据开发

我面了阿里的大数据开发面试，面试题目如下1 介绍自己，并且挑1到2个项目简单介绍一下2 hadoop生态圈有哪些组件，展开说一下3 做数仓模型该遵循什么规范，数据是怎么治理的，对于异常数据怎么设置监控合理4 实时画像标签有接触吗，对于实时性是怎么定义的，如何确保实时数据绝对准确5 看板工具有啥，对于看板的底层数据如何做到秒级6 如何评价一个数仓干的好，为什么觉得好，如果要你从0到1设计一个数仓全栈你会怎么设计7 你为啥要来阿里，阿里和别的公司比较有啥好处和不好的地方

面试问题记录

点赞评论收藏

分享

06-25 23:37

已编辑

浙江大学大数据开发工程师

25届处女面作业帮一面

时间：6.20面试岗位：大数据面试问题：自我介绍+项目+八股文项目10min，问的比较底层，是我太菜了，基本被拷打八股文15min，问你比较熟悉大数据的那个模块，闭眼就说了spark，结果第一个问题就被拷打住了，然后是一些简单408手撕：找出第k个有序数组的下标，时间复杂度o（logn），想到二分查找，结果这s脑好像宕机了，居然写不出来总结：自己还是太菜了，以为自己掌握的还不错（自己的错觉罢了），结果上来就被问住了，哭哭哭面试体验：面试官人超好，超级有耐心，全程无压力，我答不上的问题，就会换一个来问，第一次面试还是比较紧张，也还是太菜了。岗位非常喜欢，公司也超级喜欢！求求oc许愿二面！发面经攒人品！更新暂不匹配，超级遗憾，还是蛮想去作业帮的，不知道25届能不能投今年的秋招，不同批次能不能投递同一岗位

查看6道真题和解析

点赞评论收藏

分享

07-02 15:29

已编辑

江汉大学大数据开发工程师

字节数据开发timeline

6.20一面自我介绍，项目拷打，数据倾斜的发现，以及如何做的，计算过哪些指标，场景题：计算2024-01-01至今商品的点击率，为了计算该指标，dwd层和dws层该如何构建sql题：将连续的时间展开user_id,s_date,e_date,输出user_id  date_time,求三日内留存率与三日留存率耗时40分钟6.23二面，自我介绍，项目拷打 这里感觉面试官 认为我对项目的理解不够深入，聊了一半开始做题，sql：连续登陆领金币问题，直播间峰值做完题又随便聊了聊，耗时40分钟6.26 加面三面，被面试官狠狠拷打，先拷打项目，先问数据倾斜，join产生数据倾斜该怎么处理，两个小表之间join，产生数据倾斜你有什么好办法，然后延展，两个大表之间join，产生数据倾斜你又有什么好办法。在问spark对比hadoop好在那里，一不小心答到了sparkAQE，在延伸小文件问题，小文件问题除了查询比较慢还有什么其他的坏处这里答道元数据过多，会引起查询慢，直接延伸目录树的存储方式，再来一个场景题 给你1t的内存存储800个g的元数据，你有什么疑问，reduceByKey、groupByKey、combineByKey等几个ByKey算子的区别，并且 combineByKey需要传入几个参数，然后spark 火焰图了解吗？count（distinct user_id） 用spark 怎么写，一道sql题，编程题看我没有刷过力扣直接没出，面试很有难度，特别多场景题，预估是挂掉了，被面试官面到一半汗都出来了，期间穿插各种spark源码相关问题，以及问我有没有看过spark源码。耗时80分钟oc

查看19道真题和解析

点赞评论收藏

分享

玩命加载中

写面经

发动态

发动态

发帖子

写文章

全站热榜

更多

牛客网
牛客网在线编程
牛客网题解
牛客企业服务