07-04 14:04 已编辑北方工业大学大数据开发工程师发布于天津

关注

字节数开面试-抖音

一面（面试官很好！很有耐心！）
1.spark中rdd叫弹性分布式数据集，这个弹性的含义
2.小文件的危害以及怎么处理
3.spark中宽依赖、窄依赖
4.stage的划分
5.kafka怎么保证数据不重复消费（没回答上，但说了怎么重复消费数据）
6.checkpoint机制
7.spark的三种join（boardcast join,sort merge join,shuffle hash join）
7.四道sql（前两道很简单，第三道次日留存和七日留存，第四道连续登录问题）
8.算法题：移动最少区间个数使得剩余区间无重叠
  1. 输入：[1,2][2,3][4,6][1,3]
  2. 输出：1
  3. 解释：移除[1,3]后，剩余区间无重叠
（面试后在牛客网看见有人分享这道算法题）
一面最后面试官还问我以后的计划，我说打算先实习明年春招边实习边找工作，她居然问我没想留着字节吗（我当然想！）
中间有些问题没想起来，耗时1小时40分钟

二面（面试官很好！问的都是和数仓相关的，结合我的实习问）
1.之前工作都干了什么
2.之前实习搭建数仓的结构
3.了解事实表吗，了解维度表吗
4.怎么和其他人对接的
5.你属于风控部门，但主要是构建数仓开发，那有没有和其他数据开发人员交流过
6.你只有一段实习吧，那实习前后有什么感悟吗
7.为什么要选择数据开发（我说因为之前实习是干数仓的，他说不要因为之前干什么就觉得以后三十年干什么，实习还是丰富点，看看干什么）
8.最后反问
二面耗时50分钟，感觉面试官对我回答的第七个问题不满意，只是我明年要毕业了，得多来一份垂直的实习

建议多复习spark、hive方面的八股文、概念问题，实习生主要负责离线数仓开发#牛客AI配图神器#

全部评论

推荐最新楼层

活泼的考拉开挂了

华侨大学网络安全

spark弹性定义

点赞回复分享

发布于 07-07 10:26 湖北

牛客476720262号

广东工业大学数据仓库

蹲蹲楼主oc了吗

点赞回复分享

发布于 07-05 15:04 广东

08-27 11:07

东北林业大学大数据开发工程师

字节数据开发一面

开头聊实习，项目八股：知道数据倾斜吗？说一下mapreduce工作原理spark了解吗怎么判断一个sql需要优化应该怎么去写一个高效的sql那些操作可能会导致数据倾斜手撕：两个字段的sql表，一个关注者，一个粉丝，找出互相关注的行，去重后返回

查看7道真题和解析

点赞评论收藏

分享

08-06 22:43

河北工业大学大数据开发工程师

字节数据平台_数据开发实习一面

1.自我介绍2.简历上实习经历拷打3.spark的执行原理4.宽窄依赖的区别5.sql题：①sql实现分别实现最近7天观看不同视频个数的前五名的userid，②观看超过50个视频的女性中，完整观看率最高的10个用户总结：hr打电话通知的时候说是校招，当时我还纳闷都还没投呢怎么就给面了，结果面试的时候一聊是实习😅，感觉kpi面了，面试官全程没露脸。sql题写完连反问都没有就要结束😂，还是我追着他问了几句😓

查看6道真题和解析

点赞评论收藏

分享

08-28 14:52

安徽大学硬件开发

海信直接给我挂了

我之前投的海信的信动力计划进了简历库信动力计划结束了我打算投海信的秋招结果直接显示我进入人才库了？海信这是自动给我信动力转秋招然后给我挂了？

投递海信集团等公司9个岗位

点赞评论收藏

分享

08-11 23:52

重庆大学 Java

8.8虾皮一面(大数据平台开发)

1.介绍一下这个关系型数据库的索引2.索引的结构为什么是B+tree?追问什么B+tree的层级很重要，为什么多访问几次就会慢很多。3.有没有遇到过索引失效的场景4.你有知道full-text全文索引5.你知道用索引的好处和缺点嘛，加问如果不考虑磁盘空间，那么索引的坏处是什么6.场景题:有一张千万级别的表，现在我们要新增一个字段，选择新加一个字段还是用原表后面的冗余字段是用新字段7.数据库有张表热表,QPS 很高，现在他是一个异构的数据，怎么保证两边数据的一致性。追问如果服务降级降到MySQL，如果MySQL数据有延迟怎么办8.MySQL中的锁，你都用过哪些锁，它能在哪个存储引擎里面9.介绍一下悲观锁和乐观锁算法题很简单，可能看到我是年纪不大对我手下留情了。总结:整体难度远小于字节，八股较多，但是有一些我没有背全，有所疏漏。场景题蒙对了但是之前没看过，所以原因不太对。数据一致性当时面试脑袋卡壳了没回答的很好，可能主要是这个岗位是大数据所以一直在问数据库。感觉自己对于某些知识点深挖不够，导致面试的时候一个追问就可能问懵。应该是KPI面，岗位都不是很匹配

查看9道真题和解析

点赞评论收藏

分享

08-25 17:05

门头沟学院大数据开发工程师

字节大数据一面

1. 自我介绍2. 挑一段你觉得收获最大的实习经历聊聊吧。比如当时做的业务是什么，技术用在了什么场景，最后有没有一些具体的指标来衡量效果？3. 我们来聊聊数仓吧，为什么要对数据仓库进行分层设计？4. Hive里的视图（View）用过吗？它主要是解决什么问题的？5. Hive的分区和分桶，能讲讲它俩的区别和各自的应用场景吗？6. 能详细说说Spark的shuffle过程吗？7. 在之前的工作中，有没有碰到过什么让你印象深刻的性能优化案例？8. 大数据处理中常说的数据倾斜，一般是什么原因造成的？你都知道有哪些解决方法？9. 编程语言这块，你比较熟悉哪些？10. MySQL索引的底层原理是什么？能展...

查看13道真题和解析

点赞评论收藏

分享

评论

5

13

招聘动态

米哈游2026校园招聘

蔚来2026届校园招聘

海信集团

2026届校园招聘

红杉中国

2026届联合校招

携程集团

2026届校园招聘

哔哩哔哩

2026届秋季校园招聘

理想汽车

2026届校园招聘

基恩士

2026秋季校园招聘

正浩创新EcoFlow

2026届秋季校园招聘

电科金仓

2026校园招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 发面经攒人品 #

74440次浏览 1319人参与

# 大厂无回复，继续等待还是奔赴小厂 #

214449次浏览 1453人参与

# 巨人网络求职进展汇总 #

51917次浏览 333人参与

# 实习心态崩了 #

24730次浏览 187人参与

# 我的秋招日记 #

179386次浏览 3093人参与

# 听到哪句话代表面试稳了OR挂了？ #

29378次浏览 195人参与

# 开立医疗秋招 #

174次浏览 13人参与

# 简历无回复，你会继续海投还是优化再投？ #

96946次浏览 800人参与

# 邪修秋招思路 #

5089次浏览 84人参与

# 一起聊字节 #

4085次浏览 48人参与

# 柠檬微趣工作体验 #

10356次浏览 61人参与

# 25届如何提前做秋招准备？ #

181767次浏览 2506人参与

# 你被哪些公司挂了？ #

21094次浏览 127人参与

# 哪些公司一直卡在简历筛选 #

20239次浏览 114人参与

# 实习学到最有价值的工作习惯 #

9651次浏览 80人参与

# 机械人值得去的小众企业 #

17909次浏览 47人参与

# 你觉得第一学历对求职有影响吗？ #

115275次浏览 777人参与

# 正在春招的你，也参与了去年秋招吗？ #

320020次浏览 2548人参与

# 你认为小厂实习有用吗？ #

82781次浏览 571人参与

# 一人一道大厂面试题 #

23105次浏览 274人参与

# 科大讯飞工作体验 #

23279次浏览 53人参与

# 实习最晚的一次下班是几点 #

6496次浏览 54人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务