字节Data大数据开发暑期实习面经

一面3.11
自我介绍
Spark SQL
Spark AQE
spark和mr的区别
宽窄依赖 和 会触发宽窄依赖的算子
Hadoop组件
HDFS读写流程
数仓分层
两个建模理论
窗口函数的范围
三个排序聚合函数
SQL题

二面3.14
自我介绍
Hive和Spark的区别
数仓分层
算法题
最大利润买卖股票 买卖一次和无限买卖
你的优点缺点

三面3.19
算法题
有序数组中求某个数出现的次数

讲讲你自学的知识
最近有看过哪些技术类书籍
聊聊书中不好理解的部分
为什么想做数仓
成绩咋样
平时喜欢干什么
未来的学习计划

HR面3.25
当天下午发offer

一面录音没录上,靠着记忆写的。感觉字节hc还是挺多的。
全部评论
佬能捞我进去嘛
2 回复 分享
发布于 04-17 16:34 湖南
佬是是字节哪个部门
1 回复 分享
发布于 04-11 01:24 江苏
请问大佬算法题是本地用acm模式写嘛
1 回复 分享
发布于 03-31 09:19 广东
好厉害
点赞 回复 分享
发布于 03-31 09:18 广东

相关推荐

一面(面试官很好!很有耐心!)1.spark中rdd叫弹性分布式数据集,这个弹性的含义2.小文件的危害以及怎么处理3.spark中宽依赖、窄依赖4.stage的划分5.kafka怎么保证数据不重复消费(没回答上,但说了怎么重复消费数据)6.checkpoint机制7.spark的三种join(boardcast join,sort merge join,shuffle hash join)7.四道sql(前两道很简单,第三道次日留存和七日留存,第四道连续登录问题)8.算法题:移动最少区间个数 使得剩余区间无重叠1. 输入:[1,2][2,3][4,6][1,3]2. 输出:13. 解释:移除[1,3]后,剩余区间无重叠(面试后在牛客网看见有人分享这道算法题)一面最后面试官还问我以后的计划,我说打算先实习明年春招边实习边找工作,她居然问我没想留着字节吗(我当然想!)中间有些问题没想起来,耗时1小时40分钟二面(面试官很好!问的都是和数仓相关的,结合我的实习问)1.之前工作都干了什么2.之前实习搭建数仓的结构3.了解事实表吗,了解维度表吗4.怎么和其他人对接的5.你属于风控部门,但主要是构建数仓开发,那有没有和其他数据开发人员交流过6.你只有一段实习吧,那实习前后有什么感悟吗7.为什么要选择数据开发(我说因为之前实习是干数仓的,他说不要因为之前干什么就觉得以后三十年干什么,实习还是丰富点,看看干什么)8.最后反问二面耗时50分钟,感觉面试官对我回答的第七个问题不满意,只是我明年要毕业了,得多来一份垂直的实习建议多复习spark、hive方面的八股文、概念问题,实习生主要负责离线数仓开发
点赞 评论 收藏
分享
评论
16
53
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务