面经|北京某小厂(数据开发实习)

1.项目介绍、说明数仓各个分层
2.介绍Hadoop三大组件
3.介绍Hadoop动物园中我常用的一些软件,分别是干什么用的
4.为什么想学数据开发
5.项目中遇到过什么难点(讲了一下数据倾斜以及解决方案)
6.HDFS默认块的大小
7.MR在shuffle过程中reducer是怎么通信的(没听懂)
8.Spark自定义分区
9.合路器(不知道,没听说过,扯了一下MR中的预聚合)
10.Hive中的四个排序
11.HBase的架构
12.Spark的运行机制
13.Spark的优势(讲了AQE)
14.一道SQL

反问

40 mins左右

总体来说面试官给人的印象很好,很和蔼,每个问题都会有反馈,两边也是有什么说什么
全部评论

相关推荐

5 12 评论
分享
牛客网
牛客企业服务