面经|北京某小厂(数据开发实习)
1.项目介绍、说明数仓各个分层
2.介绍Hadoop三大组件
3.介绍Hadoop动物园中我常用的一些软件,分别是干什么用的
4.为什么想学数据开发
5.项目中遇到过什么难点(讲了一下数据倾斜以及解决方案)
6.HDFS默认块的大小
7.MR在shuffle过程中reducer是怎么通信的(没听懂)
8.Spark自定义分区
9.合路器(不知道,没听说过,扯了一下MR中的预聚合)
10.Hive中的四个排序
11.HBase的架构
12.Spark的运行机制
13.Spark的优势(讲了AQE)
14.一道SQL
反问
40 mins左右
总体来说面试官给人的印象很好,很和蔼,每个问题都会有反馈,两边也是有什么说什么
2.介绍Hadoop三大组件
3.介绍Hadoop动物园中我常用的一些软件,分别是干什么用的
4.为什么想学数据开发
5.项目中遇到过什么难点(讲了一下数据倾斜以及解决方案)
6.HDFS默认块的大小
7.MR在shuffle过程中reducer是怎么通信的(没听懂)
8.Spark自定义分区
9.合路器(不知道,没听说过,扯了一下MR中的预聚合)
10.Hive中的四个排序
11.HBase的架构
12.Spark的运行机制
13.Spark的优势(讲了AQE)
14.一道SQL
反问
40 mins左右
总体来说面试官给人的印象很好,很和蔼,每个问题都会有反馈,两边也是有什么说什么
全部评论
相关推荐
点赞 评论 收藏
转发