1.项目介绍、说明数仓各个分层2.介绍Hadoop三大组件3.介绍Hadoop动物园中我常用的一些软件,分别是干什么用的4.为什么想学数据开发5.项目中遇到过什么难点(讲了一下数据倾斜以及解决方案)6.HDFS默认块的大小7.MR在shuffle过程中reducer是怎么通信的(没听懂)8.Spark自定义分区9.合路器(不知道,没听说过,扯了一下MR中的预聚合)10.Hive中的四个排序11.HBase的架构12.Spark的运行机制13.Spark的优势(讲了AQE)14.一道SQL反问40 mins左右总体来说面试官给人的印象很好,很和蔼,每个问题都会有反馈,两边也是有什么说什么