先是让我做自我介绍1.hadoop是什么,hadoop的组成,以及每个组件的作用2.hive跟hadoop是什么关系3.hive内部表和外部表的区别4.hive分区和分桶5.hive中order by,clustered by以及sort by区别6.hive中三个开窗排序函数的区别7.hive开窗函数8.hive的基础架构9.hive优化10.数仓分层以及分层的好处11.hive数据倾斜解决方案这个面试官逮住hive问,别的都没问,可能是岗位用hive比较多反问环节:岗位职责公司的数仓是给自己业务做的还是给别人做的(公司自己的业务)大数据部门的组成(面试官说武汉的大数据部门只有4个人,校招准备招3个) #数据人的面试交流地#