一面——60mins自我介绍拉链表的制作,数据量有多少,为什么不用快照表呢项目有哪些表数仓分层有哪些,具体做了什么,数仓分层作用怎么设计表,怎么建模,DIMDWD层的主题分了哪些如何做的可视化什么是数据倾斜,数据倾斜的解决方案Hadoop和spark的区别Spark的shuffle流程是怎么样的对哪些数据库了解Shuffle有哪几种类型在shuffle的过程中会进行排序吗,有哪几种排序什么是快速排序,时间复杂度是多少,手撕快排代码题Spark是如何划分stage阶段Spark SQL的执行流程,如何将一个SQL语句转换为任务宽窄依赖,宽依赖阶段会发生什么两个SQL题反问