1、介绍项目2、项目底层数据来源,数据量,全量还是增量,计算引擎3、spark执行原理4、spark和mr最大的区别是什么5、缓慢变化维是什么,怎么处理6、维度建模(雪花模型 星型模型),数仓开发为什么使用维度建模7、数仓的分层架构,各层之间的区别,依赖关系,维度表放在哪里8、OLAP引擎9、为什么想做数仓10、数据质量(dqc sla)11、如果没有按时产出,原因可能是什么?(我答的是任务失败导致的 比如数据倾斜面试官说还可能由于上游数据没有及时产出)sql手撕1、判断主键唯一性怎么写代码(selectuserid spuid count)2、连续登录问题