一面:1.自我介绍2.数仓分层3.来了新的业务怎么建模4.选用的什么模型,有什么考量5.如果现在一张事实表一对多一个维度表,此维度表又一对多一个维度表,怎么设计模型6.实习过程中用的什么计算引擎7.spark UI会看哪些内容8.数据倾斜问题怎么解决9.介绍一下项目10.为什么有的指标在下沉的时候要拆开来11.SQL调优,讲一个具体的例子12.SQL题:求中位数二面:1.自我介绍2.对数仓的理解,为什么要有数仓3.数仓和传统的数据库区别在哪里4.介绍一下实习公司数仓的分层5.实习拷打6.严格漏斗模型和非严格漏斗模型的区别是什么7.Spark的RDD是什么8.RDD的容错是怎么实现的9.RDD、DataFrame、DataSet三者的差异10.DataFrame会做哪些优化11.什么是闭包(不知道)12.SQL题:直播间最大人数反问:为什么有些公司有DWM层,有些公司没有,有无DWM层对数仓有什么影响。七天后oc + offer