来自同事的数开面经,速速发出来供大家参考自我介绍了解实习经历针对实习项目,问数据层次怎么分层数据分层的作用针对具体实习项目,说明业务逻辑说明实习项目的“订单量”这个指标从源头到产出的ETL过程针对实习项目,复盘后最大的难点是什么复盘之后有什么收获你刚才说复盘收获是处理小文件,那么spark怎么处理小文件的?处理小文件有哪些方法,举例子hive冷热分离的方法你刚才提到了组里有做ec存储,你了解ec存储吗暑期实习有什么感受,转正了吗 15分钟了解spark的semi join吗,他是干嘛的了解spark的AQE,这是什么你刚才讲AQE提到了广播机制,这个在spark中很重要,讲讲广播过程呢了解网络...