1. 自我介绍2. 拷打项目3. 再让你做一次你的项目,你会怎么做(这里我说了paimon,给自己埋坑了)4. 数仓建模的理念5. 维度建模的流程6. spark的算子执行过程7. spark的数据倾斜体现以及怎么解决8. Flink的状态过期策略9. Flink的双流join10. Flink的聚合和计算是怎么实现的11. Flink的checkpoint机制12. 场景题:Flink计算历史留存,你会怎么计算13. 场景题:如果离线的t-1数据没产出,你怎么办 (Flink计算t-1的数据14. 场景题: Flink故障恢复时候,要拉取到多少天之前的数据? (我说checkpoint,告诉我如果要用新的算子就无法使用checkpoint)15. doris的读写流程是怎么样的?16. paimon的changelog种类?(paimon就学了点原理,我哪知道这个17. paimon的model xxx种类?18. iceberg如何实现故障恢复?50min,无手撕反问:1. 业务2. 应届生要求3. paimon的理解4. 没手撕吗? 得到的答案是有的有有的没有,主要看笔试(只a1道的我瑟瑟发抖感觉挂,面试官说要跟leader沟通下更新:50min后已挂,原来和leader沟通下是挂了的意思