1.你是数学专业,为什么想去做一个 DE2.有了解过什么计算引擎的源码是怎么实现的吗?3.flink 的处理框架和 spark 的处理框架的区别4.场景题:购物车页面推荐:在用户下单时,统计用户一年的消费情况,以便于在购物车页面做出合理的推荐,这个怎么处理呢?你对这个问题是怎么理解的?5.广播是如何实现的?6.rdd 具体是如何实现的7.spark 里边 partition是什么?8.怎么去识别一个 sparksql 任务是否有倾斜或者需要优化?9.会用 sparkui 吗10.对 jvm 的理解11.堆内内存和堆在内存的理解