1. 自我介绍2. 挑一段你觉得收获最大的实习经历聊聊吧。比如当时做的业务是什么,技术用在了什么场景,最后有没有一些具体的指标来衡量效果?3. 我们来聊聊数仓吧,为什么要对数据仓库进行分层设计?4. Hive里的视图(View)用过吗?它主要是解决什么问题的?5. Hive的分区和分桶,能讲讲它俩的区别和各自的应用场景吗?6. 能详细说说Spark的shuffle过程吗?7. 在之前的工作中,有没有碰到过什么让你印象深刻的性能优化案例?8. 大数据处理中常说的数据倾斜,一般是什么原因造成的?你都知道有哪些解决方法?9. 编程语言这块,你比较熟悉哪些?10. MySQL索引的底层原理是什么?能展...