9.11 一面 35min:1.自我介绍2.专业介绍3.Mysql索引4.Mysql事务并发导致的问题5.Mysql两种引擎的对比6.Hadoop运行模式7.job tracker 作用8.Hdfs小文件问题9.Hadoop调度器10.Hadoop脑裂出现的原因11.Kafka 怎样保证不丢数据12.Flink task和subtask 的区别13.并行度和slot的关系14.Flink分组和分区的区别15.flink时间语义16.Watermark的理解17.Flink的checkpoint18.Datax用法 怎么实现增量同步数据19.Hive和mysql的区别20.Hive内部表外部表区别21.Hive窗口函数22.数据倾斜23.Spark运行模式24.RDD弹性体现25.Spark reducebykey 和 groupbykey 区别26.Map和mapPartition的区别27.Hbase rowkey设计原则28.Hbase二级索引原理29.Clickhouse与hive区别30.Clickhouse物化视图31.Flink写入clickhouse数据一致性32.实习工作内容33.反问----------------------------9.12 通知一面通过泡池子 回复面试官没时间----------------------------10.11 挂