9.23 40min 小米大数据一面 mapreduce和spark区别 spark算子 数据倾斜是什么,导致什么问题,怎么解决 groupbykey、reducebykey SQL join,union sparksql、dataframe、dataset 编程:时间复杂度o(n) 空间复杂度O(1) 对不重复不降序数组找出要求的和的数据对 因为超出30min面试官要去面下一个人了,连反问环节都跳过了,过了两天收到二面通知 9.28二面: spark架构、shuffle过程 计算机网相关(拥塞处理,tcp/udp区别,tcp建...