数据倾斜数据预处理,这个是治标不治本的方法,把数据处理提前交给Hive处理,这样Spark就省掉了聚合的操作,但hive在聚合的时候同样会发生数据倾斜。

相关推荐

牛客网
牛客网在线编程
牛客网题解
牛客企业服务