task数量和数据的分区相同,一般就是HDFS上的分区的数量,shuffle后分区数的可以通过shuffle.partitons这个参数调整,调整后reduce task的数量就是这个参数配置的。

相关推荐

牛客网
牛客企业服务