Hive中两大表连接,发生了数据倾斜,有一个reduce无法完成,检查发现t1中guid=''的记录有很多,其他guid都不重复,这条语句该怎样优化? select t1.* ,nvl(t2.x,1) from t1 left join t2 on t1.guid = t2.guid
select t1.*, nvl(t2.x,1) from t1 left join t2 on (case when t1.guid='' then concat('yuewen', rand()) else t1.guid end)=t2.guid;
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题