有两张表一张有1000W条数据一张有1000条数据

突然记起前两天做笔试有一道选择则悌不会 题目大概就是  有两张表一张有1000W条数据一张有1000条数据 要联合查询 该怎么优化??
求大佬详解。。
全部评论
使用Hive的map join机制,将小表中的数据添加到内存中,在Map阶段进行表间连接,节省shuffle阶段的数据传输。
点赞 回复 分享
发布于 2017-09-10 10:09
1000条放左边
点赞 回复 分享
发布于 2017-09-10 10:05
HIVE吗?小表放在前面,还有可以加个hint,使用mapjoin
点赞 回复 分享
发布于 2017-09-10 09:58
1000条数据的表放前面
点赞 回复 分享
发布于 2017-09-10 09:49
每次查询是基于主表每一列去右表搜索匹配行的,所以数据量小的做主表效果更好。
点赞 回复 分享
发布于 2017-09-10 09:46

相关推荐

04-25 19:29
已编辑
宁波大学 运营
被普调的六边形战士很高大:你我美牛孩
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务