有两张表一张有1000W条数据一张有1000条数据

突然记起前两天做笔试有一道选择则悌不会 题目大概就是  有两张表一张有1000W条数据一张有1000条数据 要联合查询 该怎么优化??
求大佬详解。。
全部评论
使用Hive的map join机制,将小表中的数据添加到内存中,在Map阶段进行表间连接,节省shuffle阶段的数据传输。
点赞 回复 分享
发布于 2017-09-10 10:09
1000条放左边
点赞 回复 分享
发布于 2017-09-10 10:05
HIVE吗?小表放在前面,还有可以加个hint,使用mapjoin
点赞 回复 分享
发布于 2017-09-10 09:58
1000条数据的表放前面
点赞 回复 分享
发布于 2017-09-10 09:49
每次查询是基于主表每一列去右表搜索匹配行的,所以数据量小的做主表效果更好。
点赞 回复 分享
发布于 2017-09-10 09:46

相关推荐

风中翠竹:真的真的真的没有kpi。。。面试官是没有任何kpi的,捞是真的想试试看这个行不行,碰碰运气,或者是面试官比较闲现在,没事捞个人看看。kpi算HR那边,但是只有你入职了,kpi才作数,面试是没有的。
双非有机会进大厂吗
点赞 评论 收藏
分享
07-15 12:24
重庆大学 运营
坏消息:和好工作擦肩而过
给点吧求求了:怎么可能因为差几秒,估计就是简历更好看婉拒了
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务