有两张表一张有1000W条数据一张有1000条数据

突然记起前两天做笔试有一道选择则悌不会 题目大概就是  有两张表一张有1000W条数据一张有1000条数据 要联合查询 该怎么优化??
求大佬详解。。
全部评论
使用Hive的map join机制,将小表中的数据添加到内存中,在Map阶段进行表间连接,节省shuffle阶段的数据传输。
点赞 回复 分享
发布于 2017-09-10 10:09
1000条放左边
点赞 回复 分享
发布于 2017-09-10 10:05
HIVE吗?小表放在前面,还有可以加个hint,使用mapjoin
点赞 回复 分享
发布于 2017-09-10 09:58
1000条数据的表放前面
点赞 回复 分享
发布于 2017-09-10 09:49
每次查询是基于主表每一列去右表搜索匹配行的,所以数据量小的做主表效果更好。
点赞 回复 分享
发布于 2017-09-10 09:46

相关推荐

07-17 12:14
门头沟学院 Java
点赞 评论 收藏
分享
05-25 10:45
门头沟学院 Java
Frank_zhan...:没实习一个项目肯定不够,可以再做一个轮子,技术栈再补一个mq,微服务,整体再换个简历模板,暑期尽量再找一个日常实习
无实习如何秋招上岸
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务