Hive专项练习 3

  1. INSERT INTO
  • 直接追加到原始表中,遇到重复数据不会报错,不考虑原始数据
  1. INSERT OVERWRITE
  • 先 remove 删除原始数据,再插入数据、
  1. Hive UDF 函数
  • 不仅需要上传jar包
  • 还需要添加 jar包,进行UDF注册才能使用
  1. distribute by
  • 按照字段划分到不同的reduce文件中输出(多reduce场景)
  • 常用:distribute by + order by
  1. order by
  • 全局排序,1个reduce
  1. sort by
  • 在数据到达reducer之后,在reducer内部对数据进行排序
  • 每个reducer的输出是有序的,但并不保证全局的排序
  1. cluster by
  • distribute by + sort by
  • 只支持acs升序
Hive专项练习 文章被收录于专栏

Hive专项练习错题

全部评论

相关推荐

今年读完研的我无房无车无对象,月入还没有过万 看到他在朋友圈晒房产证,感叹自己白读了这么多年书
梦想是成为七海千秋:那咋了,双9毕业的现在还没存款呢(因为没念完),高中毕业的去直播带货月入几百万也是完全有可能的,退一万步讲,有些人刚出生父母就给买车买房了,上哪说理去,哪怕是同一个起点也会有截然不同的走向,过好自己的生活就完事了。
点赞 评论 收藏
分享
06-04 09:27
门头沟学院 Java
点赞 评论 收藏
分享
强大的马里奥:不太可能,我校计算机硕士就业率99%
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务