牛客114415059号

2022-08-19 14:23 已编辑大数据开发工程师发布于北京

关注

Hive：sql转mr任务源码解析

当我们执行一条sql的时候，程序的执行入口其实是org.apache.hadoop.hive.cli.CliDriver这个类，那么这个类有一个主方法的内容是new CliDriver().run(args)
进入run()方法，可以看到刚开始就new OptionProcessor()（选项处理器，用来处理args参数的），其中有两个方法，process_stage1(args)，这个是用来解析通过命令行输入的参数，例如临时生效的hive参数等等，要是传入参数不正确，那么直接返回报错，返回1。
再往后，是ss.in(),ss.out()定义输入输出流，还有信息和错误的打印，因为我们打开客户端后，需要写sql得到结果，所以这里是需要输入输出流的，若注册流错误，返回3
往下面是可以看到OptionProcessor()的另一个方法process_stage2(ss)的调用，不过这一次传的参数是ss，里面就有定义数据库等参数的解析，默认是default数据库。这一步传参错误，返回2。
往下是用HiveConf()对参数进行一个封装，封装成key，value
再往后conf.getVar(HiveConf.ConfVars.CLIPROMPT),这个参数其实就是hive.cli.prompt，默认是hive，这个其实就是打开客户端，前面有一个hive显示
再往后就是executeDriver(ss,conf..)
进入executeDriver()方法，先判断执行引擎是否是mr，也可以配置tez，spark程序
再往下是setupConsoleReader()初始化控制台阅读器，定义了一个关键的变量，prefix。
再往下是while循环阅读readLine阅读每一行，后面是多个if判断，
- 若输入的是一个空串，那么prefix += '\n'
- 若输入的航是以"--"开头的，只能continue，因为这个是注释
- 若是以';'结尾，往下执行解析hql语句 cli.processLine()
- 若不是以';'结尾，prefix+=line，直到读到';'才会解析数据
进入processLine()解析sql的方法，前面的代码splitSeiColon(line)，对一行按照';'进行切分，因为读取到最后一个字符是';'，不一定这一行只有一个分号，返回一个List
执行List<string>里的语句，用precessCmd()运行</string>
processCmd()里有四大内容，第一个是，可以输入exit或者quit退出，并且不会区分大小写；第二部分是输入source，在里面执行一个hql文件；第三部分是以感叹号开头的，以感叹号开头表示执行shell命令；第四部分就是sql的执行，执行方法是processLocalCmd()，里面主要是由一些控制台打印的信息
里面运行IDriver.run(cmd，false)的方法
里面有parserUtil.parserDriver()方法,parserDriver()将hql转化为token，对token进行解析，生成AST
再往后是sem.analyze()方法，SemanticAnaylzer()，将AST转化为QueryBlock,将QUERYBlock转换为OperatorTree，OperatorTree进行逻辑优化生成TaskTree，TaskTree执行物理优化。
最后是TaskRunner.runSequential(),ExcDriver()，获取MR临时工作目录，定义Partitioner，定义Mapper和Reducer，实例化job提交job

#阿里面试##字节面试##美团面试#

全部评论

推荐最新楼层

大数据开发工程师

总结得好细自己看源码总结的吗厉害大佬

点赞回复

发布于 2022-09-25 10:54 北京

阿嘟嘟昆博

Java

大佬

点赞回复

发布于 2022-09-29 10:48 重庆

联易融

校招火热招聘中

官网直投

西街的故事

04-25 10:15

Java

聊聊阿里淘天集团职级和绩效考核调整方案

1、职级调整方案增加P8及以下的层级，由原本的P4-P8五个层级调整为14-28十五个层级；原P8及以上员工不再自主晋升，而是组织直接任命，根据业务规模和团队规模来决定薪资和奖金，要让处于管理岗位的人“能者上、庸者下”；激励机制上，员工的奖金和回报不与层级关联，而与实际贡献关联。当然，职级调整的目的着眼于激励，员工的奖金和回报不与层级关联，而与实际贡献关联。这个说起来容易，做起来不容易。关键点在于实际贡献如何衡量？衡量的工具常见的就是绩效考核，所以淘天集团在职级调整的同时也开始进行绩效考核方案的调整。2、绩效考核方案缩短考核周期由原本的半年一次考核、一年发放一次年终奖，改为每个季度考核、年终再...

投递阿里巴巴等公司10个岗位 >

点赞评论收藏

转发

牛客491297979号

03-02 11:55

太原理工大学计算机类

Java25暑期实习，求指点简历

只做了两个烂大街的项目，我把两个项目合一起了。大佬们帮我看看简历还有什么可以优化的地方吗？ #Java# #实习# #简历#

点赞评论收藏

转发

04-23 10:48

已编辑

西北大学新闻传播学类

中科大复试被刷。。。四月初找工作基本无面试岗位回复少春招结束了还泡在池子里😭

投递中国科学技术大学等公司10个岗位

点赞评论收藏

转发

04-23 09:10

网龙网络公司_人力_HR

4月份基本上快投满了，还在犹豫的赶紧完善好简历投出去吧，千万不要一直捏在手里，早投占hc！！【公司介绍】网龙网络是《征服》《魔域》等多款爆款游戏的生产者，是中国网络游戏行业领军者。【招募岗位】产品类、技术类、美术类、市场类、职能类，所有专业皆可投递。【福利待遇】薪酬福利:极具竞争力固定薪酬+浮动奖金+五险一金+各类节假日福利，部分岗位可达年薪40w~50w；其他福利包括但不限于年度体检、名医驻点、商业保险、就医协助、各类运动和健身休闲场所。【官方投递通道】网申链接：nd.zhiye.com/campus/jobs【内推码】ESKG0K（简历优先被筛选，加速流程推进）投递完后在评论回复【姓名缩写...

点赞评论收藏

转发

1 10 评论

招聘动态

联易融2024届营销管培生校园招聘

全站热榜

正在热议

# 牛客帮帮团来啦！有问必答 #

336164次浏览 7069人参与

# 晒一晒我的offer #

2750405次浏览 49389人参与

# 华为求职进展汇总 #

430817次浏览 4321人参与

# 第一次面试 #

12966次浏览 199人参与

# 非技术岗薪资爆料 #

4041次浏览 94人参与

# 机械人怎么评价今年的华为 #

47028次浏览 374人参与

# 你更愿意参加线上面试还是线下面试？ #

3482次浏览 48人参与

# 来聊聊机械薪资天花板是哪家 #

17164次浏览 130人参与

# 应届生应该先就业还是先择业 #

10429次浏览 103人参与

# 找工作，你会甘心进小厂还是猛冲大厂 #

21752次浏览 208人参与

# 百度工作体验 #

18874次浏览 205人参与

# 为什么那么多公司毁约 #

31907次浏览 267人参与

# 实习工作，你找得还顺利吗？ #

4718次浏览 69人参与

# 除了offer，现在你还缺点啥？ #

1808次浏览 42人参与

# 讲讲我经历过的年终奖 #

5758次浏览 76人参与

# 通信硬件人笔面经互助 #

59125次浏览 1325人参与

# 如果校招重来我最想改变的是 #

69799次浏览 1374人参与

# 通信硬件薪资爆料 #

133077次浏览 901人参与

# 租房前辈的忠告 #

19573次浏览 1567人参与

# 毕业后不工作的日子里我在做什么 #

39826次浏览 582人参与

牛客网
牛客企业服务