牛客192239号

2016-10-26 09:11 山东大学

关注

程序员面试必考题（33）---Hadoop的守护进程

转载自微信公众账号：开店工作室（kaidiancs）

问题：请列出正常工作的hadoop集群中，hadoop都需要启动哪些进程，他们的作用分别是什么？

Hadoop的5个守护进程

Hadoop是由Apache基金会所开发的一个开源的、能够对大数据进行分布式存储和处理的软件框架。Hadoop框架中最核心的设计就是HDFS和MapReduce，HDFS提供了大数据的分布式存储，MapReduce提供了对大数据的分布式计算。

守护进程（Daemon）是一种运行在后台的特殊进程，它独立于控制终端且周期性地执行某种任务或等待处理某些发生的事件。守护进程在它被启动时开始运转，直到被关闭时才退出。

正常工作的Hadoop集群中，在网络分布的不同服务器上运行着一组守护进程，分别是NameNode（名字节点）、DataNode（数据节点）、SecondaryNameNode（次名字节点）、JobTracker（作业跟踪节点）和TaskTracker（任务跟踪节点）。

在分布式存储和分布式计算方面，Hadoop都是采用主/从（Master/Slave）结构。

HDFS的基本架构如图1所示。主节点（Master）服务器上运行NameNode守护进程，从节点（Slave）服务器上运行DataNode守护进程，每个集群有一个SecondaryNameNode守护进程。

NameNode管理分布式文件系统的整体运行状态是否正常、分布式文件系统的命名空间和元数据。例如，NameNode负责执行文件打开、关闭、重命名等操作，跟踪文件如何分块，负责向DataNode分配数据块并建立数据块与DataNode的对应关系。

NameNode中有2个文件，一个是映像文件FsImage，保存整个HDFS文件系统的目录结构；另一个是日志文件Editlog，保存HDFS文件系统操作的日志信息。当NameNode启动时，它首先从映像文件（FsImage）中读取HDFS的状态，接着应用日志文件Editlog更新FsImage内容，并清空Editlog文件。因为NameNode只有在启动阶段才合并FsImage和Editlog，所以久而久之日志文件Editlog可能会变得非常庞大，特别是对大型的集群。日志文件太大的另一个副作用是下一次NameNode启动会花很长时间。

DataNode提供数据块的备份存储。客户端直接与DataNode守护进程通信，读取或写入数据块到本地文件系统的实际文件中；DataNode与其他DataNode进行通信，复制数据块以实现副本存储；DataNode与NameNode通信，持续不断地向NameNode报告，以保持NameNode中元数据为最新状态。

SecondaryNameNode用于监护HDFS集群状态的辅助守护进程。一方面，SecondaryNameNode定期合并FsImage和Editlog日志，将Editlog日志文件大小控制在一个限度内，以减少NameNode重启时间。另一方面，它会与NameNode进行通信，以便定期地保存HDFS元数据的快照。由于NameNode是单点的，通过SecondaryNameNode的快照功能，可以将NameNode的宕机时间和数据损失降低到最小。像NameNode一样，每个集群有一个SecondaryNameNode，因为合并FsImage和Editlog需要大量占用CPU时间，内存需求和NameNode在一个数量级上，所以SecondaryNameNode通常也独占一台服务器，该服务器不会运行DataNode和JobTracter守护进程。

图1.HDFS的基本架构

MapReduce的基本架构如图2所示。主节点（Master）服务器上运行JobTracter守护进程，从节点（Slave）服务器上运行TaskTracter守护进程。

JobTracter监控MapReduce作业的整个执行过程。例如，客户端向JobTracter提交作业后，JobTracter进行作业的初始化准备，查询数据分片，构建和准备相应的Map或Reduce任务，启动TaskTracter节点去执行任务。

TaskTracter管理各个任务在从节点（Slave）上的执行情况。例如，TaskTracter根据所分配的具体任务，获取相应的作业数据，创建所需要的Java虚拟机，并启动相应的Map任务或Reduce任务。若是Map任务，把中间数据保存在本地节点上，若是Reduce任务，则输出数据到HDFS。每个从节点上仅有一个TaskTracter，但每个TaskTracter可以生成多个Java虚拟机，并行处理多个Map或Reduce任务。

TaskTracter定期与JobTracter通信，报告任务的执行情况。若在指定的时间内JobTracter没有收到TaskTracter的消息，认定该TaskTracter崩溃，重新提交相应任务到集群中其他节点执行。

图2.MapReduce的基本架构

图3描述了典型Hadoop集群的结构。为了实现Hadoop系统设计中“计算向数据迁移”的原则，每个从节点同时运行一个DataNode和TaskTracter，以此让每个TaskTracter尽量处理存储在本地DataNode上的数据。在小型集群中，NameNode和JobTracter可以运行在同一个主节点上；在大型集群中，NameNode和JobTracter分别运行在两台机器上。

图3. 典型Hadoop集群的结构

运行Hadoop时需要启动这5个守护进程，启动和停止有3种方式。

启动或者停止全部Hadoop守护进程

启动命令：start-all.sh

顺序NameNode、DataNode、SecondaryNameNode、JobTracker、TaskTracker

停止命令：stop-all.sh

顺序JobTtracker、TaskTracker、NameNode、DataNode、SecondaryNameNode

2.分别启动HDFS和MapReduce

启动HDFS命令：start-dfs.sh

顺序NameNode、DataNode、SecondaryNameNode

启动MapReduce命令：start-mapred.sh

顺序JobTracker、TaskTracker

停止MapReduce命令：stop-mapred.sh

顺序JobTracker、TaskTracker、

停止命令HDFS命令：stop-dfs.sh

顺序NameNode、DataNode、SecondaryNameNode

3．按序逐一启动和停止5个守护进程

启动命令：

hadoop-daemon.sh start namenode

hadoop-daemon.sh start datanode

hadoop-daemon.sh start secondarynamenode

hadoop-daemon.sh start jobtracker

hadoop-daemon.sh start tasktracker

停止命令：

hadoop-daemon.sh stop jobtracker

hadoop-daemon.sh stop tasktracker

hadoop-daemon.sh stop namenode

hadoop-daemon.sh stop datanode

hadoop-daemon.sh stop secondarynamenode

上述命令依次执行。

《横扫offer---程序员招聘真题详解700题》，开点工作室著，清华大学出版社出版，天猫、京东等各大网上书店及实体书店均已开始发售。

全部评论

推荐最新楼层

10-19 18:43

门头沟学院 Java

9.17 多益二面

继续神人公司...实习的收获有哪些？解决的最复杂的问题？方案是mentor告诉的还是自己想的？本硕都是ai，实习也是大模型相关，未来的工作规划是？为什么？对后端开发的技术栈了解哪些？自学的？比如具体到redis，怎么学的？对redis有哪些了解？有看redis的源码吗？了解zset的底层实现吗？了解分片具体是怎么做的吗？对分布式系统的理解是怎样的？了解分布式事务吗？手撕：平常有做一些算法题吗？老师、学生、家长，有相同的属性，面向对象实现各自信息的存储以及权限的校验，支持动态修改部分属性想要动态地修改校验规则，怎么处理？未来三到五年的规划找工作最看重的几个点对我们公司有哪些了解反问

查看17道真题和解析

点赞评论收藏

分享

10-20 10:50

已编辑

南京邮电大学 Java

C++开发面经-华为OD-23届

背景：23年通过牛客招聘认识的栗栗姐，嘻嘻，据栗栗解说，那时候他还有牛客招聘账号可以发岗位，现在只能发发帖子了，啧啧，有点可怜是怎么回事，哈哈哈哈，中间有点事情耽搁了，24年下半年又和栗栗姐联系上了，25年开始正式刷题库参加机考，走的面试流程。机试：三道题目都还挺简单的，一些语法+思维或者基础算法题目。其中有一道是要按照“[[1,2,3],[1,2,3]]”这样的格式输出数组，调输出格式花了点时间。还有一道是关于连通块问题的，用dfs/bfs都可以。技术一面：这个面试官的面试方式比较特殊，面试的形式主要是聊天，会让你去自我介绍，比如自己的经历，优势，项目，擅长哪些内容等等，然后根据你的这些回答...

查看13道真题和解析

点赞评论收藏

分享

10-04 11:53

商洛学院后端工程师

公办学院二本 ，投了两个月简历了，还没有面试，uu们能帮我看一下是哪里的问题嘛，BOSS也是已读不回🥲。谢谢uu们

赛博小保安：你这简历没啥大问题的，经历技能也足够了，问题应该就是出在出身了，学院本就是这样，HR忙着跟92的勾搭呢，哪有心思看我们这些双非😿😭

点赞评论收藏

分享

10-20 14:36

已编辑

哈尔滨工业大学 Java

2026 秋招总结（上）

大家好，我是桂花鱼，2026届 java 选手，随着今年手头的笔面试都告一段落，拿下了 6 个意向：阿里云、达摩院、阿里国际、高德地图、美团、快手（具体面经可以看我之前的文章），也不打算面试别的公司了，秋招基本结束。感觉也是时候对自己本硕 7 年的学习和求职生涯做一个小小的总结吧，也是希望自己的经历可以给大家一些参考。初识 Java说起来也很戏谑，自己从小到大对电脑的记忆都很少，唯二的印象是小时候周末去父亲公司打红警和植物大战僵尸，以及老师要求做 ppt 的时候去表哥家借用电脑，结果最后在高考的时候，因为问了招生办老师哪个专业分数线高，于是选择了计算机这个专业。直到高考完，自己家里才配了第一台...

我的求职进度条

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛客树洞，我想对你说 #

13644次浏览 116人参与

# 大学最后一个寒假，我想…… #

54835次浏览 599人参与

# 快手技术岗信息交流阵地 #

6275次浏览 51人参与

# 如何KTV领导 #

73671次浏览 505人参与

# 牛客周边新品开箱 #

11323次浏览 91人参与

# 机械人集合！你是什么工程师？ #

20811次浏览 91人参与

# 硬件人的春招flag #

52580次浏览 435人参与

# 应届生被毁约被毁意向了怎么办 #

47310次浏览 280人参与

# 求职中的尴尬瞬间 #

5972次浏览 49人参与

# 三一集团提前批进度交流 #

39253次浏览 225人参与

# 机械人避雷的岗位/公司 #

29629次浏览 248人参与

# 大疆工作体验 #

19645次浏览 85人参与

# 牛友的志愿填报指南 #

36017次浏览 188人参与

# 国企还是互联网，你怎么选？ #

172006次浏览 1305人参与

# 怎么给家人解释你的工作？ #

14553次浏览 86人参与

# 得物app工作体验 #

29519次浏览 68人参与

# 你的mentor是什么样的人？ #

18428次浏览 117人参与

# 帮我看看，领导说这话什么意思？ #

24532次浏览 107人参与

# 今年形式下双非本找得到工作吗 #

239269次浏览 1435人参与

# 产品面经 #

224509次浏览 2066人参与

# 校招泡的最久的公司是哪家？ #

15052次浏览 92人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务