首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
进击的喵
2015-04-15 00:32
已编辑
牛客大学 Java
关注
已关注
取消关注
《Hadoop核心技术》技术问答
【图书介绍】
本书由百度资深Hadoop技术专家和高级算法工程师撰写,结合百度大数据实践,直击企业痛点,多位大数据技术专家联袂推荐!
【抢答问题】
1. HDFS是通过什么机制保证数据可靠性的?
2. HDFS默认的块大小是多少?
3. Hadoop默认的调度器是什么?
4. Hadoop MapReduce有哪些编程接口?
提示
全部评论
推荐
最新
楼层
net_hare
1.Hadoop 的冗余复制机制,这种机制保证了存放在 HDFS 中的数据的高可靠性和数据的完整一致性。 2. 原来是 64M,Hadoop-2.4.0 中 HDFS 文件块大小默认为 128M 3.Hadoop 中默认的调度器,它先按照作业的优先级高低,再按照到达时间的先后选择被执行的作业( FIFO )。 4. 可以分为两层。第一层是最基本的 Java API ,主要有 5 个可编程组件,分别是 InputFormat 、 Mapper 、 Partitioner 、 Reducer 和 OutputFormat 。 Hadoop 自带了很多直接可用的 InputFormat 、 Partitioner 和 OutputFormat ,大部分情况下,用户只需编写 Mapper 和 Reducer 即可。第二层是工具层,位于基本 Java API 之上,主要是为了方便用户编写复杂的 MapReduce 程序和利用其他编程语言增加 MapReduce 计算平台的兼容性而提出来的。在该层中,主要提供了 4 个编程工具包 , 为 JobControl 、 ChainMapper/ChainReducer 、 Hadoop Streaming 、 Hadoop Pipes。 微博昵称:@net_hare
点赞
回复
分享
发布于 2015-04-28 22:55
batmanhaha
东北林大 Java
//只对Hadoop2.x case1:冗余复制机制,默认三份上边讲的很详细了.还有就是保证NameNode的HA每人说. Hadoop2.0有NameService来负责代替NameNode,其中有两个Active,StandBy, Zookeeper来协调管理服务,保证只有一个活跃的NameNode.解决了NameNode的SPOF相关 的HA问题。 case2: 2.x 128MB--default case3: FIFO--default case4:Mapper,Reducer--Core,Partitioner,Combiner Hadoop Streaming:任何语言写MR Hadoop Pipes:C++接口,不了解
点赞
回复
分享
发布于 2015-09-12 14:44
YLer
北京邮电大学 算法工程师
1.HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。默认配置下,一份数据会有三个副本。 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3.默认是FIFO,就是先来先服务 4.Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 ps 学生一枚,目的单纯,想要赠书 微博:@YLer_我还是喜欢这个名字
点赞
回复
分享
发布于 2015-04-29 10:25
本王随风富贵荒淫无道
1. HDFS是通过什么机制保证数据可靠性的? a.通过“心跳机制”周期性地确保Datanode上的数据是否有效,每个 Datanode 节点周期性地向 Namenode 发送心跳信号。网络分区可能导致一部分 Datanode 跟 Namenode 失去联系。 Namenode 通过心跳信号的缺失来检测这一情况,并将这些近期不再发送心跳信号 Datanode 标记为宕机,不会再将新的 IO 请求发给它们。 任何存储在宕机 Datanode 上的数据将不再有效。Datanode 的宕机可能会引起一些数据块的副本系数低于指定值, Namenode 不断地检测这些需要复制的数据块,一旦发现就启动复制操作。在下列情况下,可能需要重新复制:某个 Datanode 节点失效,某个副本遭到损坏,Datanode 上的硬盘错误,或者文件的冗余因子增大。 b.通过“冗余副本策略”增加数据的备份数,应对了由于设备问题造成的数据丢失。 c.通过“安全模式”在程序启动时设置namenode为只读,确保副本为安全之后,才打开namenode读写,以确保备份数据可靠。 d.通过“checksum”校验和对于写入的数据进行备份校验。 2. HDFS默认的块大小是多少? Hadoop-2.X中128M,在Hadoop-1.X中64M。 3. Hadoop默认的调度器是什么? 默认调度器为FIFO。 4. Hadoop MapReduce有哪些编程接口? Hadoop MapReduce有InputFormat、Mapper、Partitioner、Reducer和OutputFormat 5个可编程接口。 微博昵称:@本王随风富贵荒淫无道本王随风富贵荒淫无道 本王随风富贵荒淫无道
点赞
回复
分享
发布于 2015-04-28 11:06
永远支持小丽丽
江西科技师范大学 Java
1.冷备机制、租约机制、数据的正确性与一致性、系统升级回滚、安全模式; 2.64M 3.默认调度器FIFO 4. InputFormat/Mapper/Partitioner/Combiner/ Reducer/OutputFormat
点赞
回复
分享
发布于 2015-04-27 16:29
zencoding
华东师大 算法工程师
Question 1. HDFS是通过什么机制保证数据可靠性的? Answer1: (1)冗余副本策略:所有数据块都有副本,可以在hdfs-site.xml中设置副本系数,Datanode启动时,遍历本地文件系统,产生一份 hdfs数据块和本地文件的对应关系列表(blockreport)汇报给namenode。 (2)机架感知策略:集群一般放在不同机架上,机架间带宽要比机架内带宽要小,有利于在组件失效时负载均衡。 (3)安全模式:Namenode启动时会先经过一个“安全模式”的特殊阶段。 (4)心跳机制 :Namenode周期性从datanode接收心跳信号和块报告 (5)校验和 :在文件创立时,每个数据块都产生校验和 (6)回收站 :删除文件时,其实是放入回收站/trash (7)元数据保护 :备份NameNode上持久化存储的元数据文件,然后转储到远程的NTF文件系统中。另外也可以使用 SecondaryNameNode来备份NameNode的元数据。 (8)快照机制:支持存储某个时间点的映像,需要时可以使数据重返这个时间点的状态 Question2. HDFS默认的块大小是多少? Answer2:HDFS数据块的默认大小是64MB,而且在不少实际部署中,HDFS的数据块甚至会被设置成128MB甚至更多。 Question3:Hadoop默认的调度器是什么? Answer3:默认调度算法FIFO(First In First Out) Question4:Hadoop MapReduce有哪些编程接口 Answer4:InputFormat、Mapper、Partitioner、Reducer和OutputFormat。 By:@zenwannnnnnnnnnnnnnnnnnnnnnnnn
点赞
回复
分享
发布于 2015-04-27 15:07
mal_s
1. HDFS是通过什么机制保证数据可靠性的? 答: 1)Secondary NameNode对NameNode中元数据提供冷备方案 2)NameNode在打开或创建一个文件准备追加写之前,会与此客户端签订一份租约,保证可靠性,同时可避免由于客户端停机等意外带来的资源长期霸占。 3)通过每个数据块上的版本标识保证数据可靠性 4)升级集群Hadoop时,HDFS可允许管理员恢复早期版本,并且将集群状态回滚到升级前,避免未知的bug造成的影响 5)在启动时,NameNode在安全模式中不发生文件块的复制,只接受块报告。 2. HDFS默认的块大小是多少? 答: 64m 3. Hadoop默认的调度器是什么? 答: FIFO 4. Hadoop MapReduce有哪些编程接口? 答: 1) InputFormat接口 2) Mapper接口 3) Partitioner接口 4) Combiner 5) Reducer接口 6) OutputFormat 微博昵称: @mal_s
点赞
回复
分享
发布于 2015-04-27 14:53
YLer
北京邮电大学 算法工程师
1.HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。默认配置下,一份数据会有三个副本。 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3.默认是FIFO,就是先来先服务 4.Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 ps 学生一枚,目的单纯,想要赠书 微博:@YLer_我还是喜欢这个名字
点赞
回复
分享
发布于 2015-04-27 11:20
牛客290380号
1.通过增加冗余,具体就是增加block块复制个数,可以在hdfs-site.xml 中配置dfs.replication 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3默认是FIFO,就是先来先服务 4Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 微博昵称:炫铃用户3311995852
点赞
回复
分享
发布于 2015-04-26 23:11
牛客290380号
1.通过增加冗余,具体就是增加block块复制个数,可以在hdfs-site.xml 中配置dfs.replication 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3默认是FIFO,就是先来先服务 4Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。
点赞
回复
分享
发布于 2015-04-26 23:06
豆腐干_UPC
1.HDFS采用冗余备份机制保证数据可靠性; 2.HDFS对数据自动划分数据块,默认分块大小是64M,这个可以由用户自己设置; 3.hadoop的默认调度器是FIFO; 4.MapReduce有InputFormat、Mapper、Partitioner、Reducer和OutputFormat五个接口 微博昵称:豆腐干_UPC
点赞
回复
分享
发布于 2015-04-26 22:56
攻城狮-Jason
1.采用冗余机制保证数据可靠性 2.Hadoop1.x默认的是64M, 2.x版本是128M 3.默认调度器FIFO 4.接口:InputFormat,InputSplit,RecordReader,Mapper,Combiner,Partitioner,Sort,Reducer,OutputFormat,RecordWriter 微博昵称: 攻城狮-Jason
点赞
回复
分享
发布于 2015-04-26 22:19
北虎爷爷
山西大学 Java
Question: HDFS是通过什么机制保证数据可靠性的? answer: 通过冗余备份策略 Question: HDFS默认的块大小是多少? answer: Hadoop1.x默认的block块大小是64M,Hadoop2.x默认的block块大小是128M Question: Hadoop默认的调度器是什么? answer: 先进先出哦(FIFO) Question: Hadoop MapReduce有哪些编程接口? answer: InputFormat接口,用户实现该接口以实现文件内容的输入格式。 Mapper接口,哈哈,地球人都知道 Partitioner接口 一般为优化而生 Combiner接口,为性能而生 Reducer接口,哈哈,又是地球人都知道哦 忘了附微博昵称 微博昵称:北虎爷爷
点赞
回复
分享
发布于 2015-04-26 21:45
北虎爷爷
山西大学 Java
Question: HDFS是通过什么机制保证数据可靠性的? answer: 通过冗余备份策略 Question: HDFS默认的块大小是多少? answer: Hadoop1.x默认的block块大小是64M,Hadoop2.x默认的block块大小是128M Question: Hadoop默认的调度器是什么? answer: 先进先出哦(FIFO) Question: Hadoop MapReduce有哪些编程接口? answer: InputFormat接口,用户实现该接口以实现文件内容的输入格式。 Mapper接口,哈哈,地球人都知道 Partitioner接口 一般为优化而生 Combiner接口,为性能而生 Reducer接口,哈哈,又是地球人都知道哦
点赞
回复
分享
发布于 2015-04-26 21:42
牛客842903号
第一题:HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。 第二题:HDFS文件 为默认128M 第三题:默认的是capacity 调度器 第四题:Mapper、Reducer接口
点赞
回复
分享
发布于 2015-04-26 21:41
星星会发光啦啦
中国人民大学 算法工程师
1.Hadoop 视硬件错误为常态,并通过块的冗余存储机制保证数据的高可靠性。 在大多数情况下,副本系数是 3 , HDFS 的存放策略是将一个副本存放在本地机架的节点上,一个副本放在同一机架的另一个节点上,最后一个副本放在不同机架的节点上。 2. 大多数,默认为64MB 3.默认调度器 :FIFO 这个调度器的特点是先进先出,英文名是first in first out 4. Mapper和Reducer接口 微博:星星会发光啦啦
点赞
回复
分享
发布于 2015-04-26 21:22
僅此邇魢
hust C++
答对了牛妹赠书么,~~
点赞
回复
分享
发布于 2015-04-15 18:03
暂无评论,快来抢首评~
相关推荐
2025-12-29 22:35
武汉大学 Java
20251225【腾讯】面试算法真题(共3题)
题目1:两个字符串之间的转换题目2:UTF-8字符串拆字
查看2道真题和解析
点赞
评论
收藏
分享
01-02 15:13
已编辑
晶晨半导体_ENG SW_软件开发工程师
我的秋招回忆录:从惨败到硕果的成长之路
转眼间,我已经是毕业三年的“老社畜”了。作为一名2022年毕业的本科生,我直到现在都没写过一篇完整的秋招总结。今天是2026年1月1日元旦假期,趁着这份闲暇回顾往昔,便想把自己找实习、找工作的经历梳理清楚,好好记录下当年秋招的点滴与心得。初出茅庐,首战惨败!我第一次制作简历是在大二,那年恰逢疫情,所有选修课都在家中线上完成。在哥哥的建议下,我借着他的简历模板开始着手准备,一共做了中英文两份。当时想试着给企业投递简历,可招聘大二实习生的公司本就不多,我在众多企业中筛选出几家投递后,最终只有两家通过了简历筛选——一家是西山居(金山软件的游戏部门),另一家的名字我已经记不清了。那时我的算法能力很差,...
牛友故事会
点赞
评论
收藏
分享
2025-11-12 10:28
华北电力大学(保定) 机械工程师
好难过,努力考上一个还可以的大学,也没有合适的工作
鼠鼠就是一个很普通的学生,一连面试了7,8家就有一家给了offer,薪资还比鼠鼠预想的低很多,鼠鼠好难过啊😭😭😭
游戏客户端劝退第n人...:
看着就像学校招聘会象征性侮辱性招生企业
点赞
评论
收藏
分享
2025-12-23 23:49
门头沟学院 前端工程师
原来前端已死是这个意思
双非前端已死 投一大圈一个面试约不到 我真心碎了 前端已死
程序员花海:
实习写的太偏项目了
点赞
评论
收藏
分享
01-03 20:47
北京交通大学 Java
简历求锐评,211硕士找实习
双非本科,211硕士。自学java半年,想去找一个实习,求大佬们锐评一下简历
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
7
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
为什么你的实习是“无效实习”?又该如何做
4600
2
...
都 2026 年了,还在神话 AI Agent开发吗?
1869
3
...
2025找工年终总结
1405
4
...
双非终于上岸了!!!!
1175
5
...
uu们,面试的时候一定要大大方方的啊!
1150
6
...
简历求锐评,211硕士找实习
973
7
...
元启视界一面(12-31号下午3点)
766
8
...
27届暑期实习准备指南!!
617
9
...
字节实习生涨薪保真?
616
10
...
第一次感受到世界上有些人真的有优越感
597
创作者周榜
更多
正在热议
更多
#
机械/制造每日一题
#
82182次浏览
1431人参与
#
非技术2023笔面经
#
317220次浏览
2686人参与
#
机械求职避坑tips
#
82704次浏览
538人参与
#
工作中,努力重要还是选择重要?
#
248633次浏览
2413人参与
#
应届生,你找到工作了吗
#
97791次浏览
598人参与
#
如果秋招能重来,我会____
#
79775次浏览
471人参与
#
面试紧张时你会有什么表现?
#
21212次浏览
154人参与
#
为了找工作你投递了多少公司?
#
99626次浏览
685人参与
#
对2025年忏悔
#
10662次浏览
189人参与
#
春招前还要继续实习吗?
#
13299次浏览
146人参与
#
每个月的工资都是怎么分配的?
#
81752次浏览
665人参与
#
虾皮求职进展汇总
#
362903次浏览
2769人参与
#
影石Insta360求职进展汇总
#
169494次浏览
1345人参与
#
哪些公司笔/面试难度大?
#
7523次浏览
35人参与
#
AI时代,哪些岗位最容易被淘汰
#
26117次浏览
223人参与
#
你面试被问到过哪些不会的问题?
#
107379次浏览
1879人参与
#
秋招被确诊为……
#
280638次浏览
1589人参与
#
大疆的机械笔试比去年难吗
#
96402次浏览
767人参与
#
电信求职进展汇总
#
36068次浏览
191人参与
#
2025秋招体验点评
#
87049次浏览
726人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务