首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
进击的喵
2015-04-15 00:32
已编辑
牛客大学 Java
关注
已关注
取消关注
《Hadoop核心技术》技术问答
【图书介绍】
本书由百度资深Hadoop技术专家和高级算法工程师撰写,结合百度大数据实践,直击企业痛点,多位大数据技术专家联袂推荐!
【抢答问题】
1. HDFS是通过什么机制保证数据可靠性的?
2. HDFS默认的块大小是多少?
3. Hadoop默认的调度器是什么?
4. Hadoop MapReduce有哪些编程接口?
提示
全部评论
推荐
最新
楼层
net_hare
1.Hadoop 的冗余复制机制,这种机制保证了存放在 HDFS 中的数据的高可靠性和数据的完整一致性。 2. 原来是 64M,Hadoop-2.4.0 中 HDFS 文件块大小默认为 128M 3.Hadoop 中默认的调度器,它先按照作业的优先级高低,再按照到达时间的先后选择被执行的作业( FIFO )。 4. 可以分为两层。第一层是最基本的 Java API ,主要有 5 个可编程组件,分别是 InputFormat 、 Mapper 、 Partitioner 、 Reducer 和 OutputFormat 。 Hadoop 自带了很多直接可用的 InputFormat 、 Partitioner 和 OutputFormat ,大部分情况下,用户只需编写 Mapper 和 Reducer 即可。第二层是工具层,位于基本 Java API 之上,主要是为了方便用户编写复杂的 MapReduce 程序和利用其他编程语言增加 MapReduce 计算平台的兼容性而提出来的。在该层中,主要提供了 4 个编程工具包 , 为 JobControl 、 ChainMapper/ChainReducer 、 Hadoop Streaming 、 Hadoop Pipes。 微博昵称:@net_hare
点赞
回复
分享
发布于 2015-04-28 22:55
batmanhaha
东北林大 Java
//只对Hadoop2.x case1:冗余复制机制,默认三份上边讲的很详细了.还有就是保证NameNode的HA每人说. Hadoop2.0有NameService来负责代替NameNode,其中有两个Active,StandBy, Zookeeper来协调管理服务,保证只有一个活跃的NameNode.解决了NameNode的SPOF相关 的HA问题。 case2: 2.x 128MB--default case3: FIFO--default case4:Mapper,Reducer--Core,Partitioner,Combiner Hadoop Streaming:任何语言写MR Hadoop Pipes:C++接口,不了解
点赞
回复
分享
发布于 2015-09-12 14:44
YLer
北京邮电大学 算法工程师
1.HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。默认配置下,一份数据会有三个副本。 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3.默认是FIFO,就是先来先服务 4.Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 ps 学生一枚,目的单纯,想要赠书 微博:@YLer_我还是喜欢这个名字
点赞
回复
分享
发布于 2015-04-29 10:25
本王随风富贵荒淫无道
1. HDFS是通过什么机制保证数据可靠性的? a.通过“心跳机制”周期性地确保Datanode上的数据是否有效,每个 Datanode 节点周期性地向 Namenode 发送心跳信号。网络分区可能导致一部分 Datanode 跟 Namenode 失去联系。 Namenode 通过心跳信号的缺失来检测这一情况,并将这些近期不再发送心跳信号 Datanode 标记为宕机,不会再将新的 IO 请求发给它们。 任何存储在宕机 Datanode 上的数据将不再有效。Datanode 的宕机可能会引起一些数据块的副本系数低于指定值, Namenode 不断地检测这些需要复制的数据块,一旦发现就启动复制操作。在下列情况下,可能需要重新复制:某个 Datanode 节点失效,某个副本遭到损坏,Datanode 上的硬盘错误,或者文件的冗余因子增大。 b.通过“冗余副本策略”增加数据的备份数,应对了由于设备问题造成的数据丢失。 c.通过“安全模式”在程序启动时设置namenode为只读,确保副本为安全之后,才打开namenode读写,以确保备份数据可靠。 d.通过“checksum”校验和对于写入的数据进行备份校验。 2. HDFS默认的块大小是多少? Hadoop-2.X中128M,在Hadoop-1.X中64M。 3. Hadoop默认的调度器是什么? 默认调度器为FIFO。 4. Hadoop MapReduce有哪些编程接口? Hadoop MapReduce有InputFormat、Mapper、Partitioner、Reducer和OutputFormat 5个可编程接口。 微博昵称:@本王随风富贵荒淫无道本王随风富贵荒淫无道 本王随风富贵荒淫无道
点赞
回复
分享
发布于 2015-04-28 11:06
永远支持小丽丽
江西科技师范大学 Java
1.冷备机制、租约机制、数据的正确性与一致性、系统升级回滚、安全模式; 2.64M 3.默认调度器FIFO 4. InputFormat/Mapper/Partitioner/Combiner/ Reducer/OutputFormat
点赞
回复
分享
发布于 2015-04-27 16:29
zencoding
华东师大 算法工程师
Question 1. HDFS是通过什么机制保证数据可靠性的? Answer1: (1)冗余副本策略:所有数据块都有副本,可以在hdfs-site.xml中设置副本系数,Datanode启动时,遍历本地文件系统,产生一份 hdfs数据块和本地文件的对应关系列表(blockreport)汇报给namenode。 (2)机架感知策略:集群一般放在不同机架上,机架间带宽要比机架内带宽要小,有利于在组件失效时负载均衡。 (3)安全模式:Namenode启动时会先经过一个“安全模式”的特殊阶段。 (4)心跳机制 :Namenode周期性从datanode接收心跳信号和块报告 (5)校验和 :在文件创立时,每个数据块都产生校验和 (6)回收站 :删除文件时,其实是放入回收站/trash (7)元数据保护 :备份NameNode上持久化存储的元数据文件,然后转储到远程的NTF文件系统中。另外也可以使用 SecondaryNameNode来备份NameNode的元数据。 (8)快照机制:支持存储某个时间点的映像,需要时可以使数据重返这个时间点的状态 Question2. HDFS默认的块大小是多少? Answer2:HDFS数据块的默认大小是64MB,而且在不少实际部署中,HDFS的数据块甚至会被设置成128MB甚至更多。 Question3:Hadoop默认的调度器是什么? Answer3:默认调度算法FIFO(First In First Out) Question4:Hadoop MapReduce有哪些编程接口 Answer4:InputFormat、Mapper、Partitioner、Reducer和OutputFormat。 By:@zenwannnnnnnnnnnnnnnnnnnnnnnnn
点赞
回复
分享
发布于 2015-04-27 15:07
mal_s
1. HDFS是通过什么机制保证数据可靠性的? 答: 1)Secondary NameNode对NameNode中元数据提供冷备方案 2)NameNode在打开或创建一个文件准备追加写之前,会与此客户端签订一份租约,保证可靠性,同时可避免由于客户端停机等意外带来的资源长期霸占。 3)通过每个数据块上的版本标识保证数据可靠性 4)升级集群Hadoop时,HDFS可允许管理员恢复早期版本,并且将集群状态回滚到升级前,避免未知的bug造成的影响 5)在启动时,NameNode在安全模式中不发生文件块的复制,只接受块报告。 2. HDFS默认的块大小是多少? 答: 64m 3. Hadoop默认的调度器是什么? 答: FIFO 4. Hadoop MapReduce有哪些编程接口? 答: 1) InputFormat接口 2) Mapper接口 3) Partitioner接口 4) Combiner 5) Reducer接口 6) OutputFormat 微博昵称: @mal_s
点赞
回复
分享
发布于 2015-04-27 14:53
YLer
北京邮电大学 算法工程师
1.HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。默认配置下,一份数据会有三个副本。 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3.默认是FIFO,就是先来先服务 4.Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 ps 学生一枚,目的单纯,想要赠书 微博:@YLer_我还是喜欢这个名字
点赞
回复
分享
发布于 2015-04-27 11:20
牛客290380号
1.通过增加冗余,具体就是增加block块复制个数,可以在hdfs-site.xml 中配置dfs.replication 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3默认是FIFO,就是先来先服务 4Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 微博昵称:炫铃用户3311995852
点赞
回复
分享
发布于 2015-04-26 23:11
牛客290380号
1.通过增加冗余,具体就是增加block块复制个数,可以在hdfs-site.xml 中配置dfs.replication 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3默认是FIFO,就是先来先服务 4Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。
点赞
回复
分享
发布于 2015-04-26 23:06
豆腐干_UPC
1.HDFS采用冗余备份机制保证数据可靠性; 2.HDFS对数据自动划分数据块,默认分块大小是64M,这个可以由用户自己设置; 3.hadoop的默认调度器是FIFO; 4.MapReduce有InputFormat、Mapper、Partitioner、Reducer和OutputFormat五个接口 微博昵称:豆腐干_UPC
点赞
回复
分享
发布于 2015-04-26 22:56
攻城狮-Jason
1.采用冗余机制保证数据可靠性 2.Hadoop1.x默认的是64M, 2.x版本是128M 3.默认调度器FIFO 4.接口:InputFormat,InputSplit,RecordReader,Mapper,Combiner,Partitioner,Sort,Reducer,OutputFormat,RecordWriter 微博昵称: 攻城狮-Jason
点赞
回复
分享
发布于 2015-04-26 22:19
北虎爷爷
山西大学 Java
Question: HDFS是通过什么机制保证数据可靠性的? answer: 通过冗余备份策略 Question: HDFS默认的块大小是多少? answer: Hadoop1.x默认的block块大小是64M,Hadoop2.x默认的block块大小是128M Question: Hadoop默认的调度器是什么? answer: 先进先出哦(FIFO) Question: Hadoop MapReduce有哪些编程接口? answer: InputFormat接口,用户实现该接口以实现文件内容的输入格式。 Mapper接口,哈哈,地球人都知道 Partitioner接口 一般为优化而生 Combiner接口,为性能而生 Reducer接口,哈哈,又是地球人都知道哦 忘了附微博昵称 微博昵称:北虎爷爷
点赞
回复
分享
发布于 2015-04-26 21:45
北虎爷爷
山西大学 Java
Question: HDFS是通过什么机制保证数据可靠性的? answer: 通过冗余备份策略 Question: HDFS默认的块大小是多少? answer: Hadoop1.x默认的block块大小是64M,Hadoop2.x默认的block块大小是128M Question: Hadoop默认的调度器是什么? answer: 先进先出哦(FIFO) Question: Hadoop MapReduce有哪些编程接口? answer: InputFormat接口,用户实现该接口以实现文件内容的输入格式。 Mapper接口,哈哈,地球人都知道 Partitioner接口 一般为优化而生 Combiner接口,为性能而生 Reducer接口,哈哈,又是地球人都知道哦
点赞
回复
分享
发布于 2015-04-26 21:42
牛客842903号
第一题:HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。 第二题:HDFS文件 为默认128M 第三题:默认的是capacity 调度器 第四题:Mapper、Reducer接口
点赞
回复
分享
发布于 2015-04-26 21:41
星星会发光啦啦
中国人民大学 算法工程师
1.Hadoop 视硬件错误为常态,并通过块的冗余存储机制保证数据的高可靠性。 在大多数情况下,副本系数是 3 , HDFS 的存放策略是将一个副本存放在本地机架的节点上,一个副本放在同一机架的另一个节点上,最后一个副本放在不同机架的节点上。 2. 大多数,默认为64MB 3.默认调度器 :FIFO 这个调度器的特点是先进先出,英文名是first in first out 4. Mapper和Reducer接口 微博:星星会发光啦啦
点赞
回复
分享
发布于 2015-04-26 21:22
僅此邇魢
hust C++
答对了牛妹赠书么,~~
点赞
回复
分享
发布于 2015-04-15 18:03
暂无评论,快来抢首评~
相关推荐
昨天 14:17
深圳大学 Java
华为OD面经-python开发岗位
BG:末9计科,无计算机垂直经验,GAP6个月 一、 对接HR避坑指南 1. 优先选择正规外包HR:建议直接对接德科、科锐这类官方合作外包公司的HR,他们对OD招聘流程、岗位要求的把控更规范,后续沟通也更顺畅。2. 身份证信息谨慎提供:第一次求职时没经验,把身份证号给了部门HR,结果简历被锁定整整两年,上一份工作还没入职就被锁,离职后锁定状态都没解除,直接影响后续求职机会。二、 机考通关技巧1. 刷题策略:真题>海量力扣:个人感觉不用像我一样盲目刷力扣100题,刷一些熟悉熟悉算法。重点放在刷OD机考真题,网上有很多整理好的题库,刷熟了大概率能遇到原题。2. 读题与时间分配是关键:机考最难的不是...
查看3道真题和解析
点赞
评论
收藏
分享
12-25 13:44
南昌大学 算法工程师
马的遍历
链接 这题可以用递推的方式解决 我们设置一个二维数组,并初始化为-1 比如马一步可以眺到(2,2)而无法跳到(4,3),但从(2,2)可以跳到(4,3),那么(4,3)就是两步, 从(4,3)开始眺,如果跳到非-1的位置时,那个位置就是三步,依次类推 #include<iostream> #include<queue> #include<cstring> using namespace std; int board[401][401]; int dx[8] = { 1,2,2,1,-1,-2,-2,-1 }; int dy[8] = { 2,1,-1,-2,...
点赞
评论
收藏
分享
12-08 07:42
门头沟学院 Java
27末九简历求拷打
27届末九,由于是女生,身边人几乎没有就业导向的,自学只能跟着网课,没人指导,很迷茫。下图是我目前的简历,不知道有需要修改的地方吗?求拷打。下面是目前的学习情况:目前算法过完了一遍力扣100和代码随想录,不过不是很熟,面经看了小林coding、JavaGuide,有一些没用过的技术看得不是很明白,掌握得不是很扎实。再加上常年跟黑马网课听思路,真正自己动手写代码的时间很少,这让我一直不敢投简历,总觉得内里空虚。项目没准备好面试相关的问题,简历上相应的考点不熟。如此种种。。。看到很多很多学长学姐大佬们的面经,愈发觉得面试可怕,自己没准备好,总担心自己是不是无望后端开发了。看到牛客很多同届以及更小一届的同学都找到实习了,很希望自己也能找到实习。而自己又好像摸不到后端学习的门路,只能不断赞叹黑马虎哥写的代码真优雅!微服务架构实在巧妙!消息队列、redis、sentinel、nacos、mybatisplus等等的引入都会让我赞叹这些工具的设计者的巧思,以及包括但不限于Java语言的优雅。然而只是停留在了解的程度,并不熟练。我是很希望能够继续深入探索这些知识的,只不过有一大部分时间都花在学校课程上了。我感觉我被困住了,我一方面必须保证我能够有个不错的学业分使我能有我几乎不想选择的读研退路(还有个原因是复习不全我会焦虑考试挂科,因此我会做好全面的准备,而这一步很费时间),一方面在B站学习各种网课,一方面得考虑提升自己并不扎实的算法基础,另一方面还得准备八股面经。这让我有点苦恼,我好像没那么多时间,因为绝大部分时间都花在了复习学校科目中了。我好像处处用时间,但收效甚微。想问问各位大佬是怎么平衡时间的呢?算法、项目和八股是怎么准备的呢?有什么高效的方法吗?谢谢您们花时间阅读我的稿件!
菜菜狗🐶:
大胆投,我当时也是害怕面试,投多了发现根本约不到面🤡
投递哔哩哔哩等公司6个岗位
点赞
评论
收藏
分享
12-15 09:37
已编辑
门头沟学院 Java
华子被鸽穿了?
最近看见好几个群都在转发这条,华子毕竟是制造业大厂还能鸽穿?是不是这个部门开的13a太多了吧13a是真没啥性价比
强大的马里奥:
13a也会有人接的,不愁招不满
面试线索爆料
点赞
评论
收藏
分享
12-27 22:28
门头沟学院 Java
科大讯飞offer来时路
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
7
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
大四双非水产专业上岸阿里后端(五)
1.5W
2
...
适可而止吧!你就是“烂泥”
4190
3
...
我的世界观,就是对抗优绩主义的武器
3948
4
...
实习被“放养”零产出,该及时止损还是继续苟着?
3365
5
...
牛客2025年度报告—道心初立,夯实基础
3181
6
...
寒假实习会影响暑期投递吗?
1751
7
...
大厂工作强度从夯到拉,B站真爽
1642
8
...
被问有没有男朋友 如果有同事欺负你怎么办
1596
9
...
没人带+同事冷漠,真的会内耗
1421
10
...
求支招
1259
创作者周榜
更多
正在热议
更多
#
对2025年忏悔
#
1242次浏览
18人参与
#
联影求职进展汇总
#
165082次浏览
831人参与
#
实习没人带,苟住还是跑路?
#
6747次浏览
150人参与
#
非技术岗简历怎么写
#
274758次浏览
3168人参与
#
元旦假期你打算怎么过
#
4498次浏览
118人参与
#
春招前还要继续实习吗?
#
1528次浏览
26人参与
#
你做过哪些dirty work
#
25016次浏览
155人参与
#
妈妈治愈了你哪些脆皮时刻
#
38381次浏览
338人参与
#
面试官问过你最刁钻的问题是什么?
#
3468次浏览
54人参与
#
大家实习都在做什么?
#
5900次浏览
60人参与
#
一人说一家双休的公司
#
3467次浏览
55人参与
#
毕业论文怎么查AI率
#
70094次浏览
1941人参与
#
运营面经
#
148906次浏览
1329人参与
#
我来点评面试官
#
37621次浏览
163人参与
#
我们是不是被“优绩主义”绑架了?
#
6413次浏览
215人参与
#
实习/项目/竞赛奖项,哪个对找工作更重要?
#
102510次浏览
1185人参与
#
牛客2025仙途报告
#
28750次浏览
375人参与
#
职场中对你有帮助的书
#
25688次浏览
216人参与
#
查收我的offer竞争力报告
#
264319次浏览
1649人参与
#
面试等了一周没回复,还有戏吗
#
191984次浏览
1660人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务