首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
进击的喵
2015-04-15 00:32
已编辑
牛客大学 Java
关注
已关注
取消关注
《Hadoop核心技术》技术问答
【图书介绍】
本书由百度资深Hadoop技术专家和高级算法工程师撰写,结合百度大数据实践,直击企业痛点,多位大数据技术专家联袂推荐!
【抢答问题】
1. HDFS是通过什么机制保证数据可靠性的?
2. HDFS默认的块大小是多少?
3. Hadoop默认的调度器是什么?
4. Hadoop MapReduce有哪些编程接口?
提示
全部评论
推荐
最新
楼层
net_hare
1.Hadoop 的冗余复制机制,这种机制保证了存放在 HDFS 中的数据的高可靠性和数据的完整一致性。 2. 原来是 64M,Hadoop-2.4.0 中 HDFS 文件块大小默认为 128M 3.Hadoop 中默认的调度器,它先按照作业的优先级高低,再按照到达时间的先后选择被执行的作业( FIFO )。 4. 可以分为两层。第一层是最基本的 Java API ,主要有 5 个可编程组件,分别是 InputFormat 、 Mapper 、 Partitioner 、 Reducer 和 OutputFormat 。 Hadoop 自带了很多直接可用的 InputFormat 、 Partitioner 和 OutputFormat ,大部分情况下,用户只需编写 Mapper 和 Reducer 即可。第二层是工具层,位于基本 Java API 之上,主要是为了方便用户编写复杂的 MapReduce 程序和利用其他编程语言增加 MapReduce 计算平台的兼容性而提出来的。在该层中,主要提供了 4 个编程工具包 , 为 JobControl 、 ChainMapper/ChainReducer 、 Hadoop Streaming 、 Hadoop Pipes。 微博昵称:@net_hare
点赞
回复
分享
发布于 2015-04-28 22:55
batmanhaha
东北林大 Java
//只对Hadoop2.x case1:冗余复制机制,默认三份上边讲的很详细了.还有就是保证NameNode的HA每人说. Hadoop2.0有NameService来负责代替NameNode,其中有两个Active,StandBy, Zookeeper来协调管理服务,保证只有一个活跃的NameNode.解决了NameNode的SPOF相关 的HA问题。 case2: 2.x 128MB--default case3: FIFO--default case4:Mapper,Reducer--Core,Partitioner,Combiner Hadoop Streaming:任何语言写MR Hadoop Pipes:C++接口,不了解
点赞
回复
分享
发布于 2015-09-12 14:44
YLer
北京邮电大学 算法工程师
1.HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。默认配置下,一份数据会有三个副本。 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3.默认是FIFO,就是先来先服务 4.Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 ps 学生一枚,目的单纯,想要赠书 微博:@YLer_我还是喜欢这个名字
点赞
回复
分享
发布于 2015-04-29 10:25
本王随风富贵荒淫无道
1. HDFS是通过什么机制保证数据可靠性的? a.通过“心跳机制”周期性地确保Datanode上的数据是否有效,每个 Datanode 节点周期性地向 Namenode 发送心跳信号。网络分区可能导致一部分 Datanode 跟 Namenode 失去联系。 Namenode 通过心跳信号的缺失来检测这一情况,并将这些近期不再发送心跳信号 Datanode 标记为宕机,不会再将新的 IO 请求发给它们。 任何存储在宕机 Datanode 上的数据将不再有效。Datanode 的宕机可能会引起一些数据块的副本系数低于指定值, Namenode 不断地检测这些需要复制的数据块,一旦发现就启动复制操作。在下列情况下,可能需要重新复制:某个 Datanode 节点失效,某个副本遭到损坏,Datanode 上的硬盘错误,或者文件的冗余因子增大。 b.通过“冗余副本策略”增加数据的备份数,应对了由于设备问题造成的数据丢失。 c.通过“安全模式”在程序启动时设置namenode为只读,确保副本为安全之后,才打开namenode读写,以确保备份数据可靠。 d.通过“checksum”校验和对于写入的数据进行备份校验。 2. HDFS默认的块大小是多少? Hadoop-2.X中128M,在Hadoop-1.X中64M。 3. Hadoop默认的调度器是什么? 默认调度器为FIFO。 4. Hadoop MapReduce有哪些编程接口? Hadoop MapReduce有InputFormat、Mapper、Partitioner、Reducer和OutputFormat 5个可编程接口。 微博昵称:@本王随风富贵荒淫无道本王随风富贵荒淫无道 本王随风富贵荒淫无道
点赞
回复
分享
发布于 2015-04-28 11:06
永远支持小丽丽
江西科技师范大学 Java
1.冷备机制、租约机制、数据的正确性与一致性、系统升级回滚、安全模式; 2.64M 3.默认调度器FIFO 4. InputFormat/Mapper/Partitioner/Combiner/ Reducer/OutputFormat
点赞
回复
分享
发布于 2015-04-27 16:29
zencoding
华东师大 算法工程师
Question 1. HDFS是通过什么机制保证数据可靠性的? Answer1: (1)冗余副本策略:所有数据块都有副本,可以在hdfs-site.xml中设置副本系数,Datanode启动时,遍历本地文件系统,产生一份 hdfs数据块和本地文件的对应关系列表(blockreport)汇报给namenode。 (2)机架感知策略:集群一般放在不同机架上,机架间带宽要比机架内带宽要小,有利于在组件失效时负载均衡。 (3)安全模式:Namenode启动时会先经过一个“安全模式”的特殊阶段。 (4)心跳机制 :Namenode周期性从datanode接收心跳信号和块报告 (5)校验和 :在文件创立时,每个数据块都产生校验和 (6)回收站 :删除文件时,其实是放入回收站/trash (7)元数据保护 :备份NameNode上持久化存储的元数据文件,然后转储到远程的NTF文件系统中。另外也可以使用 SecondaryNameNode来备份NameNode的元数据。 (8)快照机制:支持存储某个时间点的映像,需要时可以使数据重返这个时间点的状态 Question2. HDFS默认的块大小是多少? Answer2:HDFS数据块的默认大小是64MB,而且在不少实际部署中,HDFS的数据块甚至会被设置成128MB甚至更多。 Question3:Hadoop默认的调度器是什么? Answer3:默认调度算法FIFO(First In First Out) Question4:Hadoop MapReduce有哪些编程接口 Answer4:InputFormat、Mapper、Partitioner、Reducer和OutputFormat。 By:@zenwannnnnnnnnnnnnnnnnnnnnnnnn
点赞
回复
分享
发布于 2015-04-27 15:07
mal_s
1. HDFS是通过什么机制保证数据可靠性的? 答: 1)Secondary NameNode对NameNode中元数据提供冷备方案 2)NameNode在打开或创建一个文件准备追加写之前,会与此客户端签订一份租约,保证可靠性,同时可避免由于客户端停机等意外带来的资源长期霸占。 3)通过每个数据块上的版本标识保证数据可靠性 4)升级集群Hadoop时,HDFS可允许管理员恢复早期版本,并且将集群状态回滚到升级前,避免未知的bug造成的影响 5)在启动时,NameNode在安全模式中不发生文件块的复制,只接受块报告。 2. HDFS默认的块大小是多少? 答: 64m 3. Hadoop默认的调度器是什么? 答: FIFO 4. Hadoop MapReduce有哪些编程接口? 答: 1) InputFormat接口 2) Mapper接口 3) Partitioner接口 4) Combiner 5) Reducer接口 6) OutputFormat 微博昵称: @mal_s
点赞
回复
分享
发布于 2015-04-27 14:53
YLer
北京邮电大学 算法工程师
1.HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。默认配置下,一份数据会有三个副本。 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3.默认是FIFO,就是先来先服务 4.Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 ps 学生一枚,目的单纯,想要赠书 微博:@YLer_我还是喜欢这个名字
点赞
回复
分享
发布于 2015-04-27 11:20
牛客290380号
1.通过增加冗余,具体就是增加block块复制个数,可以在hdfs-site.xml 中配置dfs.replication 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3默认是FIFO,就是先来先服务 4Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 微博昵称:炫铃用户3311995852
点赞
回复
分享
发布于 2015-04-26 23:11
牛客290380号
1.通过增加冗余,具体就是增加block块复制个数,可以在hdfs-site.xml 中配置dfs.replication 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3默认是FIFO,就是先来先服务 4Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。
点赞
回复
分享
发布于 2015-04-26 23:06
豆腐干_UPC
1.HDFS采用冗余备份机制保证数据可靠性; 2.HDFS对数据自动划分数据块,默认分块大小是64M,这个可以由用户自己设置; 3.hadoop的默认调度器是FIFO; 4.MapReduce有InputFormat、Mapper、Partitioner、Reducer和OutputFormat五个接口 微博昵称:豆腐干_UPC
点赞
回复
分享
发布于 2015-04-26 22:56
攻城狮-Jason
1.采用冗余机制保证数据可靠性 2.Hadoop1.x默认的是64M, 2.x版本是128M 3.默认调度器FIFO 4.接口:InputFormat,InputSplit,RecordReader,Mapper,Combiner,Partitioner,Sort,Reducer,OutputFormat,RecordWriter 微博昵称: 攻城狮-Jason
点赞
回复
分享
发布于 2015-04-26 22:19
北虎爷爷
山西大学 Java
Question: HDFS是通过什么机制保证数据可靠性的? answer: 通过冗余备份策略 Question: HDFS默认的块大小是多少? answer: Hadoop1.x默认的block块大小是64M,Hadoop2.x默认的block块大小是128M Question: Hadoop默认的调度器是什么? answer: 先进先出哦(FIFO) Question: Hadoop MapReduce有哪些编程接口? answer: InputFormat接口,用户实现该接口以实现文件内容的输入格式。 Mapper接口,哈哈,地球人都知道 Partitioner接口 一般为优化而生 Combiner接口,为性能而生 Reducer接口,哈哈,又是地球人都知道哦 忘了附微博昵称 微博昵称:北虎爷爷
点赞
回复
分享
发布于 2015-04-26 21:45
北虎爷爷
山西大学 Java
Question: HDFS是通过什么机制保证数据可靠性的? answer: 通过冗余备份策略 Question: HDFS默认的块大小是多少? answer: Hadoop1.x默认的block块大小是64M,Hadoop2.x默认的block块大小是128M Question: Hadoop默认的调度器是什么? answer: 先进先出哦(FIFO) Question: Hadoop MapReduce有哪些编程接口? answer: InputFormat接口,用户实现该接口以实现文件内容的输入格式。 Mapper接口,哈哈,地球人都知道 Partitioner接口 一般为优化而生 Combiner接口,为性能而生 Reducer接口,哈哈,又是地球人都知道哦
点赞
回复
分享
发布于 2015-04-26 21:42
牛客842903号
第一题:HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。 第二题:HDFS文件 为默认128M 第三题:默认的是capacity 调度器 第四题:Mapper、Reducer接口
点赞
回复
分享
发布于 2015-04-26 21:41
星星会发光啦啦
中国人民大学 算法工程师
1.Hadoop 视硬件错误为常态,并通过块的冗余存储机制保证数据的高可靠性。 在大多数情况下,副本系数是 3 , HDFS 的存放策略是将一个副本存放在本地机架的节点上,一个副本放在同一机架的另一个节点上,最后一个副本放在不同机架的节点上。 2. 大多数,默认为64MB 3.默认调度器 :FIFO 这个调度器的特点是先进先出,英文名是first in first out 4. Mapper和Reducer接口 微博:星星会发光啦啦
点赞
回复
分享
发布于 2015-04-26 21:22
僅此邇魢
hust C++
答对了牛妹赠书么,~~
点赞
回复
分享
发布于 2015-04-15 18:03
暂无评论,快来抢首评~
相关推荐
2025-12-29 13:27
科大讯飞_研发算法_计算机视觉算法工程师(准入职员工)
科大讯飞内推,科大讯飞内推码
秋招面经-科大讯飞-飞凡计划一面1、自我介绍2、挑一个项目来具体介绍一下3、项目1的成员有多少人?4、你在这个项目中主要用的是Java还是Python?5、项目里用的C和Python,你其他项目用的Java,那你描述一下这三种语言的区别6、你对于自己的一个规划,就是开发语言是怎样的倾向?7、你介绍一下你在这个项目开发过程中有没有遇到过什么一些印象比较深刻的难点?你是怎样去解决的?8、对Linux相关的命令熟不熟?容器化这一块呢?K8s了解过吗?9、平时的学习是怎样的渠道?10、你自己的话有阅读过一些源码吗?11、谈谈HashMap的底层实现12、反问科大讯飞26届秋招正式启动中(内推免笔试),...
点赞
评论
收藏
分享
2025-11-15 14:35
南京邮电大学 Java
27准备日常实习,请狠狠拷打简历
程序员牛肉:
你这简历有啥值得拷打的?在牛客你这种简历一抓一大把,也就是个人信息不一样而已。 关键要去找亮点,亮点啊,整个简历都跟流水线生产出来的一样。
点赞
评论
收藏
分享
2025-12-31 08:31
山东大学 嵌入式软件工程师
希望新的一年,我依然是走向幸福的那个人
前阵子新认识了一个女孩子,她说翻到我前几年元旦发的那些「年终总结」,感觉我不像一个典型的工科生我笑着说,时间好快,居然又到年底了,而我甚至还没来得及真正坐下来写点什么但其实,2025年早就已经写完了,只是没有落在纸上写2024年总结时的那种恍惚,真实得不可思议。那会儿我还在阎良,再看2025年,像装了我司的宽带一样快。打马而过的一年,仿佛只剩下今天在工位上提交那些务必不能逾期的材料,心里一边默念“今天千万不要加班”,一边希望时间要不慢点也行“你的肉体便是时光,不停流逝的时光”这一年,这句话变得异常具体今年真的很不一样我离开了那个曾经让我满心怨怼的城市,但离开之后,还是会时常想起它;我写出了一本...
SAGIMA牛马咖啡
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
7
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
你会和mentor进行deeptalk吗?
3235
2
...
金丹后期牛友!我们新年再见
2302
3
...
双非本2025秋招总结:65w+SSP三选一,最终还是“有鹅选鹅”|附面试心路历程
2302
4
...
牛客运营们,我保证这是我最后一次消费烤肠了!
2217
5
...
希望新的一年,我依然是走向幸福的那个人
2100
6
...
写给后辈们的一封信, 希望能帮助到你找第一份工作时少踩坑
2029
7
...
学院本 末 211 硕勇闯 java 后端实习美团 oc 逆袭指南
1813
8
...
分享一则小红书 说得真的很好(òωó)👍
1249
9
...
27届学院本一段中厂一段中大厂实习,简历求锐评
1212
10
...
秋招oc战绩
1154
创作者周榜
更多
正在热议
更多
#
对2025年忏悔
#
5539次浏览
110人参与
#
互联网行业现在还值得去吗
#
47907次浏览
356人参与
#
实习没人带,苟住还是跑路?
#
14139次浏览
282人参与
#
你找工作的时候用AI吗?
#
165963次浏览
865人参与
#
元旦假期你打算怎么过
#
9007次浏览
180人参与
#
春招前还要继续实习吗?
#
6128次浏览
69人参与
#
面试官问过你最刁钻的问题是什么?
#
11130次浏览
106人参与
#
职场新人生存指南
#
491651次浏览
9517人参与
#
一人说一家双休的公司
#
8188次浏览
102人参与
#
大家实习都在做什么?
#
9170次浏览
98人参与
#
我们是不是被“优绩主义”绑架了?
#
9757次浏览
305人参与
#
我的AI电子员工
#
24432次浏览
155人参与
#
你觉得专业和学校哪个对薪资影响最大
#
87753次浏览
587人参与
#
非技术岗薪资爆料
#
468972次浏览
3013人参与
#
你认为哪些项目算烂大街?
#
79562次浏览
629人参与
#
新年的第一句祝福
#
51156次浏览
377人参与
#
巨人网络求职进展汇总
#
183980次浏览
1223人参与
#
腾讯工作体验
#
549271次浏览
3664人参与
#
领导秒批的请假话术
#
30683次浏览
121人参与
#
非技术er求职现状
#
126043次浏览
765人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务