首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
进击的喵
2015-04-15 00:32
已编辑
牛客大学 Java
关注
已关注
取消关注
《Hadoop核心技术》技术问答
【图书介绍】
本书由百度资深Hadoop技术专家和高级算法工程师撰写,结合百度大数据实践,直击企业痛点,多位大数据技术专家联袂推荐!
【抢答问题】
1. HDFS是通过什么机制保证数据可靠性的?
2. HDFS默认的块大小是多少?
3. Hadoop默认的调度器是什么?
4. Hadoop MapReduce有哪些编程接口?
提示
全部评论
推荐
最新
楼层
net_hare
1.Hadoop 的冗余复制机制,这种机制保证了存放在 HDFS 中的数据的高可靠性和数据的完整一致性。 2. 原来是 64M,Hadoop-2.4.0 中 HDFS 文件块大小默认为 128M 3.Hadoop 中默认的调度器,它先按照作业的优先级高低,再按照到达时间的先后选择被执行的作业( FIFO )。 4. 可以分为两层。第一层是最基本的 Java API ,主要有 5 个可编程组件,分别是 InputFormat 、 Mapper 、 Partitioner 、 Reducer 和 OutputFormat 。 Hadoop 自带了很多直接可用的 InputFormat 、 Partitioner 和 OutputFormat ,大部分情况下,用户只需编写 Mapper 和 Reducer 即可。第二层是工具层,位于基本 Java API 之上,主要是为了方便用户编写复杂的 MapReduce 程序和利用其他编程语言增加 MapReduce 计算平台的兼容性而提出来的。在该层中,主要提供了 4 个编程工具包 , 为 JobControl 、 ChainMapper/ChainReducer 、 Hadoop Streaming 、 Hadoop Pipes。 微博昵称:@net_hare
点赞
回复
分享
发布于 2015-04-28 22:55
batmanhaha
东北林大 Java
//只对Hadoop2.x case1:冗余复制机制,默认三份上边讲的很详细了.还有就是保证NameNode的HA每人说. Hadoop2.0有NameService来负责代替NameNode,其中有两个Active,StandBy, Zookeeper来协调管理服务,保证只有一个活跃的NameNode.解决了NameNode的SPOF相关 的HA问题。 case2: 2.x 128MB--default case3: FIFO--default case4:Mapper,Reducer--Core,Partitioner,Combiner Hadoop Streaming:任何语言写MR Hadoop Pipes:C++接口,不了解
点赞
回复
分享
发布于 2015-09-12 14:44
YLer
北京邮电大学 算法工程师
1.HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。默认配置下,一份数据会有三个副本。 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3.默认是FIFO,就是先来先服务 4.Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 ps 学生一枚,目的单纯,想要赠书 微博:@YLer_我还是喜欢这个名字
点赞
回复
分享
发布于 2015-04-29 10:25
本王随风富贵荒淫无道
1. HDFS是通过什么机制保证数据可靠性的? a.通过“心跳机制”周期性地确保Datanode上的数据是否有效,每个 Datanode 节点周期性地向 Namenode 发送心跳信号。网络分区可能导致一部分 Datanode 跟 Namenode 失去联系。 Namenode 通过心跳信号的缺失来检测这一情况,并将这些近期不再发送心跳信号 Datanode 标记为宕机,不会再将新的 IO 请求发给它们。 任何存储在宕机 Datanode 上的数据将不再有效。Datanode 的宕机可能会引起一些数据块的副本系数低于指定值, Namenode 不断地检测这些需要复制的数据块,一旦发现就启动复制操作。在下列情况下,可能需要重新复制:某个 Datanode 节点失效,某个副本遭到损坏,Datanode 上的硬盘错误,或者文件的冗余因子增大。 b.通过“冗余副本策略”增加数据的备份数,应对了由于设备问题造成的数据丢失。 c.通过“安全模式”在程序启动时设置namenode为只读,确保副本为安全之后,才打开namenode读写,以确保备份数据可靠。 d.通过“checksum”校验和对于写入的数据进行备份校验。 2. HDFS默认的块大小是多少? Hadoop-2.X中128M,在Hadoop-1.X中64M。 3. Hadoop默认的调度器是什么? 默认调度器为FIFO。 4. Hadoop MapReduce有哪些编程接口? Hadoop MapReduce有InputFormat、Mapper、Partitioner、Reducer和OutputFormat 5个可编程接口。 微博昵称:@本王随风富贵荒淫无道本王随风富贵荒淫无道 本王随风富贵荒淫无道
点赞
回复
分享
发布于 2015-04-28 11:06
永远支持小丽丽
江西科技师范大学 Java
1.冷备机制、租约机制、数据的正确性与一致性、系统升级回滚、安全模式; 2.64M 3.默认调度器FIFO 4. InputFormat/Mapper/Partitioner/Combiner/ Reducer/OutputFormat
点赞
回复
分享
发布于 2015-04-27 16:29
zencoding
华东师大 算法工程师
Question 1. HDFS是通过什么机制保证数据可靠性的? Answer1: (1)冗余副本策略:所有数据块都有副本,可以在hdfs-site.xml中设置副本系数,Datanode启动时,遍历本地文件系统,产生一份 hdfs数据块和本地文件的对应关系列表(blockreport)汇报给namenode。 (2)机架感知策略:集群一般放在不同机架上,机架间带宽要比机架内带宽要小,有利于在组件失效时负载均衡。 (3)安全模式:Namenode启动时会先经过一个“安全模式”的特殊阶段。 (4)心跳机制 :Namenode周期性从datanode接收心跳信号和块报告 (5)校验和 :在文件创立时,每个数据块都产生校验和 (6)回收站 :删除文件时,其实是放入回收站/trash (7)元数据保护 :备份NameNode上持久化存储的元数据文件,然后转储到远程的NTF文件系统中。另外也可以使用 SecondaryNameNode来备份NameNode的元数据。 (8)快照机制:支持存储某个时间点的映像,需要时可以使数据重返这个时间点的状态 Question2. HDFS默认的块大小是多少? Answer2:HDFS数据块的默认大小是64MB,而且在不少实际部署中,HDFS的数据块甚至会被设置成128MB甚至更多。 Question3:Hadoop默认的调度器是什么? Answer3:默认调度算法FIFO(First In First Out) Question4:Hadoop MapReduce有哪些编程接口 Answer4:InputFormat、Mapper、Partitioner、Reducer和OutputFormat。 By:@zenwannnnnnnnnnnnnnnnnnnnnnnnn
点赞
回复
分享
发布于 2015-04-27 15:07
mal_s
1. HDFS是通过什么机制保证数据可靠性的? 答: 1)Secondary NameNode对NameNode中元数据提供冷备方案 2)NameNode在打开或创建一个文件准备追加写之前,会与此客户端签订一份租约,保证可靠性,同时可避免由于客户端停机等意外带来的资源长期霸占。 3)通过每个数据块上的版本标识保证数据可靠性 4)升级集群Hadoop时,HDFS可允许管理员恢复早期版本,并且将集群状态回滚到升级前,避免未知的bug造成的影响 5)在启动时,NameNode在安全模式中不发生文件块的复制,只接受块报告。 2. HDFS默认的块大小是多少? 答: 64m 3. Hadoop默认的调度器是什么? 答: FIFO 4. Hadoop MapReduce有哪些编程接口? 答: 1) InputFormat接口 2) Mapper接口 3) Partitioner接口 4) Combiner 5) Reducer接口 6) OutputFormat 微博昵称: @mal_s
点赞
回复
分享
发布于 2015-04-27 14:53
YLer
北京邮电大学 算法工程师
1.HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。默认配置下,一份数据会有三个副本。 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3.默认是FIFO,就是先来先服务 4.Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 ps 学生一枚,目的单纯,想要赠书 微博:@YLer_我还是喜欢这个名字
点赞
回复
分享
发布于 2015-04-27 11:20
牛客290380号
1.通过增加冗余,具体就是增加block块复制个数,可以在hdfs-site.xml 中配置dfs.replication 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3默认是FIFO,就是先来先服务 4Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 微博昵称:炫铃用户3311995852
点赞
回复
分享
发布于 2015-04-26 23:11
牛客290380号
1.通过增加冗余,具体就是增加block块复制个数,可以在hdfs-site.xml 中配置dfs.replication 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3默认是FIFO,就是先来先服务 4Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。
点赞
回复
分享
发布于 2015-04-26 23:06
豆腐干_UPC
1.HDFS采用冗余备份机制保证数据可靠性; 2.HDFS对数据自动划分数据块,默认分块大小是64M,这个可以由用户自己设置; 3.hadoop的默认调度器是FIFO; 4.MapReduce有InputFormat、Mapper、Partitioner、Reducer和OutputFormat五个接口 微博昵称:豆腐干_UPC
点赞
回复
分享
发布于 2015-04-26 22:56
攻城狮-Jason
1.采用冗余机制保证数据可靠性 2.Hadoop1.x默认的是64M, 2.x版本是128M 3.默认调度器FIFO 4.接口:InputFormat,InputSplit,RecordReader,Mapper,Combiner,Partitioner,Sort,Reducer,OutputFormat,RecordWriter 微博昵称: 攻城狮-Jason
点赞
回复
分享
发布于 2015-04-26 22:19
北虎爷爷
山西大学 Java
Question: HDFS是通过什么机制保证数据可靠性的? answer: 通过冗余备份策略 Question: HDFS默认的块大小是多少? answer: Hadoop1.x默认的block块大小是64M,Hadoop2.x默认的block块大小是128M Question: Hadoop默认的调度器是什么? answer: 先进先出哦(FIFO) Question: Hadoop MapReduce有哪些编程接口? answer: InputFormat接口,用户实现该接口以实现文件内容的输入格式。 Mapper接口,哈哈,地球人都知道 Partitioner接口 一般为优化而生 Combiner接口,为性能而生 Reducer接口,哈哈,又是地球人都知道哦 忘了附微博昵称 微博昵称:北虎爷爷
点赞
回复
分享
发布于 2015-04-26 21:45
北虎爷爷
山西大学 Java
Question: HDFS是通过什么机制保证数据可靠性的? answer: 通过冗余备份策略 Question: HDFS默认的块大小是多少? answer: Hadoop1.x默认的block块大小是64M,Hadoop2.x默认的block块大小是128M Question: Hadoop默认的调度器是什么? answer: 先进先出哦(FIFO) Question: Hadoop MapReduce有哪些编程接口? answer: InputFormat接口,用户实现该接口以实现文件内容的输入格式。 Mapper接口,哈哈,地球人都知道 Partitioner接口 一般为优化而生 Combiner接口,为性能而生 Reducer接口,哈哈,又是地球人都知道哦
点赞
回复
分享
发布于 2015-04-26 21:42
牛客842903号
第一题:HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。 第二题:HDFS文件 为默认128M 第三题:默认的是capacity 调度器 第四题:Mapper、Reducer接口
点赞
回复
分享
发布于 2015-04-26 21:41
星星会发光啦啦
中国人民大学 算法工程师
1.Hadoop 视硬件错误为常态,并通过块的冗余存储机制保证数据的高可靠性。 在大多数情况下,副本系数是 3 , HDFS 的存放策略是将一个副本存放在本地机架的节点上,一个副本放在同一机架的另一个节点上,最后一个副本放在不同机架的节点上。 2. 大多数,默认为64MB 3.默认调度器 :FIFO 这个调度器的特点是先进先出,英文名是first in first out 4. Mapper和Reducer接口 微博:星星会发光啦啦
点赞
回复
分享
发布于 2015-04-26 21:22
僅此邇魢
hust C++
答对了牛妹赠书么,~~
点赞
回复
分享
发布于 2015-04-15 18:03
暂无评论,快来抢首评~
相关推荐
07-04 17:28
已编辑
门头沟学院 客户端其它
累了,和自己和解了
兄弟,努力那么久了,我想你也一定累了吧,有什么心里话和我说说吧,我会认真的听,认真的回复你。 23-24年是我最黑暗的一年,先是经历实习-转正-离职,然后又是秋招0offer,春招被转岗、卡学历的种种恶心经历,那个时候感叹为什么命运如此不公,为什么明明我这么努力,还是找不到心仪的offer,这种暗无天日的日子什么时候是个头,女朋友也跟着我闹心,那段时间,一度想去送外卖,不想找了,TMD。24年4月份吧,我23年9月份投的传音控股简历竟然有了回音。时隔7个月,也算是被捞起来了,接下来也算是逆风翻盘,顺利拿下了。 其实,我现在能把这些当时我感觉天都会塌下来的事情轻描淡写的写出来,是因为轻舟已过万成...
码农索隆:
有什么心里话,兄弟们跟我说
我的求职精神状态
点赞
评论
收藏
分享
07-07 23:05
中南大学 Java
无题
明天挥师北上开始北漂!16年功名尘与土,2500里路云和月。键盘敲落星如雨,人潮涌处灯未歇。霓虹漫卷京华夜,寸心未冷青春血!不当京✌🏻,誓不回转!
牛客创作赏金赛
点赞
评论
收藏
分享
06-09 15:12
阿里巴巴_软件开发(实习员工)
这简历还想找工作啊
不好意思引流了,只是想让大家来拷打实习因期末考暂停了,不想复习心血来潮制作了秋招简历的初版,希望大家拷打,后面修改的版本应该都会发,秋招和牛油们在一起*简历模仿某大佬写的,想压成一页所以有些东西故意写得很短
编程界菜鸡:
都一个月,就算是实习也会觉得不稳定
点赞
评论
收藏
分享
07-02 15:14
西南石油大学 产品经理
大家的实习生当的怎么样了
实习生真的好无聊每天坐一天像个吉祥物这个公司也没什么工作,太重要的也不敢让我们接手,不重要的也不需要我们每天都好无聊,偶尔帮忙写写记录,跟专业毫无瓜葛,想干点啥问领导,领导也没有活给我们…大家都是怎么熬过去的啊
爱睡觉的冰箱哥:
好好摸鱼你又不乐意,让你框框干活你就难受了
实习吐槽大会
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
7
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
🌟择难路,未有疑,四非学院本运气拉满,春招拿下大厂后端
5.9W
2
...
秋招应该侧重准备哪个部分的内容
1.6W
3
...
恋爱四年没想到过自己会出轨
1.3W
4
...
腾讯云智后台开发暑期面经
1.1W
5
...
史上最细SQL实战系列:sql笔试例题总结篇(建议收藏)
1.0W
6
...
25届毕业现在在家呆了一个多月,没工作
8113
7
...
其实主包早就找到工作了,但还是每天都刷
7460
8
...
作为实习生,我问薪无愧
6490
9
...
离开软件测试才发现外面没有雨
6206
10
...
字节实习week6:听leader吐槽当前的应届生候选人们
5732
创作者周榜
更多
正在热议
更多
#
应届生,你找到工作了吗
#
3931次浏览
40人参与
#
双非应该如何逆袭?
#
174746次浏览
2987人参与
#
现代汽车前瞻技术研发急速编程挑战赛
#
39621次浏览
285人参与
#
简历当中有水分算不算造假?
#
5465次浏览
49人参与
#
春招进度记录
#
342290次浏览
3261人参与
#
实习生的蛐蛐区
#
5582次浏览
48人参与
#
百度秋招提前批进度
#
105651次浏览
1124人参与
#
谈薪时HR压价该怎么应对
#
206356次浏览
3177人参与
#
三一集团提前批进度交流
#
22812次浏览
139人参与
#
毕业旅行去哪玩儿
#
8467次浏览
124人参与
#
双非有机会进大厂吗
#
435532次浏览
4420人参与
#
百度求职进展汇总
#
406982次浏览
4718人参与
#
正在春招的你,也参与了去年秋招吗?
#
309251次浏览
2523人参与
#
非技术岗投递进展
#
145026次浏览
1264人参与
#
上班到公司第一件事做什么?
#
61366次浏览
523人参与
#
我的OC时间线
#
816288次浏览
7791人参与
#
秋招盘点:机械人值得去的企业
#
72432次浏览
670人参与
#
材料进Fab厂真的劝退吗?
#
43729次浏览
184人参与
#
没有合适的工作,你会先找个干着,还是考公考研
#
116660次浏览
1133人参与
#
百度工作体验
#
230697次浏览
2010人参与
#
如果可以,你希望哪个公司来捞你
#
97225次浏览
397人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务