首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
进击的喵
2015-04-15 00:32
已编辑
牛客大学 Java
关注
已关注
取消关注
《Hadoop核心技术》技术问答
【图书介绍】
本书由百度资深Hadoop技术专家和高级算法工程师撰写,结合百度大数据实践,直击企业痛点,多位大数据技术专家联袂推荐!
【抢答问题】
1. HDFS是通过什么机制保证数据可靠性的?
2. HDFS默认的块大小是多少?
3. Hadoop默认的调度器是什么?
4. Hadoop MapReduce有哪些编程接口?
提示
全部评论
推荐
最新
楼层
net_hare
1.Hadoop 的冗余复制机制,这种机制保证了存放在 HDFS 中的数据的高可靠性和数据的完整一致性。 2. 原来是 64M,Hadoop-2.4.0 中 HDFS 文件块大小默认为 128M 3.Hadoop 中默认的调度器,它先按照作业的优先级高低,再按照到达时间的先后选择被执行的作业( FIFO )。 4. 可以分为两层。第一层是最基本的 Java API ,主要有 5 个可编程组件,分别是 InputFormat 、 Mapper 、 Partitioner 、 Reducer 和 OutputFormat 。 Hadoop 自带了很多直接可用的 InputFormat 、 Partitioner 和 OutputFormat ,大部分情况下,用户只需编写 Mapper 和 Reducer 即可。第二层是工具层,位于基本 Java API 之上,主要是为了方便用户编写复杂的 MapReduce 程序和利用其他编程语言增加 MapReduce 计算平台的兼容性而提出来的。在该层中,主要提供了 4 个编程工具包 , 为 JobControl 、 ChainMapper/ChainReducer 、 Hadoop Streaming 、 Hadoop Pipes。 微博昵称:@net_hare
点赞
回复
分享
发布于 2015-04-28 22:55
batmanhaha
东北林大 Java
//只对Hadoop2.x case1:冗余复制机制,默认三份上边讲的很详细了.还有就是保证NameNode的HA每人说. Hadoop2.0有NameService来负责代替NameNode,其中有两个Active,StandBy, Zookeeper来协调管理服务,保证只有一个活跃的NameNode.解决了NameNode的SPOF相关 的HA问题。 case2: 2.x 128MB--default case3: FIFO--default case4:Mapper,Reducer--Core,Partitioner,Combiner Hadoop Streaming:任何语言写MR Hadoop Pipes:C++接口,不了解
点赞
回复
分享
发布于 2015-09-12 14:44
YLer
北京邮电大学 算法工程师
1.HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。默认配置下,一份数据会有三个副本。 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3.默认是FIFO,就是先来先服务 4.Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 ps 学生一枚,目的单纯,想要赠书 微博:@YLer_我还是喜欢这个名字
点赞
回复
分享
发布于 2015-04-29 10:25
本王随风富贵荒淫无道
1. HDFS是通过什么机制保证数据可靠性的? a.通过“心跳机制”周期性地确保Datanode上的数据是否有效,每个 Datanode 节点周期性地向 Namenode 发送心跳信号。网络分区可能导致一部分 Datanode 跟 Namenode 失去联系。 Namenode 通过心跳信号的缺失来检测这一情况,并将这些近期不再发送心跳信号 Datanode 标记为宕机,不会再将新的 IO 请求发给它们。 任何存储在宕机 Datanode 上的数据将不再有效。Datanode 的宕机可能会引起一些数据块的副本系数低于指定值, Namenode 不断地检测这些需要复制的数据块,一旦发现就启动复制操作。在下列情况下,可能需要重新复制:某个 Datanode 节点失效,某个副本遭到损坏,Datanode 上的硬盘错误,或者文件的冗余因子增大。 b.通过“冗余副本策略”增加数据的备份数,应对了由于设备问题造成的数据丢失。 c.通过“安全模式”在程序启动时设置namenode为只读,确保副本为安全之后,才打开namenode读写,以确保备份数据可靠。 d.通过“checksum”校验和对于写入的数据进行备份校验。 2. HDFS默认的块大小是多少? Hadoop-2.X中128M,在Hadoop-1.X中64M。 3. Hadoop默认的调度器是什么? 默认调度器为FIFO。 4. Hadoop MapReduce有哪些编程接口? Hadoop MapReduce有InputFormat、Mapper、Partitioner、Reducer和OutputFormat 5个可编程接口。 微博昵称:@本王随风富贵荒淫无道本王随风富贵荒淫无道 本王随风富贵荒淫无道
点赞
回复
分享
发布于 2015-04-28 11:06
永远支持小丽丽
江西科技师范大学 Java
1.冷备机制、租约机制、数据的正确性与一致性、系统升级回滚、安全模式; 2.64M 3.默认调度器FIFO 4. InputFormat/Mapper/Partitioner/Combiner/ Reducer/OutputFormat
点赞
回复
分享
发布于 2015-04-27 16:29
zencoding
华东师大 算法工程师
Question 1. HDFS是通过什么机制保证数据可靠性的? Answer1: (1)冗余副本策略:所有数据块都有副本,可以在hdfs-site.xml中设置副本系数,Datanode启动时,遍历本地文件系统,产生一份 hdfs数据块和本地文件的对应关系列表(blockreport)汇报给namenode。 (2)机架感知策略:集群一般放在不同机架上,机架间带宽要比机架内带宽要小,有利于在组件失效时负载均衡。 (3)安全模式:Namenode启动时会先经过一个“安全模式”的特殊阶段。 (4)心跳机制 :Namenode周期性从datanode接收心跳信号和块报告 (5)校验和 :在文件创立时,每个数据块都产生校验和 (6)回收站 :删除文件时,其实是放入回收站/trash (7)元数据保护 :备份NameNode上持久化存储的元数据文件,然后转储到远程的NTF文件系统中。另外也可以使用 SecondaryNameNode来备份NameNode的元数据。 (8)快照机制:支持存储某个时间点的映像,需要时可以使数据重返这个时间点的状态 Question2. HDFS默认的块大小是多少? Answer2:HDFS数据块的默认大小是64MB,而且在不少实际部署中,HDFS的数据块甚至会被设置成128MB甚至更多。 Question3:Hadoop默认的调度器是什么? Answer3:默认调度算法FIFO(First In First Out) Question4:Hadoop MapReduce有哪些编程接口 Answer4:InputFormat、Mapper、Partitioner、Reducer和OutputFormat。 By:@zenwannnnnnnnnnnnnnnnnnnnnnnnn
点赞
回复
分享
发布于 2015-04-27 15:07
mal_s
1. HDFS是通过什么机制保证数据可靠性的? 答: 1)Secondary NameNode对NameNode中元数据提供冷备方案 2)NameNode在打开或创建一个文件准备追加写之前,会与此客户端签订一份租约,保证可靠性,同时可避免由于客户端停机等意外带来的资源长期霸占。 3)通过每个数据块上的版本标识保证数据可靠性 4)升级集群Hadoop时,HDFS可允许管理员恢复早期版本,并且将集群状态回滚到升级前,避免未知的bug造成的影响 5)在启动时,NameNode在安全模式中不发生文件块的复制,只接受块报告。 2. HDFS默认的块大小是多少? 答: 64m 3. Hadoop默认的调度器是什么? 答: FIFO 4. Hadoop MapReduce有哪些编程接口? 答: 1) InputFormat接口 2) Mapper接口 3) Partitioner接口 4) Combiner 5) Reducer接口 6) OutputFormat 微博昵称: @mal_s
点赞
回复
分享
发布于 2015-04-27 14:53
YLer
北京邮电大学 算法工程师
1.HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。默认配置下,一份数据会有三个副本。 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3.默认是FIFO,就是先来先服务 4.Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 ps 学生一枚,目的单纯,想要赠书 微博:@YLer_我还是喜欢这个名字
点赞
回复
分享
发布于 2015-04-27 11:20
牛客290380号
1.通过增加冗余,具体就是增加block块复制个数,可以在hdfs-site.xml 中配置dfs.replication 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3默认是FIFO,就是先来先服务 4Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。 微博昵称:炫铃用户3311995852
点赞
回复
分享
发布于 2015-04-26 23:11
牛客290380号
1.通过增加冗余,具体就是增加block块复制个数,可以在hdfs-site.xml 中配置dfs.replication 2.之前是64M,现在是128M,这是可以根据自身实际情况改的 3默认是FIFO,就是先来先服务 4Mapper和Reducer是两个最主要的接口,其它的包括InputFormat,OutputFormat,Partitioner等等。
点赞
回复
分享
发布于 2015-04-26 23:06
豆腐干_UPC
1.HDFS采用冗余备份机制保证数据可靠性; 2.HDFS对数据自动划分数据块,默认分块大小是64M,这个可以由用户自己设置; 3.hadoop的默认调度器是FIFO; 4.MapReduce有InputFormat、Mapper、Partitioner、Reducer和OutputFormat五个接口 微博昵称:豆腐干_UPC
点赞
回复
分享
发布于 2015-04-26 22:56
攻城狮-Jason
1.采用冗余机制保证数据可靠性 2.Hadoop1.x默认的是64M, 2.x版本是128M 3.默认调度器FIFO 4.接口:InputFormat,InputSplit,RecordReader,Mapper,Combiner,Partitioner,Sort,Reducer,OutputFormat,RecordWriter 微博昵称: 攻城狮-Jason
点赞
回复
分享
发布于 2015-04-26 22:19
北虎爷爷
山西大学 Java
Question: HDFS是通过什么机制保证数据可靠性的? answer: 通过冗余备份策略 Question: HDFS默认的块大小是多少? answer: Hadoop1.x默认的block块大小是64M,Hadoop2.x默认的block块大小是128M Question: Hadoop默认的调度器是什么? answer: 先进先出哦(FIFO) Question: Hadoop MapReduce有哪些编程接口? answer: InputFormat接口,用户实现该接口以实现文件内容的输入格式。 Mapper接口,哈哈,地球人都知道 Partitioner接口 一般为优化而生 Combiner接口,为性能而生 Reducer接口,哈哈,又是地球人都知道哦 忘了附微博昵称 微博昵称:北虎爷爷
点赞
回复
分享
发布于 2015-04-26 21:45
北虎爷爷
山西大学 Java
Question: HDFS是通过什么机制保证数据可靠性的? answer: 通过冗余备份策略 Question: HDFS默认的块大小是多少? answer: Hadoop1.x默认的block块大小是64M,Hadoop2.x默认的block块大小是128M Question: Hadoop默认的调度器是什么? answer: 先进先出哦(FIFO) Question: Hadoop MapReduce有哪些编程接口? answer: InputFormat接口,用户实现该接口以实现文件内容的输入格式。 Mapper接口,哈哈,地球人都知道 Partitioner接口 一般为优化而生 Combiner接口,为性能而生 Reducer接口,哈哈,又是地球人都知道哦
点赞
回复
分享
发布于 2015-04-26 21:42
牛客842903号
第一题:HDFS 刚刚启动时,NameNode 会进入安全模式(safe mode)。处于安全模式的NameNode不能做任何的文件操作,甚至内部的副本创建也是不允许的。NameNode 此时需要和各个DataNode 通信,获得DataNode 保存的数据块信息,并对数据块信息进行检查。只有通过了NameNode 的检查,一个数据块才被认为是安全的。当认为安全的数据块所占的比例达到了某个阈值(可配置),NameNode 才会退出。 第二题:HDFS文件 为默认128M 第三题:默认的是capacity 调度器 第四题:Mapper、Reducer接口
点赞
回复
分享
发布于 2015-04-26 21:41
星星会发光啦啦
中国人民大学 算法工程师
1.Hadoop 视硬件错误为常态,并通过块的冗余存储机制保证数据的高可靠性。 在大多数情况下,副本系数是 3 , HDFS 的存放策略是将一个副本存放在本地机架的节点上,一个副本放在同一机架的另一个节点上,最后一个副本放在不同机架的节点上。 2. 大多数,默认为64MB 3.默认调度器 :FIFO 这个调度器的特点是先进先出,英文名是first in first out 4. Mapper和Reducer接口 微博:星星会发光啦啦
点赞
回复
分享
发布于 2015-04-26 21:22
僅此邇魢
hust C++
答对了牛妹赠书么,~~
点赞
回复
分享
发布于 2015-04-15 18:03
暂无评论,快来抢首评~
相关推荐
12-24 14:07
吉林大学 Java
杂记近期所面试的三家中小厂
个人总结 近几天接连面了好几家中小厂,我整理了一下面试遇到的问题,以及自己下一步的学习计划和对中小厂面试的一些看法。文末我附上了近期调试 Gemini 整理面试内容文字文稿形成问题记录和回答的 propmt,愿能帮助到有需要的同学。 周四面了蔚来软件测试后台开发,有点像KPI面,一上来就陆续给了三道算法题。自己这边也出了点小问题。面试过程中没有注意挑个安静的地方,旁边的教室一直搁那上微积分,非常嘈杂。面试环境这个问题在后续暑期和秋招中务必要解决之,否则会极大影响问答过程和思考状态。此外分别面了北京地区的一家研究所旗下挂名公司的后端实习,和上海某小厂的后端实习。经历了多场面试之后,我发现大厂相对...
远航_随风:
update:北京那家(途游)已电话OC,终于有班上了
面经总结回顾
点赞
评论
收藏
分享
12-25 16:47
影石Insta360_深度学习算法工程师(准入职员工)
嘉士伯内推,嘉士伯内推码
组内外氛围都超nice的!即使没有相关垂直经验都很耐心详细地引导我,还会关心会不会有压力,让我慢慢来,i人简直heart暖暖🥰🥰 上下班时间弹性,打卡忧虑完全没有😋还总是收到来自同事的投喂和关心,实在太宠了😚😚 咖啡零食你就吃吧,不用做小老鼠上灯台了,光明正大的吃吃吃😍😍 弹性工作时间,每周可以选择2-3天远程办公,保证工作效率,又兼顾个人生活~ 外企非常重视员工的休息和健康, 外企年假很多,15~25天假期! 更包容更友好的职场生态 女生友好,尤其是对哺乳期、生育期的女生格外照顾 非常多的外企出了女性领导力计划,女生职场晋升更容易 · 丹麦外企:下班后可以到公司的Lounge和...
嘉士伯公司氛围 714人发布
点赞
评论
收藏
分享
12-08 17:28
无锡高等师范学校 算法工程师
最后再看下工位,就走吧
牛马人的牛马人生:
一开始看成了网吧
点赞
评论
收藏
分享
12-12 16:24
周口师范学院 嵌入式软件开发
双非二本,嵌软开发2offer,还应该坚持吗
投了几百家心累了😓😓,就约到了两家面试,虽然全过了,但是薪资有点低,目前一个8k的南京一家芯片原厂,一个西安的9590做仪表油气行业的
初次见面我叫泰隆:
西安的感觉不错了吧,学院本很难的
点赞
评论
收藏
分享
昨天 14:31
滴滴_运维开发工程师(准入职员工)
滴滴内推,滴滴内推码
🔥滴滴一二三面 技术面 面经后端最近结束了滴滴的面试,三轮技术面问得超细致❗️整理了完整面经和思路分享给大家👇——————🧩一面 60min•RocketMQ vs Kafka 区别(设计理念/吞吐/延迟)•Redis性能核心:内存+I/O多路复用原理•Redis数据结构选型场景实战•MySQL与Redis一致性方案(旁路缓存策略)•协程原理剖析:Goroutine底层调度模型•Lua脚本实现原子库存扣减•MySQL索引优化与B+树优势•防超卖方案:分布式锁+库存校验•算法:搜索旋转排序数组(二分变形)——————🧩二面 60min•List遍历删除的坑(迭代器失效问题)•MySQL索...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
7
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
大四双非水产专业上岸阿里后端(五)
1.5W
2
...
适可而止吧!你就是“烂泥”
4185
3
...
我的世界观,就是对抗优绩主义的武器
3943
4
...
实习被“放养”零产出,该及时止损还是继续苟着?
3361
5
...
牛客2025年度报告—道心初立,夯实基础
3105
6
...
寒假实习会影响暑期投递吗?
1799
7
...
大厂工作强度从夯到拉,B站真爽
1640
8
...
被问有没有男朋友 如果有同事欺负你怎么办
1558
9
...
没人带+同事冷漠,真的会内耗
1382
10
...
求支招
1265
创作者周榜
更多
正在热议
更多
#
对2025年忏悔
#
1254次浏览
18人参与
#
联影求职进展汇总
#
165083次浏览
831人参与
#
实习没人带,苟住还是跑路?
#
6766次浏览
150人参与
#
非技术岗简历怎么写
#
274766次浏览
3168人参与
#
元旦假期你打算怎么过
#
4508次浏览
118人参与
#
春招前还要继续实习吗?
#
1541次浏览
26人参与
#
你做过哪些dirty work
#
25040次浏览
155人参与
#
妈妈治愈了你哪些脆皮时刻
#
38390次浏览
338人参与
#
面试官问过你最刁钻的问题是什么?
#
3511次浏览
54人参与
#
大家实习都在做什么?
#
5923次浏览
60人参与
#
一人说一家双休的公司
#
3498次浏览
55人参与
#
毕业论文怎么查AI率
#
70105次浏览
1941人参与
#
运营面经
#
148923次浏览
1329人参与
#
我来点评面试官
#
37624次浏览
163人参与
#
我们是不是被“优绩主义”绑架了?
#
6435次浏览
215人参与
#
实习/项目/竞赛奖项,哪个对找工作更重要?
#
102510次浏览
1185人参与
#
牛客2025仙途报告
#
28786次浏览
375人参与
#
职场中对你有帮助的书
#
25690次浏览
216人参与
#
查收我的offer竞争力报告
#
264324次浏览
1650人参与
#
面试等了一周没回复,还有戏吗
#
191989次浏览
1660人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务