2021-04-23 15:12 携程旅行网_IBU_Java开发工程师

关注

LifeCat系统-搭建Hadoop分布式平台进行数据分析

LifeCat系列学习项目（Hadoop）

LifeCat系统-搭建Hadoop分布式平台进行数据分析

最简单的MapReduce应用程序至少包含 3 个部分：
一个 Map 函数、一个 Reduce 函数和一个 main 函数。
在运行一个mapreduce计算任务时候，任务过程被分为两个阶段：
map阶段和reduce阶段，每个阶段都是用键值对（key/value）作为输入（input）和输出（output）。
main 函数将作业控制和文件输入/输出结合起来。

基于Hadoop分布式计算环境，

为lifecat系统图像运算提供高性能计算环境

同时对lifecat产生的数据进行处理与分析

MapReduce提供图像运算支持

image包

MapReduce提供数据分析支持

data包

MapReduce开发测试Demo

text包

基于MapReduce对文本文件的词频进行统计

并行读取文本中的内容，然后进行MapReduce操作

Map过程：并行读取文本，对读取的单词进行map操作，每个词都以<key,value>形式生成。
我的理解：

　　一个有三行文本的文件进行MapReduce操作。

　　读取第一行Hello World Bye World ，分割单词形成Map。

　　<Hello,1> <World,1> <Bye,1> <World,1>

　　读取第二行Hello Hadoop Bye Hadoop ，分割单词形成Map。

　　<Hello,1> <Hadoop,1> <Bye,1> <Hadoop,1>

　　读取第三行Bye Hadoop Hello Hadoop，分割单词形成Map。

　　<Bye,1> <Hadoop,1> <Hello,1> <Hadoop,1>

Reduce操作是对map的结果进行排序，合并，最后得出词频。
我的理解：

　　经过进一步处理(combiner),将形成的Map根据相同的key组合成value数组。

　　<Bye,1,1,1> <Hadoop,1,1,1,1> <Hello,1,1,1> <World,1,1>

　　循环执行Reduce(K,V[])，分别统计每个单词出现的次数。

　　<Bye,3> <Hadoop,4> <Hello,3> <World,2>

配置Apache Hadoop开发环境

Linux(ubuntu16.04)环境下配置Hadoop

分布式集群主机

使用1台linux(ubuntu)系统作为集群中心，负责任务的发布

ubuntu16配置Hadoop环境

Linux(centos7.4)环境下配置Hadoop

分布式集群环境

使用2台linux(centos)系统作为分布式环境，进行分布式计算

centos7配置Hadoop环境

主机配置HDFS1

HDFS2

Windows10环境下配置Hadoop

开发环境

在windows10环境中通过伪分布式环境进行项目的开发

win10配置Hadoop环境

@项目源码

GitHub：kevinten10/Hadoop-lifecat

相关项目：

LifeCat version1 servlet基础Javaweb服务网站

LifeCat version2 version1相应SSM后台管理系统

LifeCat version3 前后端分离springboot后端

LifeCat version3 前后端分离vuejs前端

LifeCat wechat wechax

LifeCat android 相应Android相册应用

LifeCat python 机器学习进行图像智能

全部评论

推荐最新楼层

02-24 14:55

吉林大学测试工程师

开水加点🍬

发了一包糖哈哈哈哈，要变成甜水团吗哈哈哈哈哈哈哈哈哈

点赞评论收藏

分享

昨天 17:19

小红书_后端开发_REDstar算法工程师(准入职员工)

禾赛科技内推，禾赛科技内推码

禾赛科技 嵌入式开发（操作系统）面经⚜技术是真的过硬啊，秋招嵌入式被拷打的最狠之一。原定45分钟，拷打一个半小时，涉及知识面特别广，实际问的比这还要多，记忆有限。不过也无后续，但也没挂，估计在L3缓存里面吧⭕一面（9.18）1. 自我介绍2. 项目介绍3. 有没有测量IMU精度4. 串口有几根线，中断配置？5. IIC有几根线？讲一讲怎么通信？详细说一下读取寄存器的流程6. 说一说任务有哪几种状态？就绪和阻塞的任务放在哪里？放在同一个链表上面吗？7. 任务怎么进入阻塞态？（主动挂起，被强占，争取不到资源等）8. 说一说死锁？9. 怎么解决死锁问题？（获取不到锁的时候，释放本身的资源）10. 有...

点赞评论收藏

分享

02-25 10:07

门头沟学院 golang

社招有人能跳槽成功吗

25届刚工作8个月，boss没人搭理，伪装3年试试水，还是没人搭理

点赞评论收藏

分享

02-23 14:13

算法工程师

包装一年的java 大家觉得怎么样

大家给给建议，虚心请教！

点赞评论收藏

分享

02-25 15:30

魔门塔（苏州）科技有限公司_感知算法工程师(准入职员工)

9377游戏内推，9377游戏内推码

erlang后端开发面试首先笔试，现场做：第一部分选择题(5题左右)：大部分与排序、查找、时间复杂度、稳定性这几个知识点有关。有一题是通过二叉树的中序和后序反推原二叉树。总体难度：低第二部分简答题：1.TCP与UDP有什么不同？ 2.写冒泡排序3.写出题目代码的递归结果4.考察引用与const修饰的值必须初始化总体难度：低偏中接着好像是1个技术主管面+1个HR面+1个HR面技术面：会涉及一点分布式（有了解过分布式吗）、对公司有了解吗两个HR面不为难人，很友善总体来说面试过程很好9377游戏2026届春招启动！【公司简介】9377集团成立于2011年，是集研发、发行和平台运营于一体的全球化综合型...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# xx岗简历求拷打 #

10940次浏览 119人参与

# 如何看待offer收割机的行为 #

1047982次浏览 6599人参与

# 开工第一帖 #

36645次浏览 733人参与

# 掌握什么AI技能，会为你的求职大大加分 #

8932次浏览 381人参与

# 有转正机会的小厂实习值得去吗？ #

9736次浏览 103人参与

# 机械人还在等华为开奖吗？ #

316232次浏览 1586人参与

# 携程求职进展汇总 #

890656次浏览 5891人参与

# 面试反问你会问什么 #

169108次浏览 1741人参与

# 工作不开心辞职是唯一出路吗 #

9920次浏览 40人参与

# 远程面试的尴尬瞬间 #

328872次浏览 1918人参与

# 你最讨厌面试被问什么 #

9734次浏览 113人参与

# 制造业的秋招小结 #

144960次浏览 2095人参与

# 金三银四，你有感觉到吗 #

695511次浏览 6092人参与

# 面试题刺客退退退 #

535897次浏览 7533人参与

# 哪些公司开春招了？ #

35153次浏览 209人参与

# 牛客租房专区 #

162159次浏览 1993人参与

# 公司情报交流地 #

142473次浏览 1269人参与

# 求职季如何保持心态不崩 #

213147次浏览 1464人参与

# 毕业季等于分手季吗 #

55112次浏览 655人参与

# 满分简历要如何准备？ #

265228次浏览 3064人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务