Flume

组成

  • Agent:是一个JVM进程(可通过top -p < pid > -H查看),分为Source、Channel、Sink。
  • Source:负责接收发送到Flume的数据,将数据以消息的形式通过事务提交到Channel。重要的Source有:TailDir、exec、netcat。
  • Channel:位于Source和Sink之间的缓冲区。重要的Channel有:File、Memory、Kafka。
  • Sink:轮询Channel中的消息,通过事务从Channel拉取数据,然后输出到指定位置。重要的有HDFS。
  • Event:Flume中的消息,分为Header和Body。

项目中的Flume

  • 图片说明

其他问题

  • flume采集的数据是否会丢失?

    • Flume的Source端和Channel端都有独立的事务,不会丢失数据,但有可能会有重复的数据。
  • flume中的事务

    • 图片说明
全部评论

相关推荐

Vincent777...:实习经历可以考虑放上去,对于软件使用方面可以细化一些,比如调整为:熟悉基于LSDYNA的瞬态动力学仿真分析,熟悉基于WORKBENCH的结构拓扑优化
我的简历长这样
点赞 评论 收藏
分享
06-15 02:05
已编辑
南昌航空大学 数据分析师
Eason三木:你如果想干技术岗,那几个发公众号合唱比赛的经历就去掉,优秀团员去掉,求职没用。然后CET4这种不是奖项,是技能,放到下面的专业技能里或者单独列一个英语能力。 另外好好改改你的排版,首行缩进完全没有必要,行间距好好调调,别让字和标题背景黏在一起,你下面说能做高质量PPT你得展现出来啊,你这简历排版我用PPT做的都能比你做的好。 然后自我评价,你如果要干数据工程师,抗压能力强最起码得有吧。
简历中的项目经历要怎么写
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务