Flume概述

官网

http://flume.apache.org/

介绍

Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。

Flume可以采集文件，socket数据包等各种形式源数据，又可以将采集到的数据输出到HDFS、hbase、hive、kafka等众多外部存储系统中。

一般的采集需求，通过对flume的简单配置即可实现。

Flume针对特殊场景也具备良好的自定义扩展能力，因此，flume可以适用于大部分的日常数据采集场景。

 运行机制 1、 Flume分布式系统中最核心的角色是agent，flume采集系统就是由一个个agent所连接起来形成。
 2、 每一个agent相当于一个数据传递员，内部有三个组件：
 a) Source：采集源，用于跟数据源对接，以获取数据
 b) Sink：下沉地，采集数据的传送目的，用于往下一级agent传递数据或者往最终存储系统传递数据
 c) Channel：angent内部的数据传输通道，用于从source将数据传递到sink
 

理解它：
 source是对接要采集的数据源头的，比如数据源头是hdfs，则配置成hdfs的。如果是文件的，则配置成文件的。
 sink是输出的，如果目的地是hdfs，则配置成hdfs的，如果是文件的，则配置成文件的。
 当source的源头是上一个sink，sink的目的地是下一个source的时候，则形成了多级串联（如下图）。
 

下载

http://flume.apache.org/download.html
 

官方学习文档

http://flume.apache.org/documentation.html
 

文档内容很具体详细，包含了source，sink，channel的各种场景配置

-------------

更多的Java，Angular，Android，大数据，J2EE，Python，数据库，Linux，Java架构师，：

http://www.cnblogs.com/zengmiaogen/p/7083694.html

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/538691.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

Flume概述

官网

介绍

运行机制

下载

官方学习文档

相关文章

mastercam加工报表生成_听说最厉害的工程师才敢这样玩五轴加工？

Flume安装（单节点）

Flume实战监听网络端口

滑动关机代码bat_BAT面试算法进阶--（2）无重复字符的最长子串(滑动法优化+ASCII码法)...

jpa findone怎么用_Jpa VS MyBatis，你用哪个？

python正则表达式中的转义字符_python 正则表达式之转义字符

计算机控制系统a卷-答案,计算机控制系统2010-2011年试题A答案

分数的拆分原理和方法_常见的节税原理你知道吗？

Flume实战监听文件夹内文件变化

cad打印本计算机未配置,CAD打印的基本设置详细教程

go ip过滤_用Go实现自己的爬虫

Flume实战采集文件内容存入HDFS

python海龟绘图圆形_python之海龟绘图

PLSQL Developer导入csv文件到oracle

erwin 不能输入中文_国产开源建模软件PDMan与国外商业建模软件ERwin的主要功能比较...

已知一点经纬度，方位角，距离，求另一点经纬度

python的基本语术_一起学python-彻底掌握专业术语“变量”的概念

lamp自动部署工具_Linux一键配置工具ezhttp介绍

git设置全局账号密码_jenkins2.222使用之二、总体设置

Mybatis源码之（TypeAliasRegistry）TypeAlias别名实现机制