如何利用flume进行日志采集

介绍    

    Apache Flume 是一个分布式、可靠、高可用的日志收集、聚合和传输系统。它常用于将大量日志数据从不同的源(如Web服务器、应用程序、传感器等)收集到中心化的存储或数据处理系统中。

基本概念

  • Agent(代理): Flume 中的基本工作单元,用于数据的采集、传输和处理。
  • Source(数据源): 代理中的组件,负责接收和发送数据到 Flume。
  • Channel(通道): 用于临时存储数据的缓冲区,用于在 Source 和 Sink 之间传输数据。
  • Sink(数据目的地): 代理中的组件,负责将数据传送到指定的目的地,如 HDFS、Kafka es等。

安装步骤

安装和配置 Flume

下载并安装 Apache Flume。从 Apache Flume 官网 下载适用于你环境的版本,并按照官方文档进行安装和配置。

我下载的是flume-v1.11.0版本,下载地址:Apache Download Mirrors

下载完成后上传到服务器的/opt/software目录

1.将 apache-flume-1.11.0-bin.tar.gz 上传到 linux 的/opt/software 目录下2.解压 apache-flume-1.11.0-bin.tar.gz 
tar -zxf apache-flume-1.11.0-bin.tar.gz3.修改 apache-flume-1.11.0-bin 的名称为 flume
mv apache-flume-1.11.0-bin flume4.将 flume/conf 下的 flume-env.sh.template 文件重命名为 flume-env.sh,并配置 flumeenv.sh 文件
mv flume-env.sh.template flume-env.shvi flume-env.sh
# 添加java环境变量
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64

配置环境变量

vim /etc/profile#FLUME
export FLUME_HOME=/opt/software/flume
export PATH=$PATH:$FLUME_HOME/binsource /etc/profile

查看版本:flume-ng version

定义数据流

        创建 Flume 配置文件,定义数据流。这个配置文件描述了数据流的来源、通道和目的地。一个基本的 Flume 配置文件可能包含以下几个关键组件:

  • Source(数据源):定义数据的来源,如日志文件、网络端口、Kafka 等。
  • Channel(通道):定义数据在 Flume 内部的缓冲区,暂存数据,确保可靠地传输。
  • Sink(数据目的地):定义数据的最终目的地,可以是 HDFS、HBase、Kafka 等。
  1. 配置 Source、Channel 和 Sink:

    • 在 Flume 配置文件中配置 Source、Channel 和 Sink。你需要根据你的数据来源和目的地的不同选择合适的 Source、Channel 和 Sink,并配置相关参数。
  2. 启动 Flume Agent:

    • 运行 Flume Agent,并指定 Flume 配置文件。例如:flume-ng agent -n agent_name -c conf -f conf/flume-conf.properties
  3. 监控和管理:

    • 使用 Flume 的监控和管理工具来跟踪数据流、监控性能,并对 Flume 进行管理。
  4. 测试和优化:

    • 测试数据流,确保数据能够按预期采集、传输和存储。根据需要进行优化配置,以提高性能和稳定性。

示例配置文件

   以下是一个简单的 Flume 配置文件示例:

  1. 创建一个flume-agent-conf.yml并写入以下内容

# 定义 agent 名称
agent1.sources = source1
agent1.channels = channel1
agent1.sinks = sink1# 配置数据源
agent1.sources.source1.type = exec
agent1.sources.source1.command = tail -F /opt/test.log
agent1.sources.source1.channels = channel1# 配置通道
agent1.channels.channel1.type = memory
agent1.channels.channel1.capacity = 1000
agent1.channels.channel1.transactionCapacity = 100# 配置数据目的地
agent1.sinks.sink1.type = logger
agent1.sinks.sink1.channel = channel1

上述配置文件定义了一个名叫agent1的实例,数据来源为tail -F /opt/test.log,收集test.log的内容,并且通过sink配置输出到控制台

2.通过命令启动agent

flume-ng agent -n agent1 -c conf -f conf/flume-agent-conf.properties

3.往test.log里写入内容,vi test.log

4.查看agent日志,tail -f flume.log,能够看到以下内容输出,表示log采集成功。

         上面是一个很简单的flume采集示例,其实flume 可以将收集的日志输出到指定的目的地(如 HDFS、HBase、Kafka 等)。要查看已收集的日志,需要前往 Flume 配置文件中指定的输出目的地(sink),并使用相应的工具或方式来访问这些日志。

        例如,如果 Flume 配置将日志输出到 HDFS 中,可以使用 Hadoop 命令来查看或下载这些日志。如果将日志发送到 Kafka,则可以使用 Kafka 相关的命令或工具来消费这些消息。

   根据你的具体需求和环境配置更复杂的 Flume 配置文件,并确保理解每个组件的作用和配置参数的含义。 Flume 提供了丰富的 Source、Channel 和 Sink 类型以及各种配置选项,可以根据实际场景选择适合的组件和配置。

Flume 的常用组件

  • Avro Source: 从 Avro 格式数据源接收数据。
  • File Source: 从文件系统中的文件接收数据。
  • Memory Channel: 在内存中存储事件的通道。
  • HDFS Sink: 将数据写入 HDFS 目标的 Sink。

注意事项

  • 通道容量和事务容量的调整:根据需要调整 Flume 通道的容量和事务容量,确保适应大型数据的传输。
  • 合理配置 Source 和 Sink:根据实际情况选择合适的 Source 和 Sink 类型。
  • 数据格式正确性:确保发送到 Flume 的数据符合所需的格式,以避免消息被截断。

结语

        Apache Flume 是一个强大的数据收集和传输工具,可以轻松地处理大量的数据流。使用本文提供的示例和概念,可以开始使用 Flume 并适应不同的数据采集和传输需求。本篇文章就介绍到这里,感兴趣的同学可以自己去深入研究,使用flume完成日志采集、关键字告警等一整套的业务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/562571.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

接口应用:内部比较器Comparable

接口应用:内部比较器Comparable public interface Comparable {public int compareTo(Object obj); }public class Book implements Comparable{private String bookName;private String author;private String publisher;private double price;Overridepublic int…

axios进行图片上传组件封装

文章目录 前言图片上传接口(axios通信)图片上传使用upload上传头像效果展示总结 前言 node项目使用 axios 库进行简单文件上传的模块封装。 图片上传接口(axios通信) 新建upload.js文件,定义一个函数,该函数接受一个上传路径和一…

JDK1.8的接口新特性

JDK1.8的接口新特性 JDK7及其之前1、接口的变量都是public final static 全局静态常量,无变化。2、接口中都是抽象abstract方法,不能有static方法(因为abstract和static、final、private不能共存)JDK1.8及其之后1、接口中可以添加…

多相机坐标转换_使用KITTI数据集实现坐标转换

本文的主要内容,是讨论如何将KITTI激光雷达的点云数据,映射到图像中去。KITTI数据集是怎么采集的下面这幅图是车的俯视图,可以看到,用到了2个彩色相机,2个灰度相机,1个激光雷达。1个GPS/IMU。图1 KITTI车俯…

内部类-----Java

内部类-----Java 内部类是一类特殊的类,指的是定义在一个类的内部的类,在Java中内部类主要分为非静态内部类、静态内部类、局部 内部类、匿名内部类。 非静态内部类,作为类的成员存在,和成员变量、构造方法、代码块并列。因为是…

api数据加密的定义_API 设计基础规范

首先,请务必记住 API 设计和使用的一个重要法则 Postels Law(又称作稳健性原则):Be liberal in what you accept, be conservative in what you send下面是关于 API 设计的一些基本问题API First将 API 视作产品,并向产品开发一样设计和维护 API在代码实…

MySQL表级约束和列级约束

MySQL中只要支持六种完整性约束,如表所示:其中check约束是MySQL8中提供的支持。 约束条件 约束描述 primary key 主键约束,约束的值可唯一的标识对应的记录 not null 非空字段的值不能为空 unique 唯一约束,约束1字段的值是…

MySQL外键约束

MySQL外键约束 外键约束(FOREIGN KRY,缩写FK)是用来实现数据库表的参照完整性约束的。 外键约束可以是两张表紧密的结合起来,特别是针对修改或者删除的级联操作时, 会保证数据的完整性。 (注&#xff1…

zookeeper 密码_Dubbo、ZooKeeper介绍

dubbo是一个分布式架构的服务框架,一般结合maven的模块式开发使用。传统的单架构项目,不方便维护和升级;通过maven的模块式开发,就可以把一个单架构的工程,拆封成一个一个的小模块,包括(jar和war)&#xff…

异常--java

java默认的异常处理机制 优点:发生异常后、会给出异常类型、异常提示信息、异常出现的位置 缺点:出现异常后,后续语句不执行了;提示信息太专业,可读性差 解决:try-catch-finally 处理异常;th…

192.168.8.1手机登陆_高端机型都在鼓吹的ufs3.1是什么?对于手机使感受明显吗?...

最近很多朋友留言问,ufs3.1是什么,很重要吗?下面就由小编来给大家介绍一下手机上的ufs3.1是什么!ufs是高端安卓手机,常用的储存协议,就好像我们电脑里的固态硬盘一样,速度越快,打开软…

代码合并工具_11个代码质量审核和管理工具,程序员必备!

「 读者福利!2 TB 各类技术资源免费赠送 」如今,代码质量分析和审核已成为每个企业的基本流程。随着开源代码库使用的增加,安全性和代码质量对于构建高质量软件至关重要。不良的代码不仅会影响代码的可维护性,而且还会在某些情况下…

异常体系----java

一、异常体系 1、error error类层次描述了java运行时系统内部错误和资源耗尽错误,一般指与jvm或动态加载等相关的问题, 如:虚拟机错误,动态链接失败,系统崩溃等。 2、exception 所有异常类的父类,其子…

xy坐标正负方向_【笛卡尔坐标系】

【壹】笛卡尔坐标系(Cartesian coordinates)就是直角坐标系和斜坐标系的统称。相交于原点的两条数轴,构成了平面放射坐标系。如两条数轴上的度量单位相等,则称此放射坐标系为笛卡尔坐标系。两条数轴互相垂直的笛卡尔坐标系,称为笛卡尔直角坐标…

throw和throws的使用

throw和throws的使用 public class Person {private String name;private int age;public Person(){}Person(String name,int age){this.name name;this.age age;}public int getAge() {return age;}public String getName() {return name;}public void setName(String name…

为什么需要包装类?

1、某些方法的参数必须是对象,为了让基本数据类型的数据能作为参数,提供包装类。 2、包装类还可以提供更多的功能 3、其他特别重要的功能:比如可以实现字符串和基本数据类型之间的转换 认识一下包装类吧! package demo05;impor…

一句话概括自动装箱/拆箱

自动装箱过程是通过调用包装类的valueOf()方法实现的,二自动拆箱过程是通过调用包装类的xxxValue()方法实现的(xxx代表对应的基本数据类型,如intValue,doubleValue等)。 …

2021-05-24

String类的使用 package demo07;import java.util.Locale; import java.util.function.BiConsumer;public class TestString {public static void main(String[] args) {//1.创建一个String对象String str "abcDEfghijkL";//2.操作该String对象//2.1最简单的方法Sy…

StringBuffer和StringBuild

StringBuffer和StringBuild两个类的区别主要是: StringBuffer JDK1.0提供的类,线程安全,做线程同步检查,效率较低。 StringBuild JDK1.5提供的类,线程不安全,不做线程同步检查,因此效率较高。…

Date类练习

package demo09;import java.util.Date;public class TestDate {public static void main(String[] args) {//获取当前时间Date now new Date();//输出当前时间System.out.println(now.toString());System.out.println(now.toLocaleString());System.out.println(now.getYear(…