flume----初步安装与配置

目录标题

    • **flume的简单介绍**
      • ⭐flume的**核心组件**
      • ⭐**核心特点**
    • **安装部署**
      • 1)**解压安装包**
      • 2)**修改名字** **(配置文件时,更方便)**
      • **3)⭐⭐配置文件**
      • 4)**兼容Hadoop**
      • 5)**配置环境变量**
      • 6)**测试flume**
    • **⭐启动flume**
      • 1)在`flume`中创建空目录`jobs`
      • 2)在`jobs`内添加文件
      • **最终启动**

flume的简单介绍

Flume 是一个开源的 分布式日志收集系统,由 Apache 开发,主要用于高效地 采集、聚合和传输海量日志数据 (比如网站点击日志、服务器监控日志等),并将这些数据可靠地传递到 目标存储 (如 HDFS、HBase、Kafka 等)

⭐flume的核心组件

1.source(数据接收源头)

  • 负责接数据
    例,监听日志文件的新增内容

2.channel(通道)

  • 负责临时存储数据,确保数据不会丢失,相当于“缓冲区”

  • 存在原因
    数据的 “输入”“输出” 速度有时不同,为了避免数据丢失

3.sink(数据的输出)

  • 负责“送数据”,比如将数据写入
    HDFSkafka

核心特点

  1. 可靠性
  • 数据在传输过程中会持久化缓存(Channel),即使系统故障,数据也不会丢失
  1. 扩展性
  • 可横向扩展多个 Agent(Flume 节点)处理更大数据量
  1. 灵活性
  • 支持多种数据源(HTTP、日志文件、Kafka 等)和目的地(HDFS、HBase、ES 等)

  • 可自定义数据过滤、格式转换等逻辑

安装部署

1)解压安装包

tar -zxvf 文件名 - C 位置

tar -zxvf apache-flume-1.9.0-bin.tar.gz -C /opt/module/

2)修改名字 (配置文件时,更方便)

先进入到 flume 解压后所在的位置,然后修改

mv 原名 更改后的名字

mv apache-flume-1.9.0 flume

3)⭐⭐配置文件

所配置的在flumeconf里面
(zookeeper也是)
切到conf
再配置
flume-env.sh.template

log4j.properties

  • flume-env.sh.template文件
    保留原本的 内容 防止后续使用
    可以 将此文件复制一份 更名为flume-env.sh
cp flume-env.sh.template flume-env.sh

内容均配置到flume-env.sh

⭐添加jdk的路径

export JAVA_HOME=/opt/module/jdk
  • log4j.properties文件

添加:

flume.log.dir=/opt/module/flume/logs

4)兼容Hadoop

flumelib 下的
guava-11.0.2.jar 改名,以兼容hadoop-3.1.3

[root@hadoop102 lib] mv  guava-11.0.2.jar  guava-11.0.2.jar.bak

文件后.bak 可以 架空 此文件,以便兼容 hadoop-3.1.3

5)配置环境变量

vi /etc/profile添加 flumeexport

export FLUME_HOME=/opt/module/flume
export PATH=$PATH:$FLUME_HOME/bin

生效环境变量文件

source /etc/profile

6)测试flume

flume-ng version检查版本

⭐启动flume

启动时,需要进一步配置

1)在flume中创建空目录jobs

mkdir jobs

2)在jobs内添加文件

文件名为flume-netcat-logger.conf

vi flume-netcat-logger.conf

里面的内容是 flume 的启动内容

  • ① 将组件命名
  • ②描述组件/配置源 source
  • ③将一个事件缓冲到channel
  • ④描述组件sink
  • ⑤将输入源source输出sink
    管道channel联系起来

如图
在这里插入图片描述

最终启动

bin/flume-ng agent -n a1 -c conf/ -f jobs/flume-netcat-logger.conf -Dflume.root.logger=INFO,console
nc hadoop01 10050

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/78850.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深度整合Perforce P4+Jira+Confluence:游戏开发团队协作工具链搭建指南

现场对话 游戏开发团队最头疼的版本管理问题是什么? SVN宕机? Git仓库爆炸? 还是美术资源管理一团乱? 在4月11-12日的GGS 2025全球游戏峰会上,Perforce中国授权合作伙伴-龙智的销售和技术支持团队,与行业…

k8s基本概念-YAML

YAML介绍 YAML是“YAML Aint a Markup Language” (YAML不是一种置标语言)的递归缩进写,早先YAML的意思其实是:“Yet Another Markup Language”(另一种置标语言) YAML是一个类似XML、JSON的标记性语言。YAML强调以数据为中心,并不是以标识语言为重点。因而YAML本身的定义…

ECharts散点图-散点图20,附视频讲解与代码下载

引言: ECharts散点图是一种常见的数据可视化图表类型,它通过在二维坐标系或其它坐标系中绘制散乱的点来展示数据之间的关系。本文将详细介绍如何使用ECharts库实现一个散点图,包括图表效果预览、视频讲解及代码下载,让你轻松掌握…

Infrared Finance:Berachain 生态的流动性支柱

在加密市场中,用户除了参与一级和二级交易,还有一种低门槛参与的就是空投。从 2021 年 DeFi 成为主流开始,空投一直都是“以小搏大”的机会,通过参与项目早期的链上交互和任务以获取空投奖励,近几年已成为一种广受欢迎…

附1:深度解读:《金融数据安全 数据安全分级指南》——数据分类的艺术专栏系列

文章目录 一、文件背景与意义1.1 文件背景1.2 文件意义 二、文件结构与核心内容2.1 文件结构概述2.2 核心内容解析2.2.1 范围与适用对象2.2.2 数据安全定级目标与原则2.2.3 数据安全定级要素2.2.4 要素识别2.2.5 数据安全级别划分 三、定级方法与流程3.1 定级流程3.2 级别变更机…

vue mixin混入与hook

mixin混入是 ‌选项式 API‌&#xff0c;在vue3-Composition API <script setup> 中无法直接使用&#xff0c;需通过 setup() 函数转换 vue2、vue3选项式API: // mixins/mixin.js export const mixin {methods: {courseType(courseLevel) {const levelMap {1: 初级,…

Excel如何安装使用EPM插件并且汉化?

Excel如何使用EPM插件 Excel如何使用EPM插件一、安装EPM插件二、启动EPM插件三、插件汉化设置 Excel如何使用EPM插件 一、安装EPM插件 在安装EPM插件时&#xff0c;若运行安装包后出现报错提示&#xff0c;通常是因为系统缺少 Visual Studio 2010 组件&#xff0c;需先安装该…

vue3-springboot-mysql的docker部署

Docker配置原理与部署文档 概述 本文档详细说明RuoYi-Vue与BladeX集成项目的Docker部署原理&#xff0c;包括配置文件的作用、相互关系及数据流动。通过三个核心配置文件&#xff08;docker-compose.yml、Dockerfile和docker-entrypoint.sh&#xff09;&#xff0c;实现了应用…

第十二天 使用Unity Test Framework进行自动化测试 性能优化:Profiler分析、内存管理

前言 在完成游戏核心功能开发后,如何确保项目质量并成功发布到各大平台?本文将从自动化测试到商店上架,手把手教你构建完整的游戏开发闭环。使用Unity 2022 LTS版本进行演示,所有代码均经过实际项目验证。 一、自动化测试实战(Unity Test Framework) 1.1 测试框架搭建 …

【专题四】前缀和(3)

&#x1f4dd;前言说明&#xff1a; 本专栏主要记录本人的基础算法学习以及LeetCode刷题记录&#xff0c;按专题划分每题主要记录&#xff1a;&#xff08;1&#xff09;本人解法 本人屎山代码&#xff1b;&#xff08;2&#xff09;优质解法 优质代码&#xff1b;&#xff…

深度解析:TextRenderManager——Cocos Creator艺术字体渲染核心类

一、类概述 TextRenderManager 是 Cocos Creator 中实现动态艺术字体渲染的核心单例类。它通过整合资源加载、缓存管理、异步队列和自动布局等功能&#xff0c;支持普通字符模式和图集模式两种渲染方案&#xff0c;适用于游戏中的动态文本&#xff08;如聊天内容、排行榜&…

【漫话机器学习系列】229.特征缩放对梯度下降的影响(The Effect Of Feature Scaling Gradient Descent)

特征缩放对梯度下降的影响&#xff1a;为什么特征标准化如此重要&#xff1f; 在机器学习和深度学习中&#xff0c;梯度下降是最常用的优化算法之一。然而&#xff0c;很多人在训练模型时会遇到收敛速度慢、训练不稳定的问题&#xff0c;其中一个重要原因就是特征未进行适当的…

【神经网络与深度学习】批标准化(Batch Normalization)和层标准化(Layer Normalization)

引言 在深度学习中&#xff0c;标准化技术&#xff08;Normalization&#xff09;是提高神经网络训练效率和性能的重要工具。其中&#xff0c;批标准化&#xff08;Batch Normalization, BN&#xff09;和层标准化&#xff08;Layer Normalization, LN&#xff09;是两种常用的…

OpenHarmony之电源管理子系统公共事件定义

OpenHarmony之电源管理子系统公共事件定义 电源管理子系统面向应用发布如下系统公共事件&#xff0c;应用如需订阅系统公共事件&#xff0c;请参考公共事件接口文档。 COMMON_EVENT_BATTERY_CHANGED 表示电池充电状态、电平和其他信息发生变化的公共事件的动作。 值&#x…

linux 环境下 c++ 程序打印 core dump 信息

linux 信号机制 软中断信号 Signal&#xff0c;简称信号&#xff0c;用来通知进程发生了异步事件&#xff0c;进程之间可以互相通过系统调用 kill 等函数来发送软中断信号。内核也可以因为内部事件而给进程发送信号&#xff0c;通知进程发生了某个事件。 进程对信号的处理 进…

Qt开发环境的安装与问题的解决(2)

文章目录 1. Qt开发环境安装的说明2. 通过安装包进行安装3. 通过在线下载程序 解决问题下载 https....网路错误问题解决开始安装--第一部分开始安装--第二部分 4. 建议配置环境变量&#xff08;非必须&#xff09;配置环境变量的意义 简介&#xff1a;这篇文章主要分享Qt开发环…

【每日EDA行业分析】2025年4月25日

深度总结&#xff1a;EDA 软件行业现状与发展趋势 一、引言 在半导体产业的复杂生态中&#xff0c;EDA 软件宛如一颗闪耀的明珠&#xff0c;它是集成电路设计的核心工具&#xff0c;贯穿芯片从设计构思到最终封装测试的全流程&#xff0c;其重要性不言而喻&#xff0c;被誉为…

flutter实践:比例对比线图实现

需求&#xff1a;flutter实现一个左右对比线图,带有动画效果 效果图&#xff1a; Widget _buildTop() {return Container(height: themeData.heightXl,padding: EdgeInsets.symmetric(horizontal: themeData.hSpacingMd),child: Row(mainAxisAlignment: MainAxisAlignment.spa…

测试基础笔记第十五天

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 一、集合1.集合的定义二、使用集合列表去重 导包二、函数1.函数介绍2.定义函数3.调用函数4.函数实现登录案例5.函数的返回值 三、模块和包1.模块的概念(Module)2.模…

Linux中的shell脚本练习

1.判断字符串是否为空 #!/usr/bin/bash while : #:默认值为真 do read -p "请输入你的密码: " a pass123456 if [ -z $a ];thenecho "您输入的密码不能为空"exit 1 elseif [ $a $pass ];thenecho "登录成功"breakelseecho "您的密码输入有…