KubeCon 2018 参会记录 —— FluentBit Deep Dive

在最近的上海和北美KubeCon大会上,来自于Treasure Data的Eduardo Silva(Fluentd Maintainer)带来了最期待的关于容器日志采集工具FluentBit的最新进展以及深入解析的分享;我们知道Fluentd是在2016年底正式加入CNCF,成为CNCF项目家族的一员,其被广泛用于容器集群中进行应用日志的采集、处理和聚合,但今天主要是跟大家分享一下同样来自于Treasure Data新开源的日志采集工具——FluentBit。

FluentBit vs Fluentd

既然已经有了Fluentd,那么为什么还要开发一个FluentBit呢?我们知道,Fluentd是基于Ruby语言的,在一些应用日志量较大或者单节点日志量较大的场景下,通过Fluentd采集日志的速率会远落后于应用日志的产生速率,进而导致日志采集的延迟时间较大,这对于一些实时性要求较高的业务系统或者监控系统来说是不可接受的;另外一方面,也是由于Fluentd自身的日志处理逻辑越来越复杂,全部放置在一个组件里来完成会导致越来越臃肿,因此Treasure Data在基于Fluentd优秀的架构和设计理念上重新开发了一个更加轻量级、更加高性能的日志采集工具——FluentBit,其主要采用C语言进行开发。

从上面我们可以清晰地看到FluentBit本身占用的内存资源会比Fluentd少很多,且基本没有其他额外的环境依赖,但是支持的插件数相较于Fluentd会少很多,需要时间来慢慢丰富。

FluentBit Workflow

FluentBit 内置了一个Service Engine,其每采集到一条日志时都会执行从Input到Output的整个Action Chain:

- Input

日志数据入口,FluentBit支持多种不同数据来源类型的Input Plugin,不仅能采集容器日志、内核日志、syslog、systemd日志,还支持通过TCP监听接收远程客户端的日志,同时还能够采集系统的CPU、内存和DISK的使用率情况以及本机Network流量日志。

- Parser

通过情况下我们的应用日志都是非结构化的,那么Parser主要是负责将采集到的非结构化日志解析成结构化的日志数据,一般为JSON格式;FluentBit 默认已经预置了下面几种Parser:

  1. JSON:按照JSON格式来进行日志数据解析;
  2. Regex:依据配置的正则表达式来进行日志数据解析;
  3. Apache:遵循Apache日志格式来进行解析;
  4. Nginx:遵循Nginx日志格式来进行解析;
  5. Docker:遵循Docker标准输出日志格式进行解析;
  6. Syslog rfc5424:按照syslog rfc5424规范格式进行日志解析;
  7. Syslog rfc3164:按照syslog rfc3164规范格式进行日志解析;

- Filter

在实际的生产应用中,我们通常需要对采集到的应用日志记录进行修改或者添加一些关键信息,这都可以Filter Plugin来完成;目前FluentBit也已预置了多种Filter插件:

  1. Grep:允许匹配或者过滤掉符合特定正则表达式的日志记录;
  2. Record Modifier:允许对日志数据进行修改或者添加新的KV数据,通过此可以方便我们对日志数据进行打标;
  3. Throttle:支持采用漏桶和滑动窗口算法进行日志采集速率控制;
  4. Kubernetes:自动提取容器或者POD相关信息并添加到日志数据中;
  5. Modify:基于设置的规则来对日志数据进行修改;
  6. Standard Output:允许将日志数据直接打印到标准输出;
  7. Lua:支持通过嵌入Lua Script来修改添加日志数据;

- Buffer

FluentBit 内部本身提供了Buffer机制,会将采集到的日志数据暂存在Memory中直到该日志数据被成功路由转发到指定的目标存储后端。

- Routing

路由是FluentBit的一个核心功能,它允许我们配置不同的路由规则来将同一条日志数据记录转发到一个或多个不同的接收后端,其内部主要是基于每条日志数据的Tag来进行路由转发,同时支持正则匹配方式;如下面配置则表示希望将Tag满足正则表达式my_*的日志直接打印到标准输出中:

[INPUT]Name cpuTag  my_cpu
​
[INPUT]Name memTag  my_mem
​
[OUTPUT]Name   stdoutMatch  my_*

- Output

Output 主要是用来配置采集到的日志数据将要被转发到哪些日志存储服务中,目前已支持多种主流的存储服务,如ElasticSearch、NATS、InfluxDB、Kafka、Splunk、File、Console等,同样也支持将日志数据继续通过HTTP(S)协议将其传输到其他服务接口中;另外这里有一个比较特殊的Output就是Fluentd,可能大家会比较奇怪,其实在未来的日志架构模型中,FluentBit主要是在采集端专职负责日志的高性能采集,然后可以将采集到的日志在Fluentd中进行较复杂的聚合处理(同Filebeat和Logstash):

Other Features

  • Event Driven
    内置的Service Engine采用完全异步的事件驱动模型来进行日志的采集和分发。
  • Configuration
    简单灵活的、高可读性的配置方式,FluentBit的Workflow模型可完全通过配置文件的方式清晰制定。
  • Upstream Manager
    采用统一的日志上游服务的网络连接管理,包括Keepalive和IO Error处理。
  • TLSv1.2 / Security
    对于安全敏感的日志数据,支持通过TLS加密通道进行日志传输。

Upcoming Features

  • Filesystem buffering mode
    当前FluentBit只支持Memory的buffer方式,但考虑到内存的易失性,未来也将会支持基于Filesystem的buffer机制。
  • Optional plugins as shared libraries
    未来会将一些已内置的但又不是必需的插件以共享链接库的方式来进行动态加载。
  • Kubernetes Filter improvements
    未来会继续深度整合Kubernetes,通过API获取更多POD关键信息并自动添加到日志数据记录中。

Summary

这两次的KubeCon大会上Eduardo Silva对日志采集工具FluentBit都进行了深度的解析分享,不仅介绍了FluentBit的整个架构模型,而且还分享了未来的发展方向,从整个分享来看FluentBit会侧重在日志的高性能采集方面;而阿里云容器服务在2017年初开源的Log-Pilot:https://github.com/AliyunContainerService/log-pilot ,其不仅能够采集容器的标准输出日志,而且还能动态地发现采集容器内文件日志,同时支持简单高效的日志声明式配置、支持日志路由、日志数据打标以及多种日志采集插件,未来我们将进一步与社区紧密结合,整合FluentBit的高性能采集特性以及Log-Pilot的动态发现和声明式配置优势来进一步增强容器化应用日志的配置采集效率。

 


原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/520190.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

全球首个!阿里云开源批流一体机器学习平台Alink……

11月28日,阿里云正式开源机器学习平台 Alink,这也是全球首个批流一体的算法平台,旨在降低算法开发门槛,帮助开发者掌握机器学习的生命全周期。 Flink Forward 2019在京举办,吸引众多开发者参与标题Alink基于实时计算引…

聚焦产业·城市、擎领数字未来:IMPACT2019紫光云峰会在津成功举办

近日,紫光云技术有限公司在天津举行主题为“产业城市 擎领未来”的IMPACT2019紫光云峰会,深度阐释打造产业数字引擎的理念和实践,并为unI X云创中心揭牌,发布紫光云芯片产业数字引擎。 天津市人民政府副秘书长杨明远为大会致辞会上…

IntelliJ IDEA 2020 创建xml文件

1、file—setting,左上角输入template, 2、在左侧栏找到File And Code Templates 3、中间选中Files 4、点击号,添加模板 5、输入模板名字:Name:mybatis-cfg.xml (name可以自定义) 6、后缀名extension&#…

刚刚,蚂蚁金服荣膺“中国金融大数据领军企业”称号

小蚂蚁说: 2018中国软件和信息服务领域十大领军企业、人物及产业园区评选活动是业界最权威和最受关注的评选之一。12月20日,在北京举行的“2018中国软件大会”正式宣布蚂蚁金服成为“2018中国大数据金融领军企业”。 2018年12月20日,在北京举…

学java要算法吗_学习java不可不知的几种算法

1、冒泡排序算法&#xff1a;编程语言算法中比较经典的算法。每个程序员都必须了解和会运用的。AAA软件教育程序算法基础通过多次比较(相邻两个数)和交换来实现排序&#xff1a;public class bubble {public static void bubbleSort(int[] a) {int temp;for (int i 1; i < …

IntelliJ IDEA 2020 数据库连接Oracle和Mysql

Mysql数据库连接 填写下面需求要的信息url需要处理 jdbc:mysql://127.0.0.1:3306/xxxdatabase?autoReconnecttrue&useUnicodetrue&characterEncodingutf8&zeroDateTimeBehaviorCONVERT_TO_NULL&useSSLfalse&serverTimezoneCTT&nullCatalogMeansCurr…

i 智慧 | 计算产业发展黄金10年 腾讯云弹性计算抢占计算蓝海

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 刘丹出品 | CSDN云计算&#xff08;ID&#xff1a;CSDNcloud&#xff09;近年来&#xff0c;随着云计算如火如荼的发展&#xff0c;上云已经成为当前企业发展的必然选择。在云计算领域里&#xff0c;计算是最大颗粒度的产品&…

深入探访支付宝双11十年路,技术凿穿焦虑与想象极限

小蚂蚁说&#xff1a; 双11十年间&#xff0c;交易规模的指数级增长不断挑战人们的想象力&#xff0c;而对蚂蚁技术团队来说&#xff0c;这不仅是一场消费盛宴&#xff0c;而是无数次濒临压力和焦虑极限的体验&#xff0c;更是技术的练兵场。如今双11对蚂蚁金服而言&#xff0…

IntelliJ IDEA 2020 快捷键私人订制

文章目录一、 快捷键总览二、 快捷键风格三、 自定义快捷键3.1. 全局替换3.2. 查找和替换3.3. 文件重命名一、 快捷键总览 快捷键说明关键词CTRLALTT光标定位到这段代码&#xff0c;常用的函数如try等等按2下Shirft瞬间查找文件夹或者文件CtrlAltS打开设置SettingsAlt/自动提示…

防水耐脏,超大容量双肩包,限时拼团仅需49元

男人出门有三宝&#xff0c;钱包、手机和电脑。自从有了支付宝&#xff0c;大家钱包都懒得带了但是电脑&#xff0c;尤其是作为一位007的程序员电脑就是我们的命&#xff0c;上班下班都得带着有时上班可能还要再配一个耳机或者保温杯。能放下这么多的东西又美观的只有双肩包。那…

阿里开源首个深度学习框架 X-Deep Learning!

刚刚&#xff0c;阿里妈妈正式对外发布了X-Deep Learning(下文简称XDL)的开源代码地址&#xff0c;开发者们可以在Github上自主下载。 此前&#xff0c;在11月底&#xff0c;阿里妈妈就公布了这项开源计划&#xff0c;引来了业界的广泛关注。XDL突破了现有深度学习开源框架大都…

离职阿里三年后,他又回来了

11月22日&#xff0c;马辉从黄龙体育中心附近的办公室开车来到阿里园区北2门&#xff0c;离开阿里三年后&#xff0c;马辉和1000多名已经毕业的“校友”又回到了这个梦想启程的地方。 在校友会现场&#xff0c;马辉分享了自己的公益故事。 1991年&#xff0c;大眼睛女孩苏明娟…

腾讯花85亿买岛;微信发原图或泄露位置信息?高通逼因特尔把Modem芯片业务卖给苹果?小米9官网正式下架……...

关注并标星星CSDN云计算 速递、最新、绝对有料。这里有企业新动、这里有业界要闻&#xff0c;打起十二分精神&#xff0c;紧跟fashion你可以的&#xff01;每周两次&#xff0c;打卡即read更快、更全了解泛云圈精彩newsgo go goFujifilm为X-T3增添机械云台功摄模块&#xff08;…

云栖专辑 | 阿里开发者们的第4个感悟:自驱是最好的进步方式

2015年12月20日&#xff0c;云栖社区上线。2018年12月20日&#xff0c;云栖社区3岁。 阿里巴巴常说“晴天修屋顶”。 在我们看来&#xff0c;寒冬中&#xff0c;最值得投资的是学习&#xff0c;是增厚的知识储备。 所以社区特别制作了这个专辑——分享给开发者们20个弥足珍贵的…

【建议珍藏系列】如果你这样回答「什么是线程安全」,面试官都会对你刮目相看!...

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 陈树义责编 | 阿秃不是线程的安全面试官问&#xff1a;“什么是线程安全”&#xff0c;如果你不能很好的回答&#xff0c;那就请往下看吧。论语中有句话叫“学而优则仕”&#xff0c;相信很多人都觉得是“学习好了可以做官”…

阿里开发者们的第5个感悟:听话,出活

2015年12月20日&#xff0c;云栖社区上线。2018年12月20日&#xff0c;云栖社区3岁。 阿里巴巴常说“晴天修屋顶”。 在我们看来&#xff0c;寒冬中&#xff0c;最值得投资的是学习&#xff0c;是增厚的知识储备。 所以社区特别制作了这个专辑——分享给开发者们20个弥足珍贵的…

bash: vue: command not found

安装Vuecli正常 npm install -g vue/cli查看vue版本&#xff0c;抛出bash: vue: command not found vue --version解决方案1&#xff1a; 在这个目录下面执行命令正常&#xff0c; 那就配置环境变量即可

机器学习与数据科学决策树指南

还在为如何抉择而感到纠结吗&#xff1f;快采用决策树&#xff08;Decision Tree&#xff09;算法帮你做出决定吧。决策树是一类非常强大的机器学习模型&#xff0c;具有高度可解释的同时&#xff0c;在许多任务中也有很高的精度。决策树在机器学习模型领域的特殊之处在于其信息…

腾讯安全全面出击:双十一不该成为黑产的狂欢

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 刘丹出品 | CSDN云计算&#xff08;ID&#xff1a;CSDNcloud&#xff09;根据CNCERT/CC国家互联网应急中心资料报告显示&#xff1a;中国遭受DDoS攻击仅次于美国排名第二&#xff0c;在遭受攻击的行业中&#xff0c;电子商务…