K8s 搭建 FileBeat+ELK 分布式日志收集系统以及 KQL 语法介绍

一、K8s FileBeat + ELK 介绍

ELK，即Elasticsearch、Logstash和Kibana三个开源软件的组合，是由Elastic公司提供的一套完整的日志管理解决方案。Elasticsearch是一个高度可扩展的开源全文搜索和分析引擎，它允许你快速地、近乎实时地存储、搜索和分析大量数据。Logstash是一个服务器端数据处理管道，它能够同时从多个来源采集数据，转换数据，然后将数据发送到诸如Elasticsearch等存储库中。Kibana则允许你通过Elasticsearch使用图表和表格直观地展示数据。

ELK主要解决了如何有效地收集、处理、存储和可视化大量的日志数据。优势在于它能够处理和分析大量的日志数据，提供实时的搜索和分析能力，同时它的分布式设计使其具有很高的扩展性。但劣势在于它的配置和维护相对复杂，特别是Logstash，需要编写复杂的配置文件，对系统资源的要求也相对较高。

然而，直接使用ELK栈在数据收集方面可能存在一些问题。例如，Logstash是一个重量级的工具，它在数据收集过程中可能会消耗大量的系统资源，这对于资源有限的环境来说可能是一个问题。此外，Logstash的配置也相对复杂，需要编写大量的配置文件，这对于一些简单的日志收集任务来说可能显得过于繁琐。

为了解决这些问题，Elastic公司推出了Filebeat。Filebeat是一个轻量级的日志传输工具，它可以安装在需要收集日志的服务器上，实时读取日志文件，并将这些日志数据发送到指定的输出，如Logstash、Elasticsearch、kafka。它的优势在于轻量级设计，对系统资源的消耗极低，同时它的配置也相对简单，易于管理和维护。通过接入Filebeat，可以有效地解决Logstash在数据收集方面的问题，提高整个ELK栈的性能和稳定性。

在这里插入图片描述

K8s 环境中的 ELK

随着 k8s 的越来越普及化，很多应用都被部署在了 k8s 中，如何在 k8s 中进行 ELK 日志管理呢？首先要搞清楚 k8s 中的日志都存在了哪里，可以主要从下面三个目录入手：

/var/lib/docker/containers/ ：是Docker守护进程用于存储容器元数据和日志数据的地方。每个容器的日志文件通常以<container_ID>-json.log的形式存储在这个目录下的相应子目录中。这些日志文件包含了容器的stdout和stderr输出，并且是以JSON格式存储的。Filebeat可以直接读取这些文件来收集容器的日志。
/var/log/containers/ ：是k8s为了便于日志管理而创建的符号链接（symlink）目录。它包含了到/var/lib/docker/containers/目录中日志文件的链接。每个符号链接的名称通常是由Pod名称、容器名称和实例编号组成的。Filebeat可以通过这个目录轻松地访问和收集容器的日志，而不需要直接访问Docker的内部目录。
/var/log/pods/ ：是 K8s 用于存储Pod日志的地方。每个Pod都会在这个目录下有一个以Pod UID命名的子目录，Pod内的每个容器又有各自以容器名称命名的日志文件。这些日志文件包含了容器的stdout和stderr输出，但是它们是以文本格式而不是JSON格式存储的。这个目录的结构有助于保持Pod和容器日志的隔离性，便于管理和访问。

因此我们可以主要从 /var/log/containers/ 目录入手，Filebeat 以 DaemonSet的方式部署在k8s集群中。DaemonSet可以确保每个节点上都有一个Filebeat实例在运行，通过读取宿主机上的日志文件来收集k8s的日志。

在 Filebeat 中已经内置了 k8s 的支持，我们可以通过配置 processors.add_kubernetes_metadata 来增强日志数据，将Kubernetes的元数据添加到日志事件中，比如Pod名称、Namespace、容器名称等：

  processors:- add_kubernetes_metadata:default_indexers.enabled: truedefault_matchers.enabled: truematchers:- logs_path:logs_path: "/var/log/containers/"

当数据发送给到 logstash 时，直接可以通过 [kubernetes][namespace] 或 [kubernetes][container][name] 获取到 k8s 中的元数据信息，因此可以利用 logstash 动态创建不同应用的动态日志索引，针对每个命名空间下不同的应用创建单独的索引记录日志，这样更便于后期对日志的排查。例如 logstash.conf 可以这样配置：

output { if [kubernetes][namespace] and [kubernetes][container][name] {elasticsearch { hosts => ["http://elasticsearch:9200"] index => "k8s-%{[kubernetes][namespace]}-%{[kubernetes][container][name]}-%{+YYYY.MM.dd}"}} else {elasticsearch { hosts => ["http://elasticsearch:9200"] index => "k8s-%{+YYYY.MM.dd}"}}
}

下面开始实践在 k8s 中部署 FileBeat+ELK 分布式日志系统，实验采用版本均为 7.14.0 。

创建命名空间

这里首先创建一个命名空间，后续所有操作均在该空间下：

kubectl create ns elk

创建测试服务

在开始前这里创建一个 SpringBoot 项目，项目名称为 elk-demo ，用来打印不同级别的日志，用来验证是否能被收集，以及收集的索引是否动态创建。

创建测试接口：

@Slf4j
@RestController
public class TestController {@GetMapping("/t1")public void t1() {log.info("this is test, level: info");log.warn("this is test, level: warn");log.debug("this is test, level: debug");log.error("this is test, level: err", new RuntimeException("Err detail!"));}}

编写 Dockerfile 文件：

FROM java:8
MAINTAINER bxc
WORKDIR /app
ENV TZ=Asia/Shanghai
ADD target/elk-demo-0.0.1-SNAPSHOT.jar /app/app.jar
CMD ["java", "-jar", "app.jar"]

构建镜像并上传至私服 harbor 中，如果没有 harbor 仓库也可以将镜像上传至每个 k8s node 节点中，然后使用 docker load 到本地镜像仓库中。

# 打包成 jar 包
mvn clean package
# 构建镜像
cd elk-demo
docker build -t elk-demo:1.0 .
# 上传至 harbor
docker tag elk-demo:1.0 11.0.1.150/image/elk-demo:1.0 .
docker push 11.0.1.150/image/elk-demo:1.0

k8s 部署测试服务

vi elk-demo.yml

apiVersion: v1
kind: Service
metadata:name: elk-demonamespace: elklabels:app: elk-demo
spec:type: NodePortports:- port: 8080name: clientnodePort: 31880targetPort: 8080selector:app: elk-demo---
apiVersion: apps/v1
kind: Deployment
metadata:name: elk-demonamespace: elk
spec:replicas: 3selector:matchLabels:app: elk-demotemplate:metadata:labels:app: elk-demospec:containers:- name: elk-demoimage: elk-demo:1.0ports:- containerPort: 8080name: serverenv:- name: TZvalue: Asia/Shanghai

kubectl apply -f elk-demo.yml

二、K8s 部署 FileBeat+ELK

2.1 部署 ES 集群和 Kibana

ES 集群和 kibana 的部署过程可以参考下面这篇文章：

K8s 部署 elasticsearch-7.14.0 集群及 kibana 客户端

这里我 ES 的 Service 名称为 elasticsearch ，所以后面 ES 的访问地址可以写成：http://elasticsearch:9200

2.2 部署 logstach

vi logstach.yml

apiVersion: v1 
kind: Service
metadata: name: logstashnamespace: elklabels:app: logstash
spec: ports: - port: 5044name: logstash  targetPort: 5044    selector: app: logstash type: ClusterIP--- 
apiVersion: v1 
kind: ConfigMap 
metadata: name: logstash-conf namespace: elk
data: logstash.conf: |- input {beats { port => 5044 } } filter {grok {match => { "message" => "(%{TIMESTAMP_ISO8601:logdatetime}  %{LOGLEVEL:level} %{GREEDYDATA:logmessage})|%{GREEDYDATA:logmessage}" }remove_field => [ "logmessage" ]}}output { if [kubernetes][namespace] and [kubernetes][container][name] {elasticsearch { hosts => ["http://elasticsearch:9200"] index => "k8s-%{[kubernetes][namespace]}-%{[kubernetes][container][name]}-%{+YYYY.MM.dd}"}} else {elasticsearch { hosts => ["http://elasticsearch:9200"] index => "k8s-%{+YYYY.MM.dd}"}}} ---
apiVersion: v1 
kind: ConfigMap 
metadata: name: logstash-yml namespace: elk labels: type: logstash 
data: logstash.yml: |-http.host: "0.0.0.0"xpack.monitoring.elasticsearch.hosts: http://elasticsearch:9200---
apiVersion: apps/v1 
kind: Deployment
metadata:name: logstash namespace: elk
spec: selector: matchLabels: app: logstash template: metadata: labels: app: logstash spec: containers: - image: elastic/logstash:7.14.0name: logstash ports: - containerPort: 5044 name: logstash command: - logstash - '-f' - '/usr/share/logstash/config/logstash.conf' volumeMounts: - name: config-volume mountPath: /usr/share/logstash/config/logstash.confsubPath: logstash.conf- name: config-yml-volume mountPath: /usr/share/logstash/config/logstash.ymlsubPath: logstash.ymlresources:limits: cpu: 1000m memory: 2048Mi requests: cpu: 512m memory: 128Mi volumes: - name: config-volume configMap: name: logstash-conf - name: config-yml-volume configMap: name: logstash-yml

kubectl apply -f logstach.yml

查看启动 pod：

kubectl get pods -n elk

在这里插入图片描述

观察 logstash 日志，是否启动成功：

kubectl logs -f logstash-84d8d7cd55-rcfgs -n elk

在这里插入图片描述

2.3 部署 filebeta

注意，由于 filebeta 需要获取 k8s 中的信息，这里需要创建 ServiceAccount 并授权获取信息的权限。

vi filebeta.yml

apiVersion: v1 
kind: ServiceAccount
metadata: name: filebeat-accountnamespace: elklabels: app: filebeat
--- 
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole 
metadata: name: filebeat-crlabels: app: filebeat 
rules: 
- apiGroups: [""] resources: - namespaces - pods - nodesverbs: ["get", "watch", "list"]
--- 
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding 
metadata: name: filebeat-crb
subjects: 
- kind: ServiceAccount name: filebeat-account namespace: elk 
roleRef: kind: ClusterRole name: filebeat-cr apiGroup: rbac.authorization.k8s.io ---
apiVersion: v1 
kind: ConfigMap 
metadata: name: filebeat-config namespace: elk
data: filebeat.yml: |- filebeat.inputs: - type: container enable: true paths: - /var/log/containers/*.log multiline: pattern: '^\d{4}-\d{1,2}-\d{1,2}'negate: truematch: aftermax_lines: 100timeout: 5sprocessors:- add_kubernetes_metadata:default_indexers.enabled: truedefault_matchers.enabled: truematchers:- logs_path:logs_path: "/var/log/containers/"output.logstash:  hosts: ["logstash:5044"] enabled: true #output.kafka:  # 输出到 kafka 示例#  hosts: ["kafka-01:9092", "kafka-02:9092", "kafka-03:9092"] #  topic: 'topic-log' #  version: 2.0.0 
--- 
apiVersion: apps/v1 
kind: DaemonSet  
metadata: name: filebeat namespace: elklabels: app: filebeat 
spec: selector: matchLabels: app: filebeat template: metadata: labels: app: filebeat spec: serviceAccountName: filebeat-accountcontainers: - name: filebeat image: elastic/filebeat:7.14.0args: [ "-c", "/etc/filebeat.yml", "-e", "-httpprof","0.0.0.0:6060" ] securityContext: runAsUser: 0 # If using Red Hat OpenShift uncomment this: #privileged: true resources: limits: memory: 1000Mi cpu: 1000m requests: memory: 100Mi cpu: 128m volumeMounts: - name: filebeat-config  mountPath: /etc/filebeat.yml subPath: filebeat.yml - name: filebeat-datamountPath: /usr/share/filebeat/data - name: docker-containers mountPath: /var/lib/docker/containersreadOnly: true - name: pods-logmountPath: /var/log/pods readOnly: true - name: containers-logmountPath: /var/log/containersreadOnly: true volumes: - name: filebeat-config configMap: name: filebeat-config - name: filebeat-data hostPath: path: /data/filebeat-data type: DirectoryOrCreate - name: docker-containers hostPath: path: /var/lib/docker/containers- name: pods-log hostPath: path: /var/log/pods- name: containers-log hostPath: path: /var/log/containers

kubectl apply -f filebeta.yml

查看 Pod：

在这里插入图片描述
由于我测试环境的 k8s node 有三台，所以这里起了三个 filebeat。

观察其中某个 filebeta 日志，是否启动成功：
在这里插入图片描述

三、ELK 环境测试

访问测试服务，产生日志：http://{k8s node ip}:31880/t1 。

然后查询当下所有 k8s 开头的索引：

GET /_cat/indices/k8s*?h=index

在这里插入图片描述

可以看到测试服务的索引已经生成。

3.1 kibana 日志查询

点击侧边栏 Discover ：
然后在 Index patterns 下 Create an index pattern ：
这里输入测试服务的索引 k8s-elk-elk-demo-2024.05.17 ，注意改成你环境下的名字，然后点击 Next step :
然后时间字段可以选择 @timestamp :
然后再次点击侧边栏 Discover 进到查询页面，使用介绍如下：
例如查询包含 ERROR 的日志：

这里的 KQL 语法，在文章最后给了出常用语法说明。

3.2 kibana 日志监测

点击侧边栏 logs ：
点击修改配置：
增加 k8s-* 的监测，然后点击最后的 Apply：

在这里插入图片描述

然后在 Stream 中可以查看日志：

3.3 kibana 使用 ES DSL 查询日志

查询错误日志：

GET /k8s-elk-elk-demo-2024.05.17/_search
{"query": {"match": {"message": "java.lang.RuntimeException"}},"sort": [{"@timestamp": {"order": "desc"}}]
}

在这里插入图片描述

四、KQL 语法介绍

KQL（Kibana Query Language）是Kibana中用于搜索和过滤数据的查询语言。它是一种简单的、易于学习的语法，允许用户在不熟悉Elasticsearch的复杂查询DSL的情况下，也能够执行有效的数据搜索和过滤操作。

注意：KQL默认是大小写不敏感的。

4.1 关键字查询

例如：查询 message 字段中包括 hello word 的：

message:"hello word"

如果想要分词，可以不加双引号，这样包含 hello 或 word 的也可以被检索出来：

message:hello word

4.2 逻辑查询

支持 or 、and 、not查询，and的优先级高于or：

message:error and kubernetes.pod.name: "elk-demo-6f8b4b7fd7-4xskf"

message:error and (kubernetes.node.hostname:node1 or kubernetes.node.name:node1)

4.3 范围查询

支持对数字和日志类型使用 < <= > >=：

log.offset > 881576

4.4 Wildcard 查询

message:*error*

4.5 字段存在查询

message:*

4.6 字段不存在

not _exists_:level

或者

not level:*