【Elasticsearch】实现分布式系统日志高效追踪

🧑 博主简介:CSDN博客专家历代文学网(PC端可以访问:https://literature.sinhy.com/#/literature?__c=1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,精通Java编程高并发设计Springboot和微服务,熟悉LinuxESXI虚拟化以及云原生Docker和K8s,热衷于探索科技的边界,并将理论知识转化为实际应用。保持对新技术的好奇心,乐于分享所学,希望通过我的实践经历和见解,启发他人的创新思维。在这里,我希望能与志同道合的朋友交流探讨,共同进步,一起在技术的世界里不断学习成长。
技术合作请加本人wx(注明来自csdn):foreast_sea

在这里插入图片描述


在这里插入图片描述

【Elasticsearch】实现分布式系统日志高效追踪

一、引言

在当今的技术领域,大型分布式系统,尤其是微服务架构,已经成为构建复杂应用的主流方式。这些分布式系统由众多的微服务组成,它们相互协作以提供完整的业务功能。例如,在一个电商平台中,下单服务支付服务库存服务等多个微服务共同运作,才能完成一个订单从创建到完成支付的全过程。

然而,随着系统规模的扩大和微服务数量的增加,日志管理和问题排查变得极为复杂。当出现故障或性能问题时,开发人员往往需要在海量的日志信息中寻找线索,这些日志分散在不同的服务实例和服务器上,难以关联和整合。传统的日志分析方法在面对这种分布式环境时显得力不从心。

Elasticsearch 的出现为解决分布式系统日志追踪问题提供了强大的解决方案。它是一个分布式高可用可扩展的搜索引擎和数据分析引擎。通过合理地利用 Elasticsearch数据类型索引结构,我们能够有效地存储和检索分布式系统中的日志数据,进而实现跨服务的请求日志追踪,将分散的日志信息整合为完整的用户请求链路。这不仅有助于快速定位问题,还能为系统性能优化和业务流程分析提供有力支持。

在本文中,我们将深入探讨如何使用 Elasticsearch 来实现分布式系统日志追踪,详细介绍相关的技术细节和代码实现。

二、技术概述

(一)Elasticsearch 简介

Elasticsearch 是一个基于Lucene 库构建的开源搜索引擎。它具有分布式实时性高可用性等特点,能够快速地存储、搜索和分析大量的数据。在日志分析领域,Elasticsearch 可以高效地处理和索引日志数据,使得我们能够快速地查询和检索特定的日志信息。

(二)关键数据类型

  1. Keyword:用于精确匹配的字符串数据类型。在日志追踪中,例如服务名称、日志级别等字段可以使用 Keyword 类型,这样可以确保精确的查询和过滤。例如,当我们查询特定服务的日志时,使用 Keyword 类型的服务名称字段可以准确地定位到相关日志。
  2. Text:用于存储较长的文本数据,如日志消息内容。它会对文本进行分词处理,以便进行全文搜索。例如,当我们想要搜索日志消息中包含特定关键词的日志时,Text 类型的字段就可以发挥作用。
  3. Date:用于存储日期和时间信息。在日志数据中,日志的产生时间通常是一个重要的字段,使用 Date 类型可以方便地进行基于时间范围的查询,比如查询特定时间段内的日志。

(三)索引结构

我们可以设计一个专门用于存储日志数据的索引。索引的结构可以包含以下字段:

  • traceId:用于唯一标识一个用户请求链路的 ID。通过这个 ID,我们可以将不同服务中的相关日志关联起来。
  • serviceName:产生日志的服务名称,使用 Keyword 类型。
  • logLevel:日志的级别,如 INFO、WARN、ERROR 等,使用 Keyword 类型。
  • logMessage:日志的详细消息内容,使用 Text 类型。
  • timestamp:日志产生的时间,使用 Date 类型。

三、Maven 依赖

在使用 Elasticsearch 进行日志追踪的 Java 项目中,我们需要添加以下 Maven 依赖:

<dependency><groupId>org.elasticsearch.client</groupId><artifactId>elasticsearch-rest-high-level-client</artifactId><version>7.17.0</version>
</dependency>
<dependency><groupId>org.elasticsearch</groupId><artifactId>elasticsearch</artifactId><version>7.17.0</version>
</dependency>

这些依赖将使我们能够在 Java 代码中方便地与 Elasticsearch 进行交互,使用其提供的高级客户端 API 来进行索引创建、数据插入、查询等操作。

四、案例实现步骤

(一)连接到 Elasticsearch

首先,我们需要创建一个连接到 Elasticsearch 的客户端。代码示例如下:

import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.client.RestClient;
import java.io.IOException;public class ElasticsearchClientUtil {private static final String HOST = "localhost"; // Elasticsearch 主机地址private static final int PORT = 9200; // Elasticsearch 端口public static RestHighLevelClient getClient() {RestClient.Builder builder = RestClient.builder(new HttpHost(HOST, PORT, "http"));return new RestHighLevelClient(builder);}public static void closeClient(RestHighLevelClient client) throws IOException {client.close();}
}

在上述代码中,我们定义了一个工具类 ElasticsearchClientUtil,其中 getClient 方法用于创建一个连接到本地 Elasticsearch 实例(地址为 localhost,端口为 9200)的 RestHighLevelClient 对象,closeClient 方法用于关闭客户端连接。

(二)创建索引

接下来,我们创建用于存储日志数据的索引。代码如下:

import org.elasticsearch.action.admin.indices.create.CreateIndexRequest;
import org.elasticsearch.action.admin.indices.create.CreateIndexResponse;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.common.settings.Settings;
import org.elasticsearch.common.xcontent.XContentType;
import java.io.IOException;public class LogIndexCreator {private static final String INDEX_NAME = "log_tracking_index";public static void createIndex(RestHighLevelClient client) throws IOException {// 创建索引请求CreateIndexRequest request = new CreateIndexRequest(INDEX_NAME);// 设置索引的设置request.settings(Settings.builder().put("index.number_of_shards", 3).put("index.number_of_replicas", 1));// 设置索引的映射(即字段类型等)String mapping = "{\n" +"  \"properties\": {\n" +"    \"traceId\": {\n" +"      \"type\": \"keyword\"\n" +"    },\n" +"    \"serviceName\": {\n" +"      \"type\": \"keyword\"\n" +"    },\n" +"    \"logLevel\": {\n" +"      \"type\": \"keyword\"\n" +"    },\n" +"    \"logMessage\": {\n" +"      \"type\": \"text\"\n" +"    },\n" +"    \"timestamp\": {\n" +"      \"type\": \"date\"\n" +"    }\n" +"  }\n" +"}";request.mapping(mapping, XContentType.JSON);// 执行创建索引操作CreateIndexResponse response = client.indices().create(request);if (response.isAcknowledged()) {System.out.println("索引创建成功");} else {System.out.println("索引创建失败");}}
}

在这段代码中,我们首先定义了索引名称 log_tracking_index,然后创建了 CreateIndexRequest 对象,设置了索引的分片数量和副本数量,并定义了索引的映射,即各个字段的类型。最后通过客户端执行创建索引操作,并根据响应判断索引是否创建成功。

(三)插入日志数据

假设我们有一个日志数据对象 LogMessage,包含 traceIdserviceNamelogLevellogMessagetimestamp 等属性。我们可以编写以下代码将日志数据插入到 Elasticsearch 索引中:

import org.elasticsearch.action.index.IndexRequest;
import org.elasticsearch.action.index.IndexResponse;
import org.elasticsearch.client.RestHighLevelClient;
import java.io.IOException;
import java.util.Date;public class LogDataInserter {public static void insertLog(RestHighLevelClient client, LogMessage logMessage) throws IOException {// 创建索引请求IndexRequest request = new IndexRequest("log_tracking_index").id(logMessage.getTraceId()).source("traceId", logMessage.getTraceId(),"serviceName", logMessage.getServiceName(),"logLevel", logMessage.getLogLevel(),"logMessage", logMessage.getLogMessage(),"timestamp", new Date());// 执行插入操作IndexResponse response = client.index(request);if (response.getResult() == DocWriteResponse.Result.CREATED) {System.out.println("日志插入成功");} else {System.out.println("日志插入失败");}}
}

这里,我们创建了 IndexRequest 对象,指定了索引名称和文档 ID(这里使用 traceId 作为文档 ID,以确保同一请求链路的日志可以通过相同的 ID 进行关联),并设置了文档的源数据,即日志的各个字段值。然后通过客户端执行插入操作,并根据响应判断插入是否成功。

(四)查询日志数据

为了实现日志追踪,我们需要根据 traceId 或其他条件查询相关的日志数据。以下是一个根据 traceId 查询日志的示例代码:

import org.elasticsearch.action.search.SearchRequest;
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.search.SearchHit;
import org.elasticsearch.search.builder.SearchSourceBuilder;
import java.io.IOException;public class LogDataSearcher {public static void searchLogsByTraceId(RestHighLevelClient client, String traceId) throws IOException {// 创建搜索请求SearchRequest request = new SearchRequest("log_tracking_index");// 创建搜索源构建器SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();// 设置查询条件,根据 traceId 进行精确匹配sourceBuilder.query(QueryBuilders.termQuery("traceId", traceId));request.source(sourceBuilder);// 执行搜索操作SearchResponse response = client.search(request);// 处理搜索结果for (SearchHit hit : response.getHits().getHits()) {System.out.println("traceId: " + hit.getSourceAsMap().get("traceId"));System.out.println("serviceName: " + hit.getSourceAsMap().get("serviceName"));System.out.println("logLevel: " + hit.getSourceAsMap().get("logLevel"));System.out.println("logMessage: " + hit.getSourceAsMap().get("logMessage"));System.out.println("timestamp: " + hit.getSourceAsMap().get("timestamp"));}}
}

在上述代码中,我们创建了 SearchRequest 对象,指定了要搜索的索引名称。然后使用 SearchSourceBuilder 构建查询条件,这里使用 termQuerytraceId 进行精确匹配。最后执行搜索操作,并遍历搜索结果,打印出每个匹配日志的相关信息。

五、单元测试

我们可以编写以下单元测试来验证上述代码的正确性:

import org.elasticsearch.client.RestHighLevelClient;
import org.junit.jupiter.api.AfterEach;
import org.junit.jupiter.api.BeforeEach;
import org.junit.jupiter.api.Test;import java.io.IOException;
import java.util.Date;import static org.junit.jupiter.api.Assertions.assertTrue;public class LogTrackingTest {private RestHighLevelClient client;@BeforeEachpublic void setUp() {client = ElasticsearchClientUtil.getClient();}@Testpublic void testLogTracking() throws IOException {// 创建索引LogIndexCreator.createIndex(client);// 插入日志数据LogMessage logMessage = new LogMessage("trace1", "order-service", "INFO", "订单创建成功", new Date());LogDataInserter.insertLog(client, logMessage);// 查询日志数据LogDataSearcher.searchLogsByTraceId(client, "trace1");// 这里可以根据实际情况添加更多的断言,例如验证查询结果的数量等assertTrue(true);}@AfterEachpublic void tearDown() throws IOException {ElasticsearchClientUtil.closeClient(client);}
}

在这个单元测试中,我们首先在 setUp 方法中获取 Elasticsearch 客户端连接。然后在 testLogTracking 方法中,依次进行索引创建、日志插入和日志查询操作。最后在 tearDown 方法中关闭客户端连接。这里我们简单地使用 assertTrue(true) 作为一个占位符,可以根据实际需求添加更详细的断言,比如验证查询到的日志数据是否与插入的数据一致,或者验证查询结果的数量是否符合预期等。

六、参考资料文献

  • Elasticsearch 官方文档https://www.elasticsearch.org/guide/index.html
  • Elasticsearch 实战》,作者:[美] 拉法尔·库奇Rafał Kuć)等,机械工业出版社。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/888453.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

FoldX(FoldX5)的安装流程

下载地址:官网 https://foldxsuite.crg.eu/] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] zip解压yasaraPlugin.zip 我将foldx_20241231改为foldx vim ~/.bashrc 将foldx文件所在路径写进PATH vim ~/.bashrc我的…

利用红黑树封装map,和set,实现主要功能

如果不知道红黑树是什么的时候可以去看看这个红黑树 思路 首先我们可以把封装分为两个层面理解&#xff0c;上层代码就是set,和map&#xff0c;底层就是红黑树 就相当于根据红黑树上面套了两个map,set的壳子&#xff0c;像下面这张图一样 对于map和set&#xff0c;map里面存…

分类算法中的样本不平衡问题及其解决方案

一、样本不平衡问题概述 在机器学习的分类任务中&#xff0c;样本不平衡是指不同类别训练样本数量存在显著差异的现象。这一差异会给模型训练和性能评估带来挑战&#xff0c;尤其在处理少数类样本时&#xff0c;模型可能难以有效学习其特征。 以二分类为例&#xff0c;理想情况…

通过HTML Canvas 在图片上绘制文字

目录 前言 一、HTML Canvas 简介 二、准备工作 三、绘制图片 四、绘制文字 五、完整代码 效果演示&#xff1a; 前言 HTML canvas 为我们提供了无限的创意可能性。今天&#xff0c;我们就来探索一下如何通过 HTML canvas 将图片和文字绘制到图片上&#xff0c;创造出独特…

MBox20边缘计算网关:氢能车间数据采集的智慧引擎

氢能作为未来能源体系的重要组成部分&#xff0c;其安全、高效、环保的特性备受瞩目。在氢能车间的日常运营中&#xff0c;数据采集是确保生产流程优化、设备稳定运行及能效提升的关键环节。然而&#xff0c;面对氢能车间复杂多变的生产环境和海量数据&#xff0c;如何实现高效…

linux环境GitLab服务部署安装及使用

一、GitLab介绍 GitLab是利用Ruby onRails一个开源的版本管理系统&#xff0c;实现一个自托管的Git项目仓库&#xff0c;可通过Web界面进行访问公开的或者私人项目。 二、GitLab安装 1、先安装相关依赖 yum -y install policycoreutils openssh-server openssh-clients postf…

Gartner报告解读(四)| 如何运用上升期的基础设施自动化(IA)为企业数字化转型赋能?

近期&#xff0c;Gartner发布的《2024年中国基础设施战略技术成熟度曲线》显示&#xff0c;未来5-10年&#xff0c;大量具有颠覆性或较高影响力的创新技术可能会实现主流采用&#xff0c;其中就包括基础设施自动化&#xff08;IA&#xff09;。 基础设施自动化Gartner评估情况 …

请求响应:常见参数接收及封装(Json参数及路径参数)

Json参数 Json格式的数据具有轻量级、易于阅读和编写、易于解析等诸多优点。在前后端交互时&#xff0c;大部分情况下请求体中的数据会以JSON格式进行传递。前端的请求在请求体中携带了Json格式数据&#xff0c;后端程序需要对其进行解析并封装使用&#xff0c;而接收Json参数…

大舍传媒-关于海外媒体宣发的探讨

关于海外媒体宣发的探讨 一、海外媒体宣发的重要性 在当今全球化的时代&#xff0c;海外媒体宣发对于企业、组织和个人来说具有至关重要的意义。通过有效的海外媒体宣发&#xff0c;可以提升品牌知名度&#xff0c;拓展国际市场&#xff0c;增强影响力&#xff0c;吸引更多的潜…

项目开发之Jenkins

文章目录 思考基础概述JenkinsMavenGit集成开发部署GitLab服务 实战1 新建任务需要的配置pipeline最后 思考 jenkis怎么连接github仓库&#xff1f; jenkis的作用是什么&#xff1f;基础 概述 定义&#xff1a;Jenkins是一款开源的持续集成(Continuous Integration&#xff…

在VSCode中搭建Python开发环境

在VSCode中搭建Python开发环境 1、安装 首先确保电脑已经安装好Python和VSCode。 2、安装VSCode的Python插件 3、选择python解释器 ctrlshiftP打开VSCode的命令行&#xff0c;输入python: select Interpreter选择合适的python版本。 4、运行代码 在windows下你可以直接使用…

Windows 11 如何配置node.js

一&#xff0c;官网下载 官网首页 下载最新LTS版本&#xff0c;比较稳定&#xff0c;如果想探索更新的版本去探索新的nodejs功能。 1. 下载完成后&#xff0c;双击运行程序&#xff0c;点击next 2. 勾选接受协议&#xff0c;点击next 3. 选择自己的安装路径&#xff08;默认是…

1-12 GD32基于定时器输入捕获

前言&#xff1a; 基于本人对相关知识回顾与思考&#xff0c;仅供学习参考 目录 前言&#xff1a; 1.0 输入捕获 2.0 信号周期 3.0 定时器配置 4.0 定时器配置 5.0 定时器中断 后记&#xff1a; 1.0 输入捕获 2.0 信号周期 获取信号周期的方法&#xff0c;在第一次捕获与…

大数据新视界 -- Hive 元数据管理:核心元数据的深度解析(上)(27 / 30)

&#x1f496;&#x1f496;&#x1f496;亲爱的朋友们&#xff0c;热烈欢迎你们来到 青云交的博客&#xff01;能与你们在此邂逅&#xff0c;我满心欢喜&#xff0c;深感无比荣幸。在这个瞬息万变的时代&#xff0c;我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…

合合信息智能图像处理技术,让你的设备更智能

目录 图像增强技术主要包括以下几个方面&#xff1a; 最近和一位朋友聊天&#xff0c;听到一些关于打印机的吐槽。 从20年开始&#xff0c;部分或者全部远程办公的企业渐渐多起来&#xff0c;wfh的打工人也在家添置了简易的必要办公设备&#xff0c;比如打印机。 在家用&…

基于Transformer的编码器-解码器图像描述模型在AMD GPU上的应用

Transformer based Encoder-Decoder models for image-captioning on AMD GPUs — ROCm Blogs 图像描述&#xff0c;即基于生成式人工智能&#xff08;GenAI&#xff09;自动生成简洁的图像文本描述&#xff0c;在现实世界中有着非常重要的应用。例如&#xff0c;图像描述可以为…

【从0带做】基于Springboot3+Vue3的场馆预约系统

大家好&#xff0c;我是武哥&#xff0c;最近给大家手撸了一个基于SpringBoot3Vue3的场馆预约系统&#xff0c;可用于毕业设计、课程设计、练手学习&#xff0c;系统全部原创&#xff0c;如有遇到网上抄袭站长的&#xff0c;欢迎联系博主~ 项目演示视频和教程视频 https://ww…

unity与android拓展

一.AndroidStudio打包 1.通过Unity导出Android Studio能够打开的工程 步骤 1.设置导出基本信息&#xff1a;公司名、游戏名、图标、包名等关键信息 2.在File——>Build Settings中&#xff0c;勾选 Export Project 选项 3.点击Export 导出按钮 2.在Android Studio中打开Un…

计算机网络期末复习-part1-概述

1、互联网的组成 互联网由两大块组成。 1、边沿部分&#xff1a;由所有连接在互联网上的主机组成&#xff0c;是用户直接使用的部分。 2、核心部分&#xff0c;由大量网络和路由器组成&#xff0c;为边缘部分提供服务。 2、数据传送阶段的三种交换方式的主要特点 1、电路交…

matlab中disp,fprintf,sprintf,display,dlmwrite输出函数之间的区别

下面是他们之间的区别&#xff1a; disp函数与fprintf函数的区别 输出格式的灵活性 disp函数&#xff1a;输出格式相对固定。它会自动将变量以一种比较直接的方式显示出来。对于数组&#xff0c;会按照行列形式展示&#xff1b;对于字符串&#xff0c;直接原样输出并换行。例如…