拨开迷雾:利用全链路消息跟踪揭示系统奥秘

在分布式系统,一次外部请求往往需要内部多个模块,多个中间件,多台机器的相互调用才能完成。在这一系列的调用中,可能有些是串行的,而有些是并行的,排查定位非常困难。

全链路消息分析及全链路消息跟踪可以帮助我们解决这个问题。基于全链路消息分析可以通过跟踪消息的完整传递路径,精确定位故障发生的位置和原因,缩小故障范围,并提高故障排查和调试的效率。全链路消息跟踪可以追踪和监控微服务之间的消息传递路径,为项目团队提供服务器节点定位、异常上下文信息收集、服务健康度监控/预警、关键业务逻辑执行过程追溯、业务过程分析、业务环节耗时跟踪预警等便捷的运维手段。

那什么是全链路消息跟踪?

PART.1 揭开全链路消息跟踪的神秘面纱

全链路消息(End-to-End Message),是指在某种业务在一套分布式系统中从发送方到接收方完整传递的、能描述业务全生命周期的消息。它包括了业务在系统中各环节的传递路径、消息内容和相关的上下文信息。全链路消息包含但不限于以下消息范围:

消息主要涵盖以下内容:

  • 消息传递路径:全链路消息跟踪记录消息从发送端到接收端的传递路径,包括经过的各个服务、组件和节点。
  • 消息状态和处理情况:全链路消息跟踪记录每个节点对消息的处理情况,包括成功、失败、异常等状态,以及处理过程中的关键信息和时间戳。
  • 上下文信息:全链路消息跟踪不仅追踪消息本身,还记录与消息相关的上下文信息,如请求参数、响应结果、异常信息等。

为了能够更好地管理和分析全链路消息的传递路径和状态,提供全面的消息监控和分析能力,以便于故障排查、性能优化和系统调试。

抽象链路消息主要包括:

  • 定义消息模型:通过定义消息的结构和属性,将消息抽象成一种可管理和分析的数据模型,使其具备可扩展性和灵活性。目前我们定义的大致有唯一标识、请求消息、响应消息、异常消息、应用节点信息(IP、端口、模块名称)、消息类型、业务类型和业务标识等信息,便于业务异常、系统异常的排查。
  • 唯一标识消息:为每个消息生成唯一标识符,以便跟踪和关联消息在系统中的传递和处理。
  • 标准化消息格式:制定一致的消息格式和协议,使不同组件和服务之间能够理解和解析消息,实现消息的抽象和互操作。

全链路消息跟踪(End-to-End Message Tracing)的目的就是记录和追踪这些消息在系统中的传递过程,以便实现对整个消息传递链路的可视化、监测和分析。

在一个完整的业务操作通常涉及多个服务之间的协作和消息传递,全链路消息可以跨越多个服务、中间件等组件,从发送方经过一系列中间节点,最终到达接收方。通过追踪全链路消息,可以了解消息在系统中的流动和处理过程,包括消息的发送时间、传递路径、中间节点的处理时间等信息。

外部系统进入到系统的时候,通常的日志记录只会到接口层面,即请求前后的出入参以及对应的耗时等。但是在全链路消息跟踪的设计模式下,接口请求的信息只是其中的一部分,还需要记录接口开始后到结束的中间的业务逻辑的消息,当然这个取决于各业务系统的颗粒度。

PART.2 实施全链路消息跟踪的四步骤

步骤一:数据链路分析

  • 确定数据源

首先需要明确业务系统中的数据源,包括输入数据的来源和输出数据的目的地。这可以包括数据库、API接口、消息队列、日志文件等。

  • 识别数据链路

根据业务系统的功能和数据流动情况,识别数据链路的各个环节和组件。这可以通过分析业务流程、系统架构图以及相关文档来进行。

  • 定义数据链路

为每个数据链路环节定义清晰的输入和输出数据,以及数据的转换和处理过程。明确每个环节之间的数据传递方式和规则。

  • 追踪数据流

通过合适的手段和工具,追踪业务系统中的数据流动。可以使用日志记录、消息队列监控、数据库查询等方式来获取数据流的详细信息。

  • 数据链路分析

基于追踪到的数据流信息,进行数据链路分析。这包括确定数据链路中的瓶颈、延迟、错误和数据丢失等问题。通过分析数据链路,可以找出导致问题的环节,并提供相应的优化和改进建议。

步骤二:数据流解析

在全链路消息跟踪中,数据流的跟踪和解析是一个关键步骤,数据流的跟踪通常通过在系统中埋点或拦截关键节点的方式实现。当消息经过这些节点时,会记录相关的信息,如消息的内容、时间戳、发送者和接收者等。这些信息可以被捕获和存储,用于后续的分析和追踪。

目前我们设计模式中有三种方式来进行链路数据的跟踪。

  • 基于日志的实现方法

基于日志的实现方法是消息全链路跟踪的一种常见方式。它通过在每个服务或组件中记录相关的日志信息来实现消息的跟踪和监控。下面是基于日志的实现方法的流程:

基于日志的实现方法相对简单且易于扩展,因为它借助于已经存在的日志记录机制和工具。然而,它也存在一些限制,如日志量的增加、日志传递的开销和跨服务边界的上下文传递等挑战。因此,在实际应用中,通常需要结合其他技术和方法,如注入式跟踪和集成式跟踪系统,来实现更全面和高效的消息全链路跟踪。

  • 基于注入的实现方法

基于注入的实现方法是消息全链路跟踪的另一种常见方式。它通过在消息传递路径上的每个服务或组件中插入代码来实现消息的跟踪和监控。下面是基于注入的实现方法的流程:

基于注入的实现方法具有较高的灵活性和精确度,因为它可以直接在代码中插入跟踪逻辑。然而,它也需要在每个服务或组件中进行修改和注入代码,对现有代码的侵入性较大。此外,注入的实现方法可能需要更多的开发工作和技术支持,以确保正确的跟踪逻辑和数据收集。

  • 基于AOP(面向切面编程)的实现方法

从前面两种实现方式来看,对于现有系统代码的侵入性相对都比较强,对于已经运营的生产系统来说不是最友好的方式,且定制化高,不易于扩展和维护。因此,就有了第三种实现方法——基于AOP的实现消息记录。

AOP通过将横切的信息收集点从业务逻辑中抽象出来,使得信息收集点的实现可以集中在一个地方,提高了代码的模块化和可维护性,减少代码冗余。其次,AOP使得信息收集点的配置和管理更加集中化,可以更方便地管理和修改信息收集点的实现。

基于AOP的实现方法,当然也有它特有的实现步骤:

通过基于AOP的实现方法,可以在关键的方法调用或消息传递上插入跟踪逻辑,实现消息全链路跟踪。这种方法具有较强的灵活性和可扩展性,可以适用于分布式系统。

步骤三:数据存储

在实现全链路消息跟踪时,存储和索引跟踪数据是关键的一步。存储和索引跟踪数据可以帮助实现对消息的快速检索、分析和查询,从而支持故障排查、性能优化和系统监控等任务。以下是采用的数据存储方式:

  • 数据库存储:每个消息可以作为一个记录,包含相关的字段(例如链路追踪标识符、时间戳、消息唯一标识、传递路径等)。使用数据库的查询功能可以对跟踪数据进行灵活的检索和分析。
  • 搜索引擎跟踪:为了支持快速的数据检索和查询,以及报文数据的模糊搜索,可以使用搜索引擎支持复杂数据的查询。我们使用Elasticsearch作为消息详细信息的存储引擎,和数据库存储结合,通过建立索引来加速对跟踪数据的查询。索引可以基于消息的关键字段(如链路追踪标识符、时间戳)进行构建,以便快速地定位和访问跟踪数据。

数据存储除了中间件的选型,还需要将数据存储的过程和业务系统做成解耦,避免降低业务系统正常功能的性能情况。

下图是存储数据的过程:

  • 首先通过埋点采集到数据后,可以将消息以【索引+全量的消息数据】的结构序列化存储到Redis缓存中;
  • 第二步同步把重要索引类信息封装成消息体投入到消息队列中;
  • 然后在消息存储应用中消费消息队列的消息,根据消息中的索引从Redis中获取实际的数据,写入到数据库以及Elastic Search中,完成链路消息的持久化。

步骤四:数据可视化

可视化跟踪数据是实现全链路消息跟踪的关键一步,它可以帮助开发人员和运维人员更直观地理解和分析消息传递的流程和性能。

  • 跟踪数据流程图:使用流程图工具(如Graphviz、Mermaid、AntV G6)可以绘制跟踪数据的流程图,展示消息在系统中的传递路径和中间节点的处理过程。
  • 时间轴和日志视图:通过在时间轴上展示跟踪数据的时间戳和事件顺序,可以更清晰地了解消息的传递顺序和时间间隔。日志视图可以展示每个消息的详细信息,包括消息内容、上下文和处理日志等。
  • 拓扑图和依赖关系图:使用拓扑图工具(如D3.js、Neo4j)可以绘制跟踪数据的拓扑图,展示服务之间的关系和依赖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/26791.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网络编程——深入理解TCP/IP协议——OSI模型和TCP/IP模型:构建网络通信的基石

TCP/IP协议— 一、简介 TCP/IP协议,即传输控制协议/互联网协议,是一组用于在计算机网络中实现通信的协议。它由两个主要的协议组成:TCP(传输控制协议)和IP(互联网协议)。TCP负责确保数据的可靠…

JWT的使用

文章目录 前言一、在yml文件中配置参数二、创建JwtUtil.java三、创建JwtProperties.java四、创建JwtClaimsConstant.java五、创建JwtTokenAdminInterceptor.java六、注册到WebMvcConfiguration1.4.3 ThreadLocal 前言 一、在yml文件中配置参数 sky:jwt:# 设置jwt签名加密时使…

git用法

1、下载git 要么官网下载 https://git-scm.com/downloads 要么intelliJ IDEA或pycharm里下载 2、在IDEA或pycharm里指定git安装路径,在setting搜git就能看见在哪指定路径 3、三种使用方式 1、随便找个文件夹,右键git bash here,这是用命令行…

八、Spring 整合 MyBatis

文章目录 一、Spring 整合 MyBatis 的关键点二、Spring 整合 MyBatis 的步骤2.1 创建 Maven 项目,并导入相关依赖2.2 配置 Mybatis 部分2.3 配置 Spring 部分2.3 配置测试类 一、Spring 整合 MyBatis 的关键点 1、 将 Mybatis 的 DataSource (数据来源)的创建和管理…

Electron + Vue3 + Vite + TS 构建桌面应用

之前是使用React、Electron、TS和webpack来构建桌面应用的。虽然功能齐全,但是打包等等开发的体验不太理想,总感觉太慢了。作为一个开发者,我们总是希望,执行构建命令后,可以快速打包或者启动本地应用,且通过更少的配置,来完成开发体验。 现在的vite已经得到广泛的应用…

林大数据结构【2019】

关键字: 哈夫曼树权值最小、哈夫曼编码、邻接矩阵时间复杂度、二叉树后序遍历、二叉排序树最差时间复杂度、非连通无向图顶点数(完全图)、带双亲的孩子链表、平衡二叉树调整、AOE网关键路径 一、判断 二、单选 三、填空 四、应用题 五、算…

cocos creator 的input.on 不生效

序: 1、执行input.on的时候发现不生效 2、一直按控制台也打印不出来console.log 3、先收藏这篇,因为到时候cocos要开发serveApi的时候,你得选一款趁手的后端开发并且,对习惯用ts写脚本的你来说,node是入门最快&#xf…

Pytorch Tutorial【Chapter 2. Autograd】

Pytorch Tutorial 文章目录 Pytorch TutorialChapter 2. Autograd1. Review Matrix Calculus1.1 Definition向量对向量求导1.2 Definition标量对向量求导1.3 Definition标量对矩阵求导 2.关于autograd的说明3. grad的计算3.1 Manual手动计算3.2 backward()自动计算 Reference C…

composer最新版本安装

下载 Composer 安装前请务必确保已经正确安装了 PHP。打开命令行窗口并执行 php -v 查看是否正确输出版本号。 打开命令行并依次执行下列命令安装最新版本的 Composer: 复制 php -r "copy(https://install.phpcomposer.com/installer, composer-setup.php);&…

Jmeter添加cookie的两种方式

jmeter中添加cookie可以通过配置HTTP Cookie Manager,也可以通过HTTP Header Manager,因为cookie是放在头文件里发送的。 实例:博客园点击添加新随笔 https://i.cnblogs.com/EditPosts.aspx?opt1 如果未登录,跳转登录页&#xf…

git删除历史提交中的某些文件

要从所有提交中删除PDF文件并保留本地文件,你需要使用git filter-repo命令或git filter-branch命令来重写历史。请注意,这将修改提交历史,因此需要小心操作,确保在执行之前备份数据。 以下是使用git filter-repo命令的示例&#…

容器——1.集合概述

文章目录 1.1. Java 集合概览1.2. 说说 List,Set,Map 三者的区别?1.3. 集合框架底层数据结构总结1.3.1. List1.3.2. Set1.3.3. Map 1.4. 如何选用集合?1.5. 为什么要使用集合? 1.1. Java 集合概览 从下图可以看出,在 Java 中除了以 Map 结尾…

谷粒商城第十天-分组新增级联显示商品分类分组修改级联回显商品分类

目录 一、总述 二、前端实现 三、后端实现 四、总结 一、总述 本次就是一个小的优化。 就是分组新增或者是修改的时候,直接显示商品分类的id可读性不高,新增的时候需要填写对商品分类的id,修改的时候,就只是给你一个商品分类…

.Net6 Web Core API --- AOP -- log4net 封装 -- MySQL -- txt

目录 一、引入 NuGet 包 二、配置log4net.config 三、编写Log4net封装类 四、编写日志记录类 五、AOP -- 拦截器 -- 封装 六、案例编写 七、结果展示 一、引入 NuGet 包 log4net Microsoft.Extensions.Logging.Log4Net.AspNetCore MySql.Data ---- MySQL…

篇七:桥接模式:连接抽象和实现

篇七:“桥接模式:连接抽象和实现” 开始本篇文章之前先推荐一个好用的学习工具,AIRIght,借助于AI助手工具,学习事半功倍。欢迎访问:http://airight.fun/。 另外有2本不错的关于设计模式的资料&#xff0c…

WPF上位机8——C#与MySQL

ADO.NET 数据库连接 数据插入、删除、更改 数据查询 带单个参数 带多个参数 using MySql.Data.MySqlClient; using System; using System.Collections.Generic; using System.Configuration; using System.Linq; using System.Text; using System.Threading.Tasks;namespace Wp…

JVM、JRE、JDK三者之间的关系

JVM、JRE和JDK是与Java开发和运行相关的三个重要概念。 再了解三者之前让我们先来了解下java源文件的执行顺序: 使用编辑器或IDE(集成开发环境)编写Java源文件.即demo.java程序必须编译为字节码文件,javac(Java编译器)编译源文件为demo.class文件.类文…

Git 命令行登录

有时候登录命令行版本的git会出现这个错误 1remote: Support for password authentication was removed on August 13, 2021. 2remote: Please see https://docs.github.com/en/get-started/getting-started-with-git/about-remote-repositories#cloning-with-https-urls for …

idea 控制台 打印 Tomcat日志Tomcat Catalina Log控制台乱码问题

修改tomcat的日志配置文件 conf一>logging.properties 修改【1catalina.org.apache.juli.AsyncFileHandler.encoding】的值为gbk 1catalina.org.apache.juli.AsyncFileHandler.level FINE 1catalina.org.apache.juli.AsyncFileHandler.directory ${catalina.base}/logs 1…

uniapp 跨域配置代理

本文介绍vue3版本浏览器运行跨域配置代理设置,但是需要考虑别的端运行情况,需要特别注意。 第一步:项目根目录新建vite.config.js文件 具体配置详见 第二步:vite.config.js文件中写入如下配置 重要代码如下 import { defineC…