TSDB - VictoriaMetrics 技术原理浅析

TSDB - VictoriaMetrics 技术原理浅析

news/2025/7/9 4:40:03/文章来源:https://blog.csdn.net/2301_76429513/article/details/131866752

一、前言

在监控领域，通常需要指标存储组件TSDB，目前开源的TSDB组件比较多，各个组件性能、高可用性、维护成本等等各有差异。本文不分析选型问题，重点讲解VictoriaMetrics（后面简称为vm）。

有兴趣的朋友建议结合源码进行分析，由于源码不断变更，此分析基于 v1.80.0，后续版本变化理论上不会很大。

二、架构与能力

vm开源版本分为single-server（all in one）的单节点模式和cluster模式，单点模式合适本地调试或测试使用，生产使用的cluster模式分为vmselect、vminsert、vmstorage三个主要模块：

（1）vmselect：查询模块，可无状态部署，客户端发送请求到查询模块后，查询模块会把请求分发到所有storage模块（由于没有元数据中心节点，固数据存储在哪无法感知，类似clickhouse的设计模式），得到原始的block数据后在select模块进行合并，再得到一个总结果。

（2）vminsert：写入模块，可无状态部署，写入数据的请求发到此模块后，根据labels通过一定的hash计算出一个值，根据这个值确定此条数据发往哪个storage节点。因此相同的时间线会往同一个点节点发送，如果有某个时间线数据量特别大则会出现数据倾斜问题后某个storage写入和查询压力都会增大。在扩容货缩容后，由于节点的列表变更，固计算出的hash发往的storage节点也会变更。

（3）vmstorage：存储模块，有状态，存储模块的移除须先从select和insert的配置中移除才不会有异常，此模块压力最大，非常消耗内存和IO，固推荐使用SSD和比较大的内存，宁愿用大规格的机器也不用量多但规格较小的机器（缓存不命中则会造成较多的IO，性能下降严重）。

三、vmstorage 存储模块

本文重点讲难度最高的 storage 模块，也只是属于个人理解，如有错误或偏差，望指正。

1、存储目录结构

/data 数据目录的逻辑结构如下：

（1）每个block只包括一个时间线，内部根据时间排序。

(2) 每个block最大容纳8000个sample，不同block可并发处理。

2、写入流程与风险点

3、查询流程与风险点

4、数据过期机制

开源的cluster版本只能针对租户使用全局的统一过期时间，收费的企业版才能支持租户单独设置过期时间。

5、数据安全性保障

（1）VictoriaMetrics 并未使用WAL，而是直接写入类似SSTable的内存结构中，定时刷写磁盘，这是此模块能表现出极高的写入性能的一个原因，如果是单副本则宕机时有可能照成最近的少量数据丢失，如果是数据安全性要求极高的场景，则建议开启双副本模式。

（2）双副本状态下，写入性能有一定的下降。即使在双副本模式下，不能同时下线两台主机，如果同时下掉两台主机则数据会丢失，为保证数据安全，建议对存储层配置RAID1、RAID5或RAID10保证数据安全性，迁移时将数据从data目录直接迁移走即可在另一主机运行。

四、运维&监控能力、Downsample

（1）vm配置有grafana的监控模板，安装即可观测各个模块的性能，需要结合代码才能比较深入的了解各个指标的作用含义（不过最前面部分的CPU/内存总量的计算貌似不正确，未深究，有兴趣可以看看什么问题）。

（2）vm写入由于没有WAL，如果出现大量缓存失效则容易出现慢写入，甚至大量超时，所以写入建议前置一个MQ（如kafka）缓解写入异常放大，写入模块做一定的异常限流防止查询也出现大量超时。

（3）vm很吃内存和磁盘，磁盘随机IO很多，建议配置SSD。

（4）vm开源版不支持存储层的downsample（企业版才支持），故会查询原始数据后通过promQL配置采样减少输出点，但总的来说不是存储层的downsample查询时间范围过大时会有很大的压力（比如一个月以上），建议上报的数据1分钟一个点位减少数据量。

五、性能见解与总结

官方写了一些英文博文对比influxdb的性能，vm的表现优异，但建议实测（官方提供的总有一些趋向性）。从个人的测试数据上看表现确实很不错，数据不方便公开，建议自测。

总之，此款基于golang的开源TSDB性能表现很好，要能驾驭这组件需要比较多的功力，不能单纯从表层去把它当做一个黑盒来运维，以免后续出现慢写入慢查询会变得手足无措。

源码层面的分析可以搜索下其他文章，在此就不再分析代码段。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/8641.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

回调函数的使用

回调函数的使用

使用例子 #include<stdio.h>int Callback_1(int x) // Callback Function 1 {printf("Hello, this is Callback_1: x %d ", x);return 0; }int Callback_2(int x) // Callback Function 2 {printf("Hello, this is Callback_2: x %d ", x);return…

阅读更多...

吉林大学计算机软件考研经验贴

吉林大学计算机软件考研经验贴

文章目录简介政治英语数学专业课简介本人23考研，一战上岸吉林大学软件工程专硕，政治72分，英一71分，数二144分，专业课967综合146分，总分433分，上图： 如果学弟学妹需要专业课资料…

阅读更多...

网络—Linux网络收发包的流程

网络—Linux网络收发包的流程

一、接收网络包的过程引言网卡是计算机里的一个硬件，专门负责接收和发送网络包，当网卡接收到一个网络包后，会通过 DMA 技术，将网络包写入到指定的内存地址，也就是写入到 Ring Buffer ，这个是一个…

阅读更多...

Mysql执行计划字段解释

Mysql执行计划字段解释

文章目录一、前言二、如何查看执行计划三、执行计划各字段解释四、select_type4.1、SIMPLE（简单查询）4.1.1、简单的单表查询4.1.2、多表连接查询 4.2、PRIMARY（主查询）4.2.1、包含复杂子查询的外层查询4.2.2、UNION语句中的第一个…

阅读更多...

【N32L40X】学习笔记02-gpio输入实例

【N32L40X】学习笔记02-gpio输入实例

GPIO 使用实例该函数库的目的就是在统一的敌方配置gpio，将配置的不同项放置在一个结构体内部没得io口使用一个枚举来定义一个gpio pin的别名 gpio输入实例 key.c #include <stdio.h> #include "key/bsp_key.h" #include "./key/bsp_lib_i…

阅读更多...

自动化测试框架unittest与pytest的区别！

自动化测试框架unittest与pytest的区别！

引言前面文章已经介绍了python单元测试框架，大家平时经常使用的是unittest，因为它比较基础，并且可以进行二次开发，如果你的开发水平很高，集成开发自动化测试平台也是可以的。而这篇文章主要讲unittest与pytest的区别&…

阅读更多...

可解释的 AI：在transformer中可视化注意力

可解释的 AI：在transformer中可视化注意力

Visualizing Attention in Transformers | Generative AI (medium.com) 一、说明在本文中，我们将探讨可视化变压器架构核心区别特征的最流行的工具之一：注意力机制。继续阅读以了解有关BertViz的更多信息，以及如何将此注意力可视化工具整合到…

阅读更多...

Debian12中为python3配置虚拟环境及在Pycharm中使用虚拟环境

Debian12中为python3配置虚拟环境及在Pycharm中使用虚拟环境

在Debian 12中，python默认为python 3.11。基于应用，现需设置虚拟环境。 1.安装venv模块从python3.3开始，配置python虚拟环境，可用venv模块，更加方便了。执行命令： #apt install python3.11-venv 2.…

阅读更多...

Java虚拟机——前端编译优化

Java虚拟机——前端编译优化

Java的编译期是有上下文语境影响的，不同语境下可以指不同的过程： 可以是前端编译器，把*.java文件转变成*.class文件的过程。 JDK的Javac、Eclipse JDT中的增量式编译器可以指Java虚拟机的即时编译器（JIT编译器）在运…

阅读更多...

【算法基础：搜索与图论】3.6 二分图（染色法判定二分图匈牙利算法）

【算法基础：搜索与图论】3.6 二分图（染色法判定二分图匈牙利算法）

文章目录二分图介绍染色法判定二分图例题：860. 染色法判定二分图匈牙利匹配二分图最大匹配匈牙利匹配算法思想例题：861. 二分图的最大匹配二分图介绍 https://oi-wiki.org/graph/bi-graph/ 二分图是图论中的一个概念，它的所有节点可以被…

阅读更多...

FPGA驱动SPI屏幕(附完整工程)

FPGA驱动SPI屏幕(附完整工程)

一. 简介相信大家都玩过屏幕，在FPGA上使用最多的就是VGA/HDMI接口的显示器了，这两种显示器的优点就不用说了，缺点就是体积比较大，而且价格比较贵，对于追求便携/价格低的我来说，SPI接口的屏幕才是我的首要…

阅读更多...

＜Spring Boot＞开发基于三层架构设计：Dao层、Service层、Controller层及案例一

＜Spring Boot＞开发基于三层架构设计：Dao层、Service层、Controller层及案例一

三层架构设计：基于Spring Boot开发要使用三层架构： 数据访问层（Dao）、业务逻辑层（Service）、控制层（Control-ler） （1）数据访问层（Dao&#xff0…

阅读更多...

更新合集 | 七月功能上新记

更新合集 | 七月功能上新记

点击链接了解详情七月来临，正式开启 2023 下半年的新征途！这个盛夏，腾讯云 CODING 上线了微信扫码注册、微信通知、Go 制品管理等重点能力，为企业及团队研发管理带来更多便利！以下是 CODING 新功能速递，快…

阅读更多...

会议室预约系统-检验是否被预约核心SQL

会议室预约系统-检验是否被预约核心SQL

会议室预约时，判断能否被预约，即查询是否已经有预约记录，存在不能被预约。 s,e；表示已经预约的开始结束时间； ns,ne，表示表单提交的预约时间； 只需要(ns,ne)与(s,e)区间没有交集，可…

阅读更多...

登录页的具体实现 (小兔鲜儿)【Vue3】

登录页的具体实现 (小兔鲜儿)【Vue3】

登录页整体认识和路由配置整体认识登录页面的主要功能就是表单校验和登录登出业务准备模板 <script setup></script><template><div><header class"login-header"><div class"container m-top-20"><h1 cl…

阅读更多...

详解go的hex.Encode原理

详解go的hex.Encode原理

简言今天看nsq的messageID生成的时候，发现它使用了hex.Encode函数来产生编码，那就顺道研究一下这个编码方式。原理 hex是16进制的意思，encode是进行编码的意思，内部实现也很简单，就是每4位计算出十六进制的值&a…

阅读更多...

mac最好用的解压缩工具，支持tar,rar,zip,ios,exe,msi等多种格式

mac最好用的解压缩工具，支持tar,rar,zip,ios,exe,msi等多种格式

mac系统最好用的压缩工具，支持多种文件压缩格式，甚至你想不到的压缩格式都支持 The Unarchiver，官网地址包括gui版和命令行版本不需要gui版本的，可以直接命令安装brew install unar unar使用方法： unar 压缩文件…

阅读更多...

基于Python机器学习、深度学习在气象、海洋、水文等技能提升教程

基于Python机器学习、深度学习在气象、海洋、水文等技能提升教程

详情点击链接：基于Python机器学习、深度学习技术提升气象、海洋、水文领域实践应用前言 Python是功能强大、免费、开源，实现面向对象的编程语言，能够在不同操作系统和平台使用，简洁的语法和解释性语言使其成为理想的脚本语言。…

阅读更多...

数据可视化（1）

数据可视化（1）

使用python带的matplotlib库进行简单的绘图。使用之前先进行安装，pip install matplotlib。如果安装了Anaconda,则无需安装matplotlib。 1.简单折线图 #绘制简单图表 import matplotlib.pyplot as plt plt.plot([1,2,3,4,5]) plt.show() import matplotlib.pyp…

阅读更多...

iOS原生输入框短信自动填充多遍原生解决办法

iOS原生输入框短信自动填充多遍原生解决办法

短信自动填充只有当输入框text无值的时候才会显示所以不需要考虑这种情况监听输入框内容变化的其中两种方法 1. [[NSNotificationCenter defaultCenter] addObserver:self selector:selector(textChange123:) name:UITextFieldTextDidChangeNotification object:nil]; 2. …

阅读更多...

最新文章