实时日志与发展:Elasticsearch 推出全新专用的 logsdb 索引模式

作者:来自 Elastic Mark Settle, George Kobar 及 Amena Siddiqi

Elastic 最新发布的 logsdb 索引模式是专为日志管理优化的功能,旨在提升日志数据的存储效率、查询性能以及整体可用性。这个模式专注于满足现代日志处理需求,提供更高效的日志分析体验,同时保持 Elasticsearch 的灵活性和强大能力。

更多阅读 “Observability:Elasticsearch 新的索引 mode: Logsdb 初体验”。

Elasticsearch 的新索引模式 logsdb 可将日志存储需求减少高达 65%

今天,我们宣布 Elasticsearch 的新索引模式 logsdb 正式发布,与不带 logsdb 的 Elasticsearch 最新版本相比,该模式可将日志数据的存储空间减少高达 65%。这一显著改进使可观察性和安全性团队能够在不超出预算的情况下扩大可见性,同时保持所有数据可立即访问以供分析。

Logsdb 优化了数据的排序,通过使用 synthetic _source 动态重建未存储的字段值来消除重复,并通过高级算法和编解码器提高压缩率,利用 Elasticsearch 中的列式存储实现高效的日志存储和检索。

使用 logsdb 索引模式提高存储效率,增强分析能力并降低成本

日志为检测和修复可观察性和安全性问题提供了关键信号 — 随着人工智能的进步简化了基于文本的数据的分析,日志的实用性也在不断提高 — 因此高效的存储和高性能的访问比以往任何时候都更加重要。

不幸的是,基础设施和应用程序生成的日志量不断增长,导致成本上升,迫使人们做出妥协,从而阻碍分析:限制收集、减少保留或将新数据降级到孤立的存档层。

Logsdb 直接解决了这些挑战。通过更高的存储效率,你可以收集更多数据并避免复杂的数据过滤麻烦。你可以保留更长时间的日志以支持威胁搜寻、事件响应和合规性要求。而且由于所有数据始终可搜索,因此无论你的数据集增长到多大,你都可以快速获得见解。

Logsdb 索引模式背后的技术创新

Logsdb 索引模式通过智能索引排序、synthetic _source 和高级压缩大大减少了日志数据的磁盘占用空间。与不带 logsdb 的最新版本 Elasticsearch 相比,实施它可以将日志存储需求减少多达 65%。虽然 logsdb 目前在索引过程中使用更多 CPU,但其高效的存储可降低大多数客户的总体成本。对于需要长期保留的客户,我们预计总拥有成本 (total cost of ownership - TCO) 可降低多达 50%。

智能索引排序可将存储效率提高多达 30%,并通过将相似的数据放在一起来减少某些日志数据集的查询延迟。默认情况下,它按 host.name 和 @timestamp 对索引进行排序。如果你的数据有更合适的字段,你可以改为指定它们。

高级压缩通过 Zstandard 压缩 (Zstd)、增量编码、运行长度编码和其他自动选择的智能编解码器显著降低了日志等文本密集型数据的存储要求。 Doc-values 以针对压缩和性能进行了优化的列格式存储,可高效存储和检索字段值,以进行排序、聚合和脚本编写。

Synthetic _source 使组织能够通过丢弃 _source 字段并根据需要完全或部分重建它,将存储需求再减少 20-40%。虽然该功能有时需要更多的计算来进行索引和检索,但测试表明它提供了可衡量的净效率改进。Synthetic _source 是基于近两年的生产使用情况和指标而构建的,对日志进行了大量的增强,包括对几乎所有字段类型的支持。

由此产生的存储节省会在整个索引生命周期阶段传播。热层存储减少 65% 将导致暖层、冷层和冻结层的存储同样减少,并减少在存储桶存储中存储快照的占用空间。

不影响可见性:保留所有日志以实现可观察性和安全性

日志是了解基础设施和应用程序状况的基础,为监控和故障排查提供了最简单且最重要的信号。然而,随着日志量的增长,成本也在不断上升。这一挑战迫使用户实施复杂的过滤和管理策略、过早删除数据,并将相关日志存储在需要一天或更长时间才能重新加载分析的存储中。没有完整、易于搜索且随时可用的数据集,查找和解决问题变得更加困难。

Logsdb 索引模式基于突破性的 Elasticsearch 功能(如可搜索快照和自动导入),可解决运营和安全团队的以下痛点:

  • 降低成本:Logsdb 将日志的存储空间减少了多达 65%,使组织能够在保留更多数据的同时降低存储费用。这意味着所有存储层(从热存储到冷存储)的成本节省,以及使用此数据的可观察性和安全性团队的更高生产力。
  • 保存有价值的数据:Logsdb 保留所有日志数据并提高运营效率,而无需依赖额外的工具或复杂的过滤器。借助 synthetic _source 等功能,无需存储整个源文档即可保留数据的价值。
  • 扩展可见性:Logsdb 可在一个平台上高效访问所有数据,无需为可观察性、安全性和历史数据设置单独的孤岛。对于站点可靠性工程师 (SRE),它通过分析日志以及指标、跟踪和业务数据来加速问题解决。同样,对于安全运营中心 (SOC) 团队,它通过消除盲点来加速调查和补救。
  • 简化数据访问:Logsdb 让 SRE 团队能够高效地保留可操作数据以进行故障排除、趋势分析和分析。同样,SOC 团队可以快速搜索所有数据以进行调查和威胁搜寻,而无需承担高昂的成本。

为你的环境做好准备

Elasticsearch logsdb 索引模式从 8.17 版开始通常可供 Elastic Cloud Hosted 和 Self-Managed 客户使用,并且默认情况下已为 Elastic Cloud Serverless 中的日志启用。

基本 logsdb 功能(包括智能索引排序和高级压缩)可供拥有标准、黄金和白金许可证的组织使用。完整的 logsdb 功能可进一步降低存储要求(包括合成 _source),可供拥有企业许可证的无服务器客户和组织使用。

眼见为实

Logsdb 使你能够保留所有日志数据并提高运营效率,而无需缩小收集范围或丢弃或孤立数据。借助智能索引排序、高级压缩和合成 _source 等功能,你可以在适合你的预算内保留和分析所需的数据。

想亲自体验一下吗?免费试用 Elastic。

本文中描述的任何特性或功能的发布和时间均由 Elastic 自行决定。任何当前不可用的特性或功能可能无法按时交付或根本无法交付。

想要获得 Elastic 认证吗?了解下一期 Elasticsearch 工程师培训何时举行!

Elasticsearch 包含许多新功能,可帮助你为你的用例构建最佳搜索解决方案。深入了解我们的示例笔记本以了解更多信息,开始免费云试用,或立即在你的本地机器上试用 Elastic。

原文:https://www.elastic.co/search-labs/blog/elasticsearch-logsdb-index-mode

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/64000.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

React Image Crop——在React应用中轻松实现图片裁剪功能

React Image Crop是一个用于在React应用程序中裁剪和调整图像的库。它提供了一个简单而强大的界面,允许用户选择和调整裁剪区域,并生成裁剪后的图像。 什么是React Image Crop? React Image Crop是一个开源的React组件,用于在浏览…

Vue.js 中,前端如何处理从后端返回的 Excel 文件流

目的:页面中点击按钮实现下载excel文件 步骤: 向后端发送请求: 使用 axios(或其他 HTTP 客户端)向后端发送请求以获取文件。通常,文件会以 Blob 形式返回。 处理响应数据: 将响应数据(Blob 对象)处理为下载链接,并模拟点击以触发下载。 具体步骤: 1. 安装 axios(…

【HarmonyOS】鸿蒙应用实现手机摇一摇功能

【HarmonyOS】鸿蒙应用实现手机摇一摇功能 一、前言 手机摇一摇功能,是通过获取手机设备,加速度传感器接口,获取其中的数值,进行逻辑判断实现的功能。 在鸿蒙中手机设备传感器ohos.sensor (传感器)的系统API监听有以下&#xf…

微积分复习笔记 Calculus Volume 2 - 3.7 Improper Integrals

3.7 Improper Integrals - Calculus Volume 2 | OpenStax

box 提取

box 提取 import json import os import shutilimport cv2 import numpy as np import pypinyinclass Aaa():passdef pinyin(word):s for i in pypinyin.pinyin(word, stylepypinyin.NORMAL):s .join(i)return s if __name__ __main__:selfAaa()base_dirrE:\data\dao\20241…

ViewModel

ViewMode是MVVM架构模式中VM层对应的类,它的作用是存储界面数据,并和界面发生数据交互。ViewModel能感知生命周期,并且在界面由于配置问题发生重建时候,可以保持当前的数据不变。生命周期如下: ViewMode由ViewModePr…

ESP32-S3模组上跑通ES8388(29)

接前一篇文章:ESP32-S3模组上跑通ES8388(28) 二、利用ESP-ADF操作ES8388 2. 详细解析 上一回解析到了es8388_init函数中的第11段也是最后一段代码,没有解析完,本回继续解析。为了便于理解和回顾,再次贴出该片段,在components\audio_hal\driver\es8388\es8388.c中,如下…

C#—索引器

C#—索引器 索引器(Indexer)是类中的一个特殊成员,它能够让对象以类似数组的形式来操作,使程序看起来更为直观,更容易编写。索引器与属性类似,在定义索引器时同样会用到 get 和 set 访问器,不同…

智慧城市道路分割数据集labelme格式2648张1类别

数据集格式:labelme格式(不包含mask文件,仅仅包含jpg图片和对应的json文件) 图片数量(jpg文件个数):2648 标注数量(json文件个数):2648 标注类别数:1 标注类别名称:["road"] 每个类别标注的框数&#x…

YOLOv5+pyqt5+摄像头在特定条件下进行目标检测并采集原始数据

项目介绍 项目地址 GitHub - biabu0/Yolov5_D435i: 通过YOLOV5与pyqt5实现一个使用D435i深度摄像头采集特定需求与场景下的深度数据的小程序 通过YOLOV5对指定的区域进行检测,当检测到目标进入特定区域时,开始保存数据,摄像头采用D435i深度…

图像的放缩比率如何计算的?

图像的放缩比率如何计算关键点 在医疗软件的胶片打印中,图像放缩比率的计算需要更加精确和考虑更多因素,以确保最终打印出来的影像准确无误,符合诊断要求。 以下是一些关键点: 像素间距(Pixel Spacing)&a…

leetcode-73.矩阵置零-day5

class Solution {public void setZeroes(int[][] mat) {int m mat.length, n mat[0].length;// 1. 扫描「首行」和「首列」记录「首行」和「首列」是否该被置零boolean r0 false, c0 false;for (int i 0; i < m; i) {if (mat[i][0] 0) {r0 true;break;}}for (int j …

uni-app H5端使用注意事项 【跨端开发系列】

&#x1f517; uniapp 跨端开发系列文章&#xff1a;&#x1f380;&#x1f380;&#x1f380; uni-app 组成和跨端原理 【跨端开发系列】 uni-app 各端差异注意事项 【跨端开发系列】uni-app 离线本地存储方案 【跨端开发系列】uni-app UI库、框架、组件选型指南 【跨端开…

相机不动,机构动作----Hands Eyes

最近在研究 手眼标定&#xff0c;发现大家都需付费&#xff0c;搞啥子&#xff0c;说好的开源。。。 以相机在上固定不动&#xff0c;机械手为 EPSON_Robot 为例&#xff0c;详细的一步一步实例操作指引 EPSON_Robot 的192.168.0.1 2004 Server 详细操作步骤 1. 启动程序 运…

DCDC降压模块

一、项目介绍 在B站看到工科男孙老师发的DCDC模块视频&#xff0c;后面有提到这款芯片&#xff0c;于是就使用这款芯片自己设计了这款降压模块。 芯片的封装为TSOT23-8&#xff0c;对空间利用率高。 输入电压的范围为3-18V。 输出电压的范围为0-8V。 输出电流最…

QILSTE H8-316QFO高亮橙光LED灯珠 发光二极管LED

在当今电子技术领域&#xff0c;H8-316QFO型号的LED以其卓越的性能和可靠性 脱颖而出。本文将深入探讨这款LED的关键参数&#xff0c;以期为工程师和技术人员提供详尽的技术参考。 首先&#xff0c;H8-316QFO的物理特性不容忽视。其外观尺寸为3.2x1.5x0.8mm&#xff0c;小巧的…

康耐视智能相机(Insight)通过ModbusTCP发送字符串到倍福(BECKHOFF)PLC中

文章目录 1.背景2.分析3.实现3.1.PLC的ModbusTCP_Server3.1.1.安装TF6250-Modbus-TCP3.1.2.PLC设置 3.2.智能相机的ModbusTCP_Client3.2.1.了解ModbusTCP的协议3.2.2.根据协议写代码3.2.2.1.纯函数代码3.2.2.2.脚本代码 3.2.3.非脚本处理时的代码逻辑图3.2.4.关于代码的问题及解…

自定义函数库

求两点距离 double dis(double x1, double y1, double x2, double y2){return sqrt(pow(x2-x1, 2)pow(y2-y1, 2)); }判断闰年 bool isLeapYear(int year){return year%40 && year%100!0 || year%4000; }判断素数 bool isPrime(int num){if(num<2) return false;f…

解决前后端发送验证码手机号登陆的sessionId不一致问题

前端&#xff1a;鸿蒙开发ArkTs语言 后端&#xff1a;spring boot mybatis-plus框架 后端代码 PostMapping("/sendMsg")public R<String> sendMsg(RequestBody User user, HttpServletRequest request, HttpServletResponse response) {// 从User对象中提取用…

基于多视角深度学习技术的乳腺X线分类:图神经网络与Transformer架构的研究|文献速递-生成式模型与transformer在医学影像中的应用速递

Title 题目 Mammography classification with multi-view deep learning techniques:Investigating graph and transformer-based architectures 基于多视角深度学习技术的乳腺X线分类&#xff1a;图神经网络与Transformer架构的研究 01 文献速递介绍 乳腺X线检查是乳腺癌…