实时日志与发展:Elasticsearch 推出全新专用的 logsdb 索引模式

作者:来自 Elastic Mark Settle, George Kobar 及 Amena Siddiqi

Elastic 最新发布的 logsdb 索引模式是专为日志管理优化的功能,旨在提升日志数据的存储效率、查询性能以及整体可用性。这个模式专注于满足现代日志处理需求,提供更高效的日志分析体验,同时保持 Elasticsearch 的灵活性和强大能力。

更多阅读 “Observability:Elasticsearch 新的索引 mode: Logsdb 初体验”。

Elasticsearch 的新索引模式 logsdb 可将日志存储需求减少高达 65%

今天,我们宣布 Elasticsearch 的新索引模式 logsdb 正式发布,与不带 logsdb 的 Elasticsearch 最新版本相比,该模式可将日志数据的存储空间减少高达 65%。这一显著改进使可观察性和安全性团队能够在不超出预算的情况下扩大可见性,同时保持所有数据可立即访问以供分析。

Logsdb 优化了数据的排序,通过使用 synthetic _source 动态重建未存储的字段值来消除重复,并通过高级算法和编解码器提高压缩率,利用 Elasticsearch 中的列式存储实现高效的日志存储和检索。

使用 logsdb 索引模式提高存储效率,增强分析能力并降低成本

日志为检测和修复可观察性和安全性问题提供了关键信号 — 随着人工智能的进步简化了基于文本的数据的分析,日志的实用性也在不断提高 — 因此高效的存储和高性能的访问比以往任何时候都更加重要。

不幸的是,基础设施和应用程序生成的日志量不断增长,导致成本上升,迫使人们做出妥协,从而阻碍分析:限制收集、减少保留或将新数据降级到孤立的存档层。

Logsdb 直接解决了这些挑战。通过更高的存储效率,你可以收集更多数据并避免复杂的数据过滤麻烦。你可以保留更长时间的日志以支持威胁搜寻、事件响应和合规性要求。而且由于所有数据始终可搜索,因此无论你的数据集增长到多大,你都可以快速获得见解。

Logsdb 索引模式背后的技术创新

Logsdb 索引模式通过智能索引排序、synthetic _source 和高级压缩大大减少了日志数据的磁盘占用空间。与不带 logsdb 的最新版本 Elasticsearch 相比,实施它可以将日志存储需求减少多达 65%。虽然 logsdb 目前在索引过程中使用更多 CPU,但其高效的存储可降低大多数客户的总体成本。对于需要长期保留的客户,我们预计总拥有成本 (total cost of ownership - TCO) 可降低多达 50%。

智能索引排序可将存储效率提高多达 30%,并通过将相似的数据放在一起来减少某些日志数据集的查询延迟。默认情况下,它按 host.name 和 @timestamp 对索引进行排序。如果你的数据有更合适的字段,你可以改为指定它们。

高级压缩通过 Zstandard 压缩 (Zstd)、增量编码、运行长度编码和其他自动选择的智能编解码器显著降低了日志等文本密集型数据的存储要求。 Doc-values 以针对压缩和性能进行了优化的列格式存储,可高效存储和检索字段值,以进行排序、聚合和脚本编写。

Synthetic _source 使组织能够通过丢弃 _source 字段并根据需要完全或部分重建它,将存储需求再减少 20-40%。虽然该功能有时需要更多的计算来进行索引和检索,但测试表明它提供了可衡量的净效率改进。Synthetic _source 是基于近两年的生产使用情况和指标而构建的,对日志进行了大量的增强,包括对几乎所有字段类型的支持。

由此产生的存储节省会在整个索引生命周期阶段传播。热层存储减少 65% 将导致暖层、冷层和冻结层的存储同样减少,并减少在存储桶存储中存储快照的占用空间。

不影响可见性:保留所有日志以实现可观察性和安全性

日志是了解基础设施和应用程序状况的基础,为监控和故障排查提供了最简单且最重要的信号。然而,随着日志量的增长,成本也在不断上升。这一挑战迫使用户实施复杂的过滤和管理策略、过早删除数据,并将相关日志存储在需要一天或更长时间才能重新加载分析的存储中。没有完整、易于搜索且随时可用的数据集,查找和解决问题变得更加困难。

Logsdb 索引模式基于突破性的 Elasticsearch 功能(如可搜索快照和自动导入),可解决运营和安全团队的以下痛点:

  • 降低成本:Logsdb 将日志的存储空间减少了多达 65%,使组织能够在保留更多数据的同时降低存储费用。这意味着所有存储层(从热存储到冷存储)的成本节省,以及使用此数据的可观察性和安全性团队的更高生产力。
  • 保存有价值的数据:Logsdb 保留所有日志数据并提高运营效率,而无需依赖额外的工具或复杂的过滤器。借助 synthetic _source 等功能,无需存储整个源文档即可保留数据的价值。
  • 扩展可见性:Logsdb 可在一个平台上高效访问所有数据,无需为可观察性、安全性和历史数据设置单独的孤岛。对于站点可靠性工程师 (SRE),它通过分析日志以及指标、跟踪和业务数据来加速问题解决。同样,对于安全运营中心 (SOC) 团队,它通过消除盲点来加速调查和补救。
  • 简化数据访问:Logsdb 让 SRE 团队能够高效地保留可操作数据以进行故障排除、趋势分析和分析。同样,SOC 团队可以快速搜索所有数据以进行调查和威胁搜寻,而无需承担高昂的成本。

为你的环境做好准备

Elasticsearch logsdb 索引模式从 8.17 版开始通常可供 Elastic Cloud Hosted 和 Self-Managed 客户使用,并且默认情况下已为 Elastic Cloud Serverless 中的日志启用。

基本 logsdb 功能(包括智能索引排序和高级压缩)可供拥有标准、黄金和白金许可证的组织使用。完整的 logsdb 功能可进一步降低存储要求(包括合成 _source),可供拥有企业许可证的无服务器客户和组织使用。

眼见为实

Logsdb 使你能够保留所有日志数据并提高运营效率,而无需缩小收集范围或丢弃或孤立数据。借助智能索引排序、高级压缩和合成 _source 等功能,你可以在适合你的预算内保留和分析所需的数据。

想亲自体验一下吗?免费试用 Elastic。

本文中描述的任何特性或功能的发布和时间均由 Elastic 自行决定。任何当前不可用的特性或功能可能无法按时交付或根本无法交付。

想要获得 Elastic 认证吗?了解下一期 Elasticsearch 工程师培训何时举行!

Elasticsearch 包含许多新功能,可帮助你为你的用例构建最佳搜索解决方案。深入了解我们的示例笔记本以了解更多信息,开始免费云试用,或立即在你的本地机器上试用 Elastic。

原文:https://www.elastic.co/search-labs/blog/elasticsearch-logsdb-index-mode

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/64000.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

React Image Crop——在React应用中轻松实现图片裁剪功能

React Image Crop是一个用于在React应用程序中裁剪和调整图像的库。它提供了一个简单而强大的界面,允许用户选择和调整裁剪区域,并生成裁剪后的图像。 什么是React Image Crop? React Image Crop是一个开源的React组件,用于在浏览…

【HarmonyOS】鸿蒙应用实现手机摇一摇功能

【HarmonyOS】鸿蒙应用实现手机摇一摇功能 一、前言 手机摇一摇功能,是通过获取手机设备,加速度传感器接口,获取其中的数值,进行逻辑判断实现的功能。 在鸿蒙中手机设备传感器ohos.sensor (传感器)的系统API监听有以下&#xf…

微积分复习笔记 Calculus Volume 2 - 3.7 Improper Integrals

3.7 Improper Integrals - Calculus Volume 2 | OpenStax

ViewModel

ViewMode是MVVM架构模式中VM层对应的类,它的作用是存储界面数据,并和界面发生数据交互。ViewModel能感知生命周期,并且在界面由于配置问题发生重建时候,可以保持当前的数据不变。生命周期如下: ViewMode由ViewModePr…

智慧城市道路分割数据集labelme格式2648张1类别

数据集格式:labelme格式(不包含mask文件,仅仅包含jpg图片和对应的json文件) 图片数量(jpg文件个数):2648 标注数量(json文件个数):2648 标注类别数:1 标注类别名称:["road"] 每个类别标注的框数&#x…

leetcode-73.矩阵置零-day5

class Solution {public void setZeroes(int[][] mat) {int m mat.length, n mat[0].length;// 1. 扫描「首行」和「首列」记录「首行」和「首列」是否该被置零boolean r0 false, c0 false;for (int i 0; i < m; i) {if (mat[i][0] 0) {r0 true;break;}}for (int j …

uni-app H5端使用注意事项 【跨端开发系列】

&#x1f517; uniapp 跨端开发系列文章&#xff1a;&#x1f380;&#x1f380;&#x1f380; uni-app 组成和跨端原理 【跨端开发系列】 uni-app 各端差异注意事项 【跨端开发系列】uni-app 离线本地存储方案 【跨端开发系列】uni-app UI库、框架、组件选型指南 【跨端开…

DCDC降压模块

一、项目介绍 在B站看到工科男孙老师发的DCDC模块视频&#xff0c;后面有提到这款芯片&#xff0c;于是就使用这款芯片自己设计了这款降压模块。 芯片的封装为TSOT23-8&#xff0c;对空间利用率高。 输入电压的范围为3-18V。 输出电压的范围为0-8V。 输出电流最…

康耐视智能相机(Insight)通过ModbusTCP发送字符串到倍福(BECKHOFF)PLC中

文章目录 1.背景2.分析3.实现3.1.PLC的ModbusTCP_Server3.1.1.安装TF6250-Modbus-TCP3.1.2.PLC设置 3.2.智能相机的ModbusTCP_Client3.2.1.了解ModbusTCP的协议3.2.2.根据协议写代码3.2.2.1.纯函数代码3.2.2.2.脚本代码 3.2.3.非脚本处理时的代码逻辑图3.2.4.关于代码的问题及解…

基于多视角深度学习技术的乳腺X线分类:图神经网络与Transformer架构的研究|文献速递-生成式模型与transformer在医学影像中的应用速递

Title 题目 Mammography classification with multi-view deep learning techniques:Investigating graph and transformer-based architectures 基于多视角深度学习技术的乳腺X线分类&#xff1a;图神经网络与Transformer架构的研究 01 文献速递介绍 乳腺X线检查是乳腺癌…

恢复删除的文件:6个免费Windows电脑数据恢复软件

数据恢复软件可帮助您从众多存储设备中恢复损坏或删除的数据。您可以使用这些文件恢复软件来检索文件、文档、视频、图片等。这些应用程序支持多种标准文件格式&#xff0c;如 PNG、RTF、PDF、HTML、JPG、MP3 等。 经过超过 75 小时的研究&#xff0c;我分析了 25 最佳免费数据…

探索 Python 编程调试案例:程序平均值的修复过程

&#x1f49d;&#x1f49d;&#x1f49d;Python 作为一门广泛应用的编程语言&#xff0c;其编程过程并非总是一帆风顺。即使是经验丰富的程序员&#xff0c;也会在代码中遇到各种错误。而调试Python代码过程&#xff0c;也是学习中不可避免的步骤。 今天来看一个简单的案例。…

简单了解一下 Go 语言构建约束?

​构建约束是一种在 Go 语言中控制源文件编译条件的方法&#xff0c;它可以让您指定某些文件只在特定的操作系统、架构、编译器或 Go 版本下编译&#xff0c;而在其他环境中自动忽略。这样可以方便您针对不同的平台或场景编写不同的代码&#xff0c;实现条件编译的功能。 构建…

人工智能大语言模型起源篇(二),从通用语言微调到驾驭LLM

上一篇&#xff1a;《人工智能大语言模型起源篇&#xff08;一&#xff09;&#xff0c;从哪里开始》 &#xff08;5&#xff09;Howard 和 Ruder 于2018年发表的《Universal Language Model Fine-tuning for Text Classification》&#xff0c;https://arxiv.org/abs/1801.06…

基于MATLAB的电力系统潮流计算

为了进行潮流计算&#xff0c;通常可以使用像MATPOWER这样的电力系统分析工具包&#xff0c; 在MATLAB中的MATPOWER工具包中&#xff0c;多个不同的系统模型被定义为测试案例&#xff08;case&#xff09;。这些测试案例用于模拟和分析电力系统中的潮流计算、最优潮流问题、稳…

Unity屏幕截图、区域截图、读取图片、WebGL长截屏并下载到本地jpg

Unity屏幕截图、区域截图、读取图片、WebGL长截屏并下载到本地jpg 一、全屏截图并保存到StreamingAssets路径下 Texture2D screenShot;//保存截取的纹理public Image image; //显示截屏的Imagepublic void Jietu(){StartCoroutine(ScrrenCapture(new Rect(0, 0, Screen.width…

Moretl无人值守日志采集工具

永久免费: 至Gitee下载 使用教程: Moretl使用说明 用途 定时全量或增量采集工控机,电脑文件或日志. 优势 开箱即用: 解压直接运行.不需额外下载.管理设备: 后台统一管理客户端.无人值守: 客户端自启动,自更新.稳定安全: 架构简单,兼容性好,通过授权控制访问. 架构 技术架…

The Rise and Potential of Large Language ModelBased Agents:A Survey---摘要、背景、引言

题目 基于大语言模型的Agent的兴起与发展前景 论文地址&#xff1a;https://arxiv.org/pdf/2309.07864.pdf 项目地址&#xff1a;https:/github.com/WooooDyy./LLM-Agent–Paper-List 摘要 长期以来&#xff0c;人类一直在追求等同于或超越人类水平的人工智能(A)&#xff0c;…

lc46全排列——回溯

46. 全排列 - 力扣&#xff08;LeetCode&#xff09; 法1&#xff1a;暴力枚举 总共n!种全排列&#xff0c;一一列举出来放入list就行&#xff0c;关键是怎么去枚举呢&#xff1f;那就每次随机取一个&#xff0c;然后删去这个&#xff0c;再从剩下的数组中继续去随机选一个&a…

Spring Boot教程之二十五: 使用 Tomcat 部署项目

Spring Boot – 使用 Tomcat 部署项目 Spring Boot 是一个基于微服务的框架&#xff0c;在其中创建可用于生产的应用程序只需很少的时间。Spring Boot 建立在 Spring 之上&#xff0c;包含 Spring 的所有功能。如今&#xff0c;它正成为开发人员的最爱&#xff0c;因为它是一个…