有什么不同? Elastic 数据层和 Amazon OpenSearch Service 层

作者:来自 Elastic Ugo Sangiorgi

了解 Elastic 和 Amazon OpenSearch Service 数据层之间的主要差异,以实现更智能、经济高效的数据管理。

在数据管理领域,在讨论如何在不同的性能要求下提供和/或保留数据时,经常会出现 “热 (hot)”、“温 (warm)” 和 “冷 (cold)” 等术语。

在将 Elastic® 的数据层与 Amazon OpenSearch Service 层进行比较时,还存在另一个挑战 - 相同的术语并不意味着相同的事情。 通过此解释,我们试图消除有关 Elastic 和 Amazon OpenSearch Service 之间类似数据层术语的任何误解。 借助此处提供的见解,你将处于战略性管理数据的有利位置,最大限度地提高性能,同时最大限度地降低成本。 这张图表是一个方便的总结:

什么是数据层? 从根本上讲,数据层是不同的存储级别,它们根据访问频率、成本效率和性能需求等标准对数据进行分类。 它们可以优化数据组织,并可以通过使存储费用与信息的长期价值保持一致来帮助降低成本。

层级有何不同

数据层的概念存在于大多数数据平台中,特别是那些处理可观察性和/或安全工具的平台。 这些工具收集的数据量通常非常大,每秒处理数千/数百万个事件,并可用于搜索、仪表板和警报。 可观察性和安全性也有一个共同的特征:最新的数据也是最有价值的,因为管理这些工具的团队依靠收集到的信号在出现问题时立即采取行动。

因此,使用尽可能快的硬件来摄取和存储数据,并随着时间的推移 “向下” 移动到更便宜、功能更弱的硬件是有意义的。

Elastic 中的数据旅程

Elastic 有五层,可以根据你的具体用例独立或集体使用:

  • (hot):你的数据总是首先到达这里,并且它具有高实时性、可扩展性,并提供尽可能最佳的性能(假设遵循最佳实践)。 这是你保存需要经常访问和操作的数据的地方。
  • (warm):此层可以实现更具成本效益的硬件利用率,可以驻留不立即需要(但仍然相对重要)的数据。 你可以将数据移至此层并对其进行优化(例如通过强制合并分段),以便搜索尽可能快。 该层中的数据仍然可以通过副本进行扩展,就像在热层中一样,以便在需要时满足搜索需求。
  • (cold):这里确保至少一份数据副本始终分配给节点并且在任何给定时刻都可搜索。 冷层使用存储桶来帮助在出现故障或需要更改集群拓扑时恢复数据。
  •  (frozen):在这一层中,数据访问频率较低,并且可以节省成本,因为它利用成本最低的存储并减少计算资源。 数据是可搜索的,但必须将其恢复到可搜索状态,这是通过 Elasticsearch® 的可搜索快照自动且透明地完成的。
  • 快照 (snapshot):快照本质上是数据备份 —— 索引的时间点副本。 它们可用于各种目的,例如丢失时的数据恢复、为测试或临时环境创建索引克隆,或在集群之间迁移数据。 快照存储在存储库中,该存储库可以位于不同的存储系统上,例如本地文件系统或存储桶存储(例如 GCS、S3),并且必须手动恢复才能搜索数据。

等等,什么是 “shard (分片)”?

在 Elasticsearch(因此也是 OpenSearch)中,“分片” 本质上是一个独立的索引,它保存一部分数据,允许跨多个节点(服务器)分布大型数据集,以提高性能和可扩展性。

分片有两种类型:主分片 (primary shards) 和副本分片 (replica shards)。 主分片是首先存储数据的主要容器; 每条记录仅存储在一个主分片中。 副本分片是主分片的副本,可在发生故障时提供冗余,并且还允许系统通过跨副本的负载平衡搜索查询来处理更多读取请求。 对于新手来说,你可以将分片视为一本书的各个章节; 虽然每一章(碎片)包含故事的不同部分(数据),但多个印刷副本(副本)确保即使丢失,仍然可以完整阅读故事。

更多关于 shard 方面的知识,请阅读文章 “Elasticsearch 中的一些重要概念: cluster, node, index, document, shards 及 replica”。

Amazon OpenSearch Service 中的数据旅程

Amazon OpenSearch Service 有四个层级:

  • Hot:你的数据总是首先到达这里,并且它具有高度实时可用性、可扩展性,并提供尽可能最佳的性能(假设遵循最佳实践)。
  • OR1:数据既可读又可写,因为 OR1 具有永久的计算能力,但没有副本。 发生故障时,数据会从存储桶中恢复。
  • UltraWarm:此层专为经济高效的存储和查询访问频率较低的大数据量而设计。 Amazon OpenSearch Service 中的 UltraWarm 节点提供辅助存储层,以保持数据可查询。
  • Cold:OpenSearch 冷层中的数据通常会产生较低的存储成本,但不能直接搜索。 访问冷数据通常涉及手动将数据恢复到较热的层,然后使其可搜索。

并排比较

现在我们可以从数据访问能力方面来比较各层:数据可以读写还是只读? 是否需要手动恢复或者 “解冻” 过程是自动的? 以下是每个 “波段” 代表的含义:

Read + Write

该波段将 Elastic 和 OpenSearch 中的 Hot 视为最快的级别。 由于它们应该是等效的,因此我们在本博客中比较了它们的性能。

下一层,Elastic 中的 Warm 和 Amazon OpenSearch Service 中的 OR1 都允许更新数据,但在可扩展性方面存在差异 - Elastic 的 Warm 允许副本并允许你扩展以满足搜索需求,而 OR1 则不允许,因为只有主分片可用于搜索。

Read-Only

该波段不允许数据更新(写入); 它只允许从其他层迁移数据。 该组中的所有层都有存储桶存储备份,但没有副本。

Elastic 中的 Frozen 层和 Amazon OpenSearch Service 中的 UltraWarm 层都将数据作为快照存储在存储桶存储中,并在任何涉及的索引中发出搜索时检索此数据。 只有这样,数据才可用,然后缓存以供后续搜索。 然而,UltraWarm 节点目前只有两种配置:一种可以处理 1.5TB 的快照数据,另一种可以处理 20TB 的快照数据。 这意味着,如果我们想要存储价值 100TB 的数据,则 Amazon OpenSearch Service 中需要 5 个 UltraWarm 节点,而 Elastic 中只需要 2 个 Frozen 节点,Elastic 具有不同的硬件配置文件以及不同的 vCPU、RAM 和 NVMe 存储组合。

此外,在 Elastic 中,ColdFrozen 都依赖于可搜索快照功能,该功能允许搜索 5.0 之前的快照(早在 2016 年就发布了!),而无需恢复到活动集群 — 这对于治理非常有用 合规性、安全调查和历史回顾,无论你使用哪个 Elasticsearch 版本。

Archive

快照存储在存储库中,该存储库可以位于不同的存储系统上,例如本地文件系统或存储桶存储(例如 GCS、S3),并且必须手动恢复才能搜索数据。

硬件配置文件

另一个需要考虑的重要方面是每个层中使用的实例类型。 还需要注意的是,Elastic Cloud 支持三个主要的云提供商(AWS、Google Cloud 和 Microsoft Azure),每个提供商都有不同的硬件配置文件。 Amazon OpenSearch Service 的方法为其服务指定特定实例(例如 OR1 和 Im4gn),并具有特定的软件版本要求和 EBS 卷支持限制。

Amazon OpenSearch Service 和 Elastic Cloud on AWS 都使用基于 Graviton2 的实例,这表明对 AWS 基于 ARM 的芯片组的性能提升和成本效率的共同偏好。 AWS 上的 Elastic Cloud 对其实例的确切用例的规定较少,提供的选择包括具有快速存储的高计算能力(Graviton2 实例)和各种更传统的选择(例如 C5d、M5d 等)。

为什么这很重要?

命名约定可能会产生误导,在尝试将业务需求与提供商之间的数据存储选项保持一致时,会造成可以理解的混乱。 掌握这些层的实际功能可以帮助你在数据管理方面做出更明智且更具成本效益的决策。

此细分旨在消除因 Elastic 和 Amazon OpenSearch Service 之间的数据层命名重叠而带来的误解。 通过数据层的描述,你将能够更好地战略性地组织数据,以获得性能和成本效益。 超越名称并了解每一层的底层机制至关重要,以确保你的数据策略既稳健又高效。

另请参阅以下研究:Elasticsearch 在成本效率方面超越 OpenSearch,以及 Elasticsearch 如何在使用更少资源的情况下超越 OpenSearch。

本文中描述的任何特性或功能的发布和时间安排均由 Elastic 自行决定。 当前不可用的任何特性或功能可能无法按时交付或根本无法交付。

原文:What’s the difference? Elastic data tiers and Amazon OpenSearch Service tiers | Elastic Blog

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/666226.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

04、全文检索 -- Solr -- 管理 Solr 的 core(使用命令和图形界面创建、删除 core,以及对core 目录下的各文件进行详细介绍)

目录 管理 Solr 的 core创建 Core方式1:solr 命令创建演示:使用 solr 命令创建 Core:演示:命令删除 Core(彻底删除) 方式2:图形界面创建Web控制台创建CoreWeb控制台删除 Core(未彻底…

C语言:详解操作符(上)

摘要: 本篇,我们将学习C语言中操作符的相关内容,操作符是C语言中重要的元素之一,在我们的代码中处处都有,下面我们将详细介绍操作符的相关内容,并结合一些代码例题加深印象。 目录 一、操作符的分类及介绍 …

【Matplotlib】figure方法之图形的保存

🎈个人主页:甜美的江 🎉欢迎 👍点赞✍评论⭐收藏 🤗收录专栏:matplotlib 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共同学习、交流进…

学成在线:媒体资源管理系统(MAM)

媒体资源管理系统(MAM) 媒体资源管理系统(Media Asset Management)是建立在多媒体、网络、数据库和数字存储等先进技术基础上的一个对各种媒体及内容进行数字化存储、管理以及应用的总体解决方案,可以满足媒体资源拥有者收集、保存、查找、编辑、发布各种信息的要求,为媒体资源…

css1文本属性

一.颜色(color)(一般用16进制) 二.对齐(text-align) 三.装饰(text-decoration) 四.缩进(text-indent)(一般用2em)(有单位)…

电商数据采集:选择爬虫工具还是第三方API?

电商商家最常唠叨的就是店铺运营难做。每日多平台店铺数据统计汇总繁琐耗时,人工效率偏低,且工作内容有限。 特别是眼下“618大促”将至,如何提高运营的效率和质量、保证产品及服务的良性运作,是电商企业急需解决的难题。 01 数…

thinkadmin的form.html表单例子

<style>textarea {width: 100%;height: 200px;padding: 10px;border: 1px solid #ccc

洗袜子的小型洗衣机哪种好?质量好的迷你洗衣机推荐

随着生活水平的提高&#xff0c;消费者对生活质量的要求也越来越高&#xff0c;越来越多的人开始追求更加舒适、干净的生活。在脚部保健方面&#xff0c;袜子往往是人们关注的重点。袜子洗衣机就是一种专门用于清洗袜子的洗衣机&#xff0c;可以将各种材质的袜子在短时间内进行…

Java设计模式 – 四大类型

设计模式 – 四大类型 创建型模式结构型模式行为型模式J2EE模式 设计模式&#xff08;Design pattern&#xff09;是重构解决方案 根据书Design Patterns – Elements of Reusable Object-Oriented Software&#xff08;中文译名&#xff1a;设计模式 – 可复用的面向对象软件元…

图论练习1

内容&#xff1a;&#xff0c;拆点&#xff0c;分层&#xff0c;传递&#xff0c;带限制的最小生成树 [HNOI2015]菜肴制作 题目链接 题目大意 有个限制&#xff0c;号菜肴在号前完成在满足限制的条件下&#xff0c;按照出菜( 是为了满足的限制 ) 解题思路 由限制&#xf…

Redis-缓存问题及解决方案

本文已收录于专栏 《中间件合集》 目录 概念说明缓存问题缓存击穿问题描述解决方案 缓存穿透问题描述解决方案 缓存雪崩问题描述解决方案提高缓存可用性过期时间配置熔断降级 总结提升 概念说明 Redis是一个开源的内存数据库&#xff0c;也可以用作缓存系统。它支持多种数据结构…

解锁MyBatis Plus的强大功能:学习高级操作与DML技巧!

MyBatisPlus 1&#xff0c;DML编程控制1.1 id生成策略控制知识点1&#xff1a;TableId1.1.1 环境构建1.1.2 代码演示AUTO策略步骤1:设置生成策略为AUTO步骤3:运行新增方法 INPUT策略步骤1:设置生成策略为INPUT步骤2:添加数据手动设置ID步骤3:运行新增方法 ASSIGN_ID策略步骤1:设…

海量数据处理商用短链接生成器平台 - 2

第二章 短链平台项目创建git代码管理开发分层规范 第1集 短链平台实战-Maven聚合工程创建微服务项目 **简介&#xff1a;Maven聚合工程创建微服务项目实战 ** Maven聚合工程拆分 dcloud-common 公共依赖包 dcloud-app FlinkKafka实时计算 dcloud-account 账号流量包微服务 dc…

一分钟了解电脑关机快捷键是什么!

在日常使用电脑的过程中&#xff0c;了解一些基本的快捷键是提高效率的关键之一。其中&#xff0c;电脑关机快捷键是一个方便且迅速的操作&#xff0c;使您可以在不用通过烦琐的菜单操作的情况下&#xff0c;快速关机电脑。在本文中&#xff0c;我们将探讨电脑关机快捷键是什么…

C++初阶:适合新手的手撕string类(模拟实现string类)

上次讲了常用的接口&#xff1a;C初阶&#xff1a;初识STL、String类接口详细讲解&#xff08;万字解析&#xff09; 今天就来进行模拟实现啦 文章目录 1.基本结构与文件规划2.构造函数&#xff08;constructor)2.1构造函数2.1.1无参有参分开2.1.2利用缺省参数合起来 2.2拷贝构…

Pyecharts炫酷散点图构建指南【第50篇—python:炫酷散点图】

文章目录 Pyecharts炫酷散点图构建指南引言安装Pyecharts基础散点图自定义散点图样式渐变散点图动态散点图高级标注散点图多系列散点图3D散点图时间轴散点图笛卡尔坐标系下的极坐标系散点图 总结&#xff1a; Pyecharts炫酷散点图构建指南 引言 在数据可视化领域&#xff0c;…

[C++]:15.继承

继承 一.继承&#xff1a;1.继承的概念和基本操作&#xff1a;1.概念&#xff1a;2.基本操作&#xff1a; 2.继承格式和多种继承方法&#xff1a;1.基本继承格式&#xff1a;2.继承关系访问限定符 3.子类对象和父类对象之间的赋值&#xff1a;1.为什么存在赋值兼容转换&#xf…

第十二篇【传奇开心果系列】Python的OpenCV技术点案例示例:视频流处理

传奇开心果短博文系列 系列短博文目录Python的OpenCV技术点案例示例短博文系列短博文目录一、前言二、视频流处理介绍三、实时视频流处理示例代码四、视频流分析示例代码五、归纳总结系列短博文目录 Python的OpenCV技术点案例示例短博文系列 短博文目录 一、前言 OpenCV视频…

程序报错无法打开源文件stdafx.h

在运行代码时&#xff0c;代码中头文件突然报错程序无法打开源文件stdafx.h include “stdafx.h”,编译器就说无法打开源文件&#xff0c;直接上干货解决方法是&#xff1a; 1.打开项目 ->项目属性&#xff08;最后一个&#xff09;-> C/C ->常规&#xff0c; 2在附…

【工作周志】240129-240204

本周学习了AXI相关的内容 AMBA &#xff08;Advanced Microcontroller Bus Architecture&#xff09; AXI &#xff08;Advanced eXtensible Interface&#xff09; ARM公司提出&#xff0c;AMBA3.0协议中重要组成部分&#xff0c;是一种面向高性能、高带宽、低延迟的片内总线…