【文档数据库】ES和MongoDB的对比

目录

1.由文档存储牵出的问题

2.什么是MongoDB?

3.ES和MongoDB的对比


1.由文档存储牵出的问题

本文或者说关于mongodb的这个系列文章的源头:

前面我们聊过了分布式链路追踪系统,在基于日志实现的分布式链路追踪的方式seluth+zipkin中为了防止数据丢失,需要将数据持久化。我们给出的是持久化进mysql中的示例。

【JAVA】分布式链路追踪技术概论-CSDN博客

https://bugman.blog.csdn.net/article/details/135258207?spm=1001.2014.3001.5502

后面我们发现存放日志以及需要进行后期统计这个场景来说的话关系型数据库是不合适的,于是引出了用ES系列:

https://bugman.blog.csdn.net/article/details/135342256?spm=1001.2014.3001.5502

https://bugman.blog.csdn.net/article/details/135425284?spm=1001.2014.3001.5502

https://bugman.blog.csdn.net/article/details/135515805?spm=1001.2014.3001.5502

https://bugman.blog.csdn.net/article/details/135581380?spm=1001.2014.3001.5502

聊完ES后,这时候我们难免就避不开mongodb这个热门的文档数据库,什么是MongoDB,MongoDB的核心概念,ES和MongoDB的对比,将会是本文的核心内容。

2.什么是MongoDB?

MongoDB(由“Humongous Database”缩写而来)是一种开源的、面向文档的 NoSQL 数据库系统,自4.0版本开始支持ACID。它在设计上采用了分布式文件存储的思想,适用于大规模数据的存储和处理。

说的直白点,MongoDB在设计的时候就是冲着解决海量文档的存储来的。

mongodb的架构如下:

database(数据库):数据库是一个仓库,里面可以存放集合。

collection(集合):类似于数组,可以在集合中存放文档。

document(文档):mongodb最小的单位,我们存储和操作的内容都是文档。

数据库类比数据库,集合类比表,文档类比一条数据。

数据库和集合都不需要我们手动创建,当我们创建文档时,文档所在的数据库或者集合不存在,会自动创建数据库和集合。

mongodb的数据结构:

MongoDB的数据结构是其用来应对海量文档存储的核心,其是以类JSON的方式来存储数据,也就是BSON。BSON是二进制的,这样做的目的是为了增强存储能力,具体的细节后文说。先来看看JSON和BSON的比较:

假设我们有如下的 JSON 对象,用于描述一个人的基本信息:

这个 JSON 对象包含了一些基本的数据类型,如字符串、数字、布尔值、对象和数组。

{
  "name": "John Doe",
  "age": 30,
  "isStudent": false,
  "birthday": "1990-01-01",
  "address": {
    "street": "123 Main St",
    "city": "Anytown"
  },
  "hobbies": ["reading", "cycling"]
}

现在,我们将同样的数据转换为 BSON 格式。在 BSON 中,我们可以使用一些 JSON 中不存在的数据类型。以下是 BSON 版本的同一数据,包含一些 BSON 特有的字段(请注意,这是概念性的表示,因为 BSON 实际上是二进制格式,无法以纯文本形式直观展示):

{
  "name": "John Doe",                // 字符串
  "age": Int32(30),                  // 32位整数
  "isStudent": false,                // 布尔值
  "birthday": ISODate("1990-01-01"), // 日期类型
  "address": {                       // 嵌套文档
    "street": "123 Main St",
    "city": "Anytown"
  },
  "hobbies": ["reading", "cycling"]// 数组
}

在这个 BSON 示例中,我们可以看到一些与 JSON最大的不同就是其数据是有类型的,BSON最是二进制的,有类型声明这样能准确的从二进制里解析出准确的值来,从而避免了还要转一遍的这种解析过程。所有我们可以看到BSON是很适合用来进行文档存储的,二进制化后减小了原始数据的体积,又由于有类型的存在,能直接读出来,又很适合检索。

3.ES和MongoDB的对比

其实到这里很多人都会有疑惑,ES和MongoDB都能存储海量文档,都支持文档的搜索,很多功能上都是高度重合的,那为什么会出现如此相似的两个东西?他们各自的应用场景有什么不同?

首先我们要知道:

ES的核心是冲着全文检索去的,MongoDB的核心是冲着文档存储去的。

全文搜索和文档存储在某种程度上可以被视为对立的或至少是有着不同优化方向的技术,也就是说二者是不能相互兼顾的,只能二选一。

  1. 全文搜索的特点:

    • 全文搜索的核心在于能够快速有效地检索出包含特定词汇或词组的文档。
    • 为此,搜索引擎(如 Elasticsearch)建立复杂的索引来存储每个词汇的出现位置、频率等信息。
    • 这些索引通常需要快速访问,因此搜索引擎可能会牺牲一些存储效率来提高读取速度。
  2. 文档存储的特点:

    • 文档存储(如 MongoDB)主要关注于存储和查询结构化或半结构化数据。
    • 这些系统可能采用不同的存储优化技术,如数据压缩、分片等,以提高存储效率和处理大量数据的能力。
    • 文档数据库的索引通常不是为了全文搜索设计的,而是为了快速查找特定字段或数据结构。
  3. 优化方向的差异:

    • 全文搜索引擎的设计重点在于最大化检索效率,特别是在处理大量文本数据时的搜索性能。
    • 文档数据库则更侧重于数据的灵活性、存储效率和结构化查询的性能。

OK,到这里其实我们就已经知道了ES和MongoDB最核心的区别了,也就不会疑惑。也可以得出:

es拥有更细粒度的查询能力,也就是能对全文进行各种检索,但在文档的存储上要差一点。

MongoDB在文档的存储上更优秀,适合存储海量文档,但是只支持简单的文档搜索,而不是全文检索。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/631239.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql常见的需求,对于关键字的使用

如何使用MySQL将列数据转化为逗号分隔的形式。我们可以使用内置函数GROUP_CONCAT()来实现这个功能 如何使用MySQL将列数据转化为逗号分隔的形式。我们可以使用内置函数GROUP_CONCAT()来实现这个功能,也可以根据实际需求自定义一个函数。这种技术在一些需要对数据进…

Qlib+backtrader:2014.1.1-2023.9.20最新回测结果,可以实盘吗?

今年以来,在研究了qlib和backtrader的基础上,把二者结合起来进行了一个策略研究。简单说就是用qlib在200只股票的股票池中进行滚动训练与预测(walk forward),总体数据范围是2005到2023年,以20日间隔滚动训练…

寒假冬令营(算法编程)

1月18日(二分) 题目描述(一) 278. 第一个错误的版本 你是产品经理,目前正在带领一个团队开发新的产品。不幸的是,你的产品的最新版本没有通过质量检测。由于每个版本都是基于之前的版本开发的&#xff0…

OpenGL:关于纹理映射时任意四边形中的插值问题(二)

OpenGL:关于纹理映射时任意四边形中的插值问题-CSDN博客 上次是使用逆双线性插值的方法解决四边形纹理映射时产生的折痕问题。 其实也有点问题,就是双线性插值会使得纹理产生一点扭曲。 不是投影的效果。 想达到纹理投影的效果,可以使用透…

CentOS查看修改时间

经常玩docker的朋友应该都知道,有很多的镜像运行起来后,发现容器里的系统时间不对,一般是晚被北京时间8个小时(不一定)。 这里合理怀疑是镜像给的初始时区是世界标准时间(也叫协调世界时间)。 有…

C++ 之LeetCode刷题记录(十二)

😄😊😆😃😄😊😆😃 开始cpp刷题之旅。 依旧是追求耗时0s的一天。 69. x 的平方根 示例 1: 输入:x 4 输出:2 示例 2: 输入&#x…

品牌全球化:关于跨界合作的探索与解析

在全球化的时代背景下,品牌出海已经成为企业发展的重要战略之一。然而,面对文化差异、市场竞争和消费者需求等多重挑战,品牌如何成功地打入海外市场,是许多企业面临的难题。跨界合作作为一种新兴的商业模式,正逐渐成为…

一、Flask学习之HTML

一、Flask学习之HTML 1.运行简单页面 首先需要搭建环境: pip install flaskfrom flask import Flaskapp Flask(__name__)# 创建了网址 /show/info 和函数index之间的对应关系,以后用户在浏览器上访问/show/info,网站自动执行index函数 ap…

POI和EasyExcel学习

1.POI 1.1POI简介 在Java中,POI是指Apache POI(Poor Obfuscation Implementation),它是一个开源的Java库,用于处理Microsoft Office文档格式文件,如Excel、Word、PowerPoint等。POI提供了一组API&#xf…

如何在CentOS下使用Docker部署Halo博客网站并结合内网穿透远程访问

文章目录 ⛳️ 推荐1. Docker部署Halo1.1 检查Docker版本如果未安装Docker可参考已安装Docker步骤:1.2 在Docker中部署Halo 2. Linux安装Cpolar2.1 打开服务器防火墙2.2 安装cpolar内网穿透 3. 配置Halo个人博客公网地址4. 固定Halo公网地址 ⛳️ 推荐 前些天发现了…

记一次 .NET某道闸收费系统 内存溢出分析

一:背景 1. 讲故事 前些天有位朋友找到我,说他的程序几天内存就要爆一次,不知道咋回事,找不出原因,让我帮忙看一下,这种问题分析dump是最简单粗暴了,拿到dump后接下来就是一顿分析。 二&…

Openwrt 下动态路由协议(quagga-OSPF)配置与验证

文章目录 前言网络拓扑静态路由方式动态路由方式Openwrt下 Quagga 安装Quagga 配置R1路由器zebra配置R1路由器ospf配置R2路由器zebra配置R2路由器ospf配置OSPF协议分析REF本文将在两台openwrt系统上安装配置quagga, 搭建一套完整环境,来验证OSPF动态路由的基本功能和实际效果,…

面经-redis缓存

什么是Redis Redis(Remote Dictionary Server)键只能为字符串,值:字符串、列表、集合、散列表、有序集合。Redis 用来做分布式锁。支持事务 、持久化、LUA脚本、LRU驱动事件、多种集群方案。 Redis为什么这么快 完全基于内存,数据结构简单…

深度学习记录--正则化(regularization)

什么是正则化? 正则化(regularization)是一种实用的减少方差(variance)的方法,也即避免过度拟合 几种正则化的方法 L2正则化 又被称为权重衰减(weight dacay) 在成本函数中加上正则项: 其中 由于在w的更新过程中会递减,即权…

2024年继续看好英伟达的两个理由

来源:猛兽财经 作者:猛兽财经 2023年是英伟达业务爆发式增长的一年 2023年可以说是英伟达成立近30年以来最好的一年。由于大语言模型带动的训练和推理算力需求的增加,导致市场对英伟达AI芯片(H100、A100等)和HGX平台的采购需求也出现了飙升…

鸿蒙Harmony-页面路由(router)详解

慢慢理解世界,慢慢更新自己,希望你的每一个昨天,今天,和明天都会很快乐,你知道的,先好起来的从来都不是生活,而是你自己 目录 一,定义 二,页面跳转 2.1使用router.pushU…

【Java】HttpServlet类中前后端交互三种方式(query string、form表单、JSON字符串)

在前后端的交互中,前端通过以下三种方式来与后端进行交互🌟 ✅query string ✅form表单 ✅JSON字符串 下面我们将书写这三种方式的后端代码并进行讲解 1、Query String QueryString即在url中写入键值对,一般用doGet方法进行交互 代码如下 …

2018年认证杯SPSSPRO杯数学建模D题(第一阶段)投篮的最佳出手点全过程文档及程序

2018年认证杯SPSSPRO杯数学建模 对于投篮最佳出手点的探究 D题 投篮的最佳出手点 原题再现: 影响投篮命中率的因素不仅仅有出手角度、球感、出手速度,还有出手点的选择。规范的投篮动作包含两膝微屈、重心落在两脚掌上、下肢蹬地发力、身体随之向前上…

H3C校园网双出口配置

H3C校园网双出口配置 🏆荣誉认证:51CTO博客专家博主、TOP红人、明日之星;阿里云开发者社区专家博主、技术博主、星级博主。 💻微信公众号:微笑的段嘉许 📌本文由微笑的段嘉许原创! &#x1f389…

服务器推送数据你还在用 WebSocket么?

当涉及到推送数据时,人们首先会想到 WebSocket。 的确,WebSocket 允许双向通信,可以自然地用于服务器到浏览器的消息推送。 然而,如果只需要单向的消息推送,HTTP 通过服务器发送的事件也有这种功能。 WebSocket 的通信过程如下: 首先,通过 HTTP 切换协议。服务器返回 101 状…