ElasticSearch 倒排索引_08

倒排索引:是 es 中非常重要的索引结构,是从文档词项到文档 ID 的一个映射过程。

“正排索引”
我们在关系型数据库中见到的索引,就是“正排索引”。

关系型数据库中的索引如下,假设我有一个博客表:

id作者标题内容
1gblfy倒排索引标题具体内容xxx
2心灵之境es中文分词器标题具体内容xxx

一般为了提高查询效率查会给id或者标题添加索引。换句话说我们可以针对这个表建立索引(正排索引):

索引内容
1具体内容xxx
2具体内容xxx
倒排索引标题具体内容xxx
es中文分词器标题具体内容xxx

以上就是以id和标题创建的4个索引
当我们通过 id 或者标题去搜索文章时,就可以快速搜到。

但是,如果我们按照文章内容的关键字去搜索,就只能去内容中做字符匹配了(select * from 表 where 字段 like ‘%关键词%’)。为了提高查询效率,就要考虑使用倒排索引。

倒排索引
倒排索引:就是以内容的关键字建立索引,通过索引找到文档 id,再进而找到整个文档。

索引文档id=1文档id=2
java
es
gblfy

一般来说,倒排索引分为两个部分:

  • 单词词典(记录所有的文档词项,以及词项到倒排列表的关联关系(例如:上面的表格))
  • 倒排列表(记录单词与对应的关系,由一系列倒排索引项组成,倒排索引项指:文档 id、词频(TF)(词项在文档中出现的次数,评分时使用)、位置(Position,词项在文档中分词的位置)、偏移(记录词项开始和结束的位置))
    当我们去索引一个文档时,就回建立倒排索引,搜索时,直接根据倒排索引搜索。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/516437.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2020年软件工程现状:Python或将成为第一大编程语言,中国开源涨势最猛

云栖号资讯:【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 现在,是时候谈一谈 2020 年及以后的软件工程状况了。本文以 GitHub Octoverse 数据为基础,加上我作为…

JavaScript从入门到放弃 -(七)ES6

目录 1. ES6相关概念1.1 什么是 ES6 ?1.2 为什么使用 ES6 ?2 ES6新增语法2.1 新增关键字2.1.1 let 关键字小结2.1.2 const 关键字小结2.1.3 let、const、var 的区别2.2 解构赋值2.2.1 数组解构2.2.2 对象解构小结2.3 箭头函数2.3.1 语法规范2.3.2 箭头函数的调用2.3.3 this关…

ElasticSearch 动态映射与静态映射_08

映射就是 Mapping,它用来定义一个文档以及文档所包含的字段该如何被存储和索引。所以,它其实有点类似于关系型数据库中表的定义。 映射分类 动态映射 顾名思义,就是自动创建出来的映射。es 根据存入的文档,自动分析出来文档中字…

解密阿里云大规模深度学习性能优化实践

云栖号资讯:【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 作者 | 阿里云异构计算AI加速负责人 游亮 近日,斯坦福大学公布了最新的 DAWNBench 深度学习榜单,这是…

深夜,我偷听到程序员要对session下手......

来源 | 编程技术宇宙责编 | Jerry我是一个web服务器我是一个web服务器,我的工作是给人类提供上网服务,我每天要为数以万计的人提供网页浏览服务。已经是深夜了,我还在和手下几个兄弟为了一件事紧张讨论着。“老大,现在咱们每天处理…

太平鸟上云 推动中国服饰行业新零售转型

云栖号案例库:【点击查看更多上云案例】 不知道怎么上云?看云栖号案例库,了解不同行业不同发展阶段的上云方案,助力你上云决策! 在消费增速下滑的大环境下,转型焦虑几乎已经弥漫了整个服饰行业,…

前端知识点随记

(前端笔记补充,备忘录使用。) 1. HTML/CSS/H5C3 知识点1.1 鼠标样式|十字|1.2 css 半透明样式1.3 CSS3 transform 属性1.3.1 旋转1.3.2 缩放1.4 特殊写法 \91.5 解决video标签在谷歌不能自动播放1.6 \ 标签- 提示文字1.7 placeholder-自定义占位文本1.8 去除 input 默认边框…

Typora 常用技巧

文章目录1. 引用样式2. 插入表格3. 图片设置1. 引用样式 输入>按tab键 流程 默认样式: blockquote {border-left: 4px solid #dfe2e5;padding: 0 15px;color: #777777; }修改后样式 blockquote {border-left: 4px solid #62ca38!important;background:#f…

海升集团数据上云 走出智能农业的新路子

云栖号案例库:【点击查看更多上云案例】 不知道怎么上云?看云栖号案例库,了解不同行业不同发展阶段的上云方案,助力你上云决策! 尽管最近水果的价格持续上涨,但水果消费的需求和市场始终在快速提升。墨西哥…

干货!一文看Doris在作业帮实时数仓中的应用实践

数据驱动未来。在大数据生态中,数据分析系统在数据创造价值过程中起着非常关键的作用,直接影响业务决策效率以及决策质量。Apache Doris作为一款支持对海量大数据进行快速分析的MPP数据库,在数据分析领域有着简单易用、高性能等优点。9月20日…

拿下 Gartner 容器产品第一,阿里云打赢云原生关键一战

云栖号资讯:【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 近日,Gartner 发布 2020 年公共云容器报告,据报告显示,阿里云和 AWS 拥有最丰富的产品布局…

vscode中 解决格式化后将单引号变双引号

场景:开发时,明明写的是双引号,可格式化后就所有变双引号了…javascript 解决方案: 进入用户设置,在setting.json中添加以下: "prettier.semi": true,"prettier.singleQuote": true,// 是否在末尾添加分号 "pretti…

训练机器人看脸读“心”,真的靠谱吗?

云栖号资讯:【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 虽然人工智能公司极力推广人脸情绪识别软件,但是心理学家却在质疑情绪识别只是说起来容易。 数百张人脸在屏幕上…

原生JavaScript轮播图效果实现

原生JavaScript实现轮播图切换效果的实现过程 本文所用代码仅供个人学习。此部分代码系按原腾讯电脑管家首页的轮播图效果,采用原生JS技术予以实现(原网页采用jQurey等技术)。1. 文件准备1.1 新建文件夹1.2 HTML结构1.3 CSS样式1.4 JavaScript外部文件准备1.4.1 新建js文件2…

核弹级漏洞 Apache Log4j2 漏洞详情和修复建议

文章目录一、. 普通web项目1. 下载依赖2. 解压3.更新操作4.移除旧依赖5. 更新包二. maven项目修复2.1. maven 项目2.2. 微服务项目一、. 普通web项目 下载官网:https://logging.apache.org/log4j/2.x/download.html 1. 下载依赖 wget https://dlcdn.apache.org/l…

VMware发布Project Monterey

全球领先的企业软件创新者VMware(NYSE:VMW) 今天在VMworld 2020大会上发布Project Monterey。这一技术预览聚焦于提升数据中心、云和边缘架构,从而满足新一代应用不断变化的各种需求,包括AI、机器学习和5G应用。VMware…

阿里云推出高效病毒基因序列检索功能,它的底层逻辑原来是这样的

1.背景介绍 2019年年底,中国的新兴的商业中心武汉,爆发了一种新型的冠状病毒,在流行的两个多月中,在中国造成了3300多人死亡,8万2千多人感染。随着疫情的进一步蔓延,目前已经横跨了109个国家,造…

前端_网页编程 WebAPI_01

01 - Web API 1.1. Web API介绍 1.1.1 API的概念 API(Application Programming Interface,应用程序编程接口)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,无需理解其内部工作机制细节,只需直接调用使…

新基建与智慧城市相遇 会碰撞出什么样的“火花”?

云栖号资讯:【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 近期,新基建被政府、民间、资本广泛看好,各省市相继公布投资计划,最终的数据或许会远超34…

max file descriptors [4096] for elasticsearch process is too low, increase to at least [65535]

安装elasticsearch报错如下: 增加资源分配,资源分配不够进程会自动关闭服务 vim /etc/security/limits.conf* soft nofile 65536 * hard nofile 131072 * soft nproc 2048 * hard nproc 4096