【ES】--Elasticsearch DSL的简单查询

目录

  • 一、前言
  • 二、DSL的简单查询
    • 1、相关字段的设置
    • 2、match查询
    • 3、match_all查询
    • 4、term/terms等值查询
    • 5、wildcard、prefix、fuzzy查询
    • 6、正则(regexp)查询
    • 7、组合(bool)查询
    • 8、query_string查询
    • 9、match_phrase查询
    • 10、match_pharse_prefix查询
    • 11、match_bool_prefix查询
    • 12、multi_match查询
    • 13、range查询

一、前言

ES中常见的查询类型分为简单查询、复合查询、聚合查询等。这里基于这些查询进行详细的介绍。
Elasticsearch DSL的简单查询操作如下:

**term查询**:单词查询,在字段的倒排索引(发生分词)或者直接在字段值(未发生分词)中查找条件值,只要找到这个条件值就算匹配上,得分为1**terms查询**:多个单词查询,效果为 多个 term 或者的逻辑。
**match查询**:分词后搜索。比如分词后有N个分词,只要匹配上其中一个就可以返回数据。根据文档中实际存储的字段类型(是否为分词文本 text,keyword 不会进行分词),决定是否对条件值进行分词;若未分词,直接以条件值执行 term 查询;若分词,则对条件值进行,分词处理:
(a)若得到一个词,也是执行term查询
(b)若得到多个词,默认执行 terms 查询(多个单词 或者关系)
(c)也可以手动指定为“且”关系(为且,倒排索引后的词表中要包含 条件分词后的 所有单词),通过以下方式指定 match 单词之间的关系。默认operator是or。
**match_phrase**:不做分词,以当前条件值到文档字段中进行“连续且位置顺序一致的”文本匹配。
**match_pharse_prefix**:同样是以 条件不做分词到文档字段中查询,但是条件最后的 单词不是必须匹配字段内的完整单词。【只要是一个前缀包含的连续文本就能匹配】例如 文档字段为 i love you      查询条件为 i love yo
match_phrase下无法匹配,因为 文档中 you 是一个完整的单词;match_pharse_prefix 就可以匹配。
**match_bool_prefix**:条件进行分词,执行 bool > should 查询。前面的词 做 term 查询,最后一个词做 perfix 查询。
**match_all查询**:查询所有数据【一般测试使用】。
全文检索(full text)查询:利用分词器对文本内容分词,然后倒排索引匹配【例如match_query, multi_match_query】。
**multi_match查询**:将条件应用到多个文档字段上进行匹配。
**精确查询**:根据精确词条值查找数据,一般是查找keyword、数值、日期、boolean等类型字段【例如ids, range, term】。
**wildcard查询(通配符查询)**:通配符查询,支持*和?。*:匹配 0 个或多个任意字符?:匹配 1 个任意字符

二、DSL的简单查询

为了更好的去理解ES简单查询操作的结果情况,我们要思考一个问题:
(1)、在实际查询时,往往有的字段进行查询匹配,时常无法搜索到数据,ES搜索匹配到底受哪些因素影响

====为了说明更好的解释分析,需要相关字段进行mapping设置,具体结合字段的分词等属性,然后再结合简单查询操作,来有效分析查询结果。

1、相关字段的设置

knowledge_name字段
要查询的knowledge_name字段的ES设置属性如下

        "knowledge_name": {"type": "text","fields": {"keyword": {"type": "keyword","ignore_above": 256,"normalizer": "lowercase_normalizer"

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/701894.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蛇形矩阵3

题目描述 把数1,2,3,4,5,…,N*N按照“蛇形3”放入N*N矩阵的中,输出结果。 下面是N6的蛇形3的图示 输入格式 第一行1个正整数:N,范围在[1,100]。 输出格式 N行&#x…

Git笔记——3

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、合并模式和分支策略 二、bug分支 三、强制删除分支 四、创建远程仓库 五、克隆远程仓库_HTTPS和_SSH 克隆远程仓库_HTTPS 克隆远程仓库_SSH 六、向远程仓库…

【黑马程序员】3、TypeScript常用类型_黑马程序员前端TypeScript教程,TypeScript零基础入门到实战全套教程

课程地址:【黑马程序员前端TypeScript教程,TypeScript零基础入门到实战全套教程】 https://www.bilibili.com/video/BV14Z4y1u7pi/?share_sourcecopy_web&vd_sourceb1cb921b73fe3808550eaf2224d1c155 目录 3、TypeScript常用类型 3.1 类型注解 …

【统计分析数学模型】聚类分析: 系统聚类法

【统计分析数学模型】聚类分析: 系统聚类法 一、聚类分析1. 基本原理2. 距离的度量(1)变量的测量尺度(2)距离(3)R语言计算距离 三、聚类方法1. 系统聚类法2. K均值法 三、示例1. Q型聚类&#x…

四六级成绩爬取代码原创

在六级成绩刚发布时,只需要通过学生姓名和身份证号便可以查询到成绩 据此,我们可以利用selenium框架对学生的成绩进行爬取 首先我们要建立一个excel表格,里面放三列(多几列也无所谓),第一列列名取为学生姓…

阿里妈妈按关键字或网址搜索商品 API(alimama.item_search)

alimama.item_search API是用于在阿里妈妈广告平台上按关键字或网址搜索商品的。这个API可以帮助广告主在投放广告时,根据关键词找到相关的商品信息,以便更精准地定位广告受众。 要使用这个API,你需要遵循以下步骤: 注册阿里妈妈…

LeetCode 2433.找出前缀异或的原始数组

给你一个长度为 n 的 整数 数组 pref 。找出并返回满足下述条件且长度为 n 的数组 arr : pref[i] arr[0] ^ arr[1] ^ … ^ arr[i]. 注意 ^ 表示 按位异或(bitwise-xor)运算。 可以证明答案是 唯一 的。 示例 1: 输入&#xf…

亿级用户在线状态查询:Redis高效解决方案

在拥有10亿用户的场景中,使用UUID作为用户标识符来统计在线状态是一个很好的选择,因为它可以确保每个用户的唯一性。针对UUID和在线状态统计,结合Redis,您可以采用以下策略: 1. 使用Redis的哈希表(Hashes&…

Python世界之运算符

一、算术运算符 以下假设变量: a10,b20: 运算符 描述 实例 加 - 两个对象相加 a b 输出结果 30 - 减 - 得到负数或是一个数减去另一个数 a - b 输出结果 -10 * 乘 - 两个数相乘或是返回一个被重复若干次的字符串 a * b 输出结…

Seata Server 服务搭建

概述 Seata 分布式事务需要 Seata Seaver 支持,Seata Server在 架构中扮演着 事务管理器的角色。Seata 服务需要往 Nacos 注册中心注册、以及读取配置文件,因此 Seata 启动前需要部署 Nacos 环境。 安装包下载 下载地址: https://download.csdn.net/dow…

【《高性能 MySQL》摘录】第 2 章 MySQL 基准测试

文章目录 2.1 为什么需要基准测试2.2 基准测试的策略2.2.1 测试何种指标 2.3 基准测试方法2.3.1 设计和规划基准测试2.3.2 基准测试应该运行多长时间2.3.3 获取系统性能和状态2.3.4 获得准确的测试结果2.3.5 运行基准测试并分析结果2.3.6 绘图的重要性 2.4 基准测试工具…

SQL多个字段拼接组合成新字段的常用方法

在sql语句中,有时候我们可能需要将两个字段的值放在一起显示,因为他们通常是一起出现的,比如客户名称和客户编号,那我们就要将这两个字段拼接成一个字段。下面是几种常见的方法: 一、CONCAT()函数 SELECT CONCAT(col…

超参数优化

超参数优化 超参数是用于控制学习过程的不同参数值,对机器学习模型的性能有显著影响。例如,随机森林算法中的估计器数量、最大深度和分裂标准等。超参数优化是找到超参数值的正确组合,以便在合理的时间内实现数据最大性能的过程。这个过程在…

MATLAB环境下基于NLEO的算法的脑电EEG信号自发活动瞬态检测

自发脑电信号是一种非平稳性很强的随机信号。在传统的脑电信号处理中,较公认的处理方法大多是建立在假设脑电图是准平稳信号的基础上,即认为它可以分成若干段,每一段的过程基本平稳,但段上叠加着瞬态。瞬态信号是有别于背景节率&a…

Linux环境非root用户配置SSH免密登录,并解决登录仍提示输入密码

Linux环境非root用户配置SSH免密登录,并解决登录仍提示输入密码 ssh免密登录的简单理解 以A和B进行举例:A免密登录B (即在A服务器输入命令:ssh 非root用户名B的IP地址)可以直接免密码直接登录 A生成私钥和公钥&#…

爬虫工作量由小到大的思维转变---<第四十八章 Scrapy 的请求和follow问题>

前言: 有时,在爬取网页的时候,页面可能只能提取到对应的url,但是具体需要提取的信息需要到下一页(url)里面; 这时候,不要在中间件去requests请求去返回response; 用这个方法.... 正文: 在Scrapy框架内,如果你想从一个页面提取URL,然后跳转到这个URL以…

Linux平台下互换ESC和Caps Lock按键

目录 1.调试手段2.设置2.1.查看当前键盘布局2.2.修改配置2.3.重启或logout生效 3.查看按键映射表 参考资料 当使用Linux作为办公平台,设置映射。 如果在windows平台下使用Linux虚拟机,使用windows宿主平台的按键映射。 windows互换ESC和Caps Lock按键 刚…

【Activiti7系列】Activi7简介和基于Spring Boot整合Activiti7(流程设计器)

本文将介绍Activiti7基础概念及基于Spring Boot整合Activiti7(流程设计器)的具体步骤。 作者:后端小肥肠 1. 前言 在企业级应用中,业务流程的管理和执行是至关重要的一环。Activiti7是一个强大的开源工作流引擎,它提供了灵活的流程定义、任务…

【uni-app】生命周期

页面运行过程中,各个阶段的回调函数就是“生命周期钩子函数”。 uni-app 完整支持 Vue 实例的生命周期,同时还新增 应用生命周期 及 页面生命周期。 (1)应用生命周期 函数名说明onLaunch当uni-app 初始化完成时触发&#xff08…

argparse读取参数

用法argparseExample.py简单示例参考 用法 argparse是内置于python中,所以即为直接在命令行中对程序传入参数并让程序运行的便捷工具。具体步骤如下所示 导包,为import argparse创建一个ArugmentParser对象,随后一切都在这个对象里面操作&am…