【Elasticsearch】 Intervals Query

Elasticsearch Intervals Query

返回基于匹配术语的顺序和接近度的文档。

intervals 查询使用 匹配规则,这些规则由一小组定义构建而成。这些规则然后应用于指定 field 中的术语。

这些定义生成覆盖文本中术语的最小间隔序列。这些间隔可以进一步由父源组合和过滤。

以下 intervals 查询返回包含 my favorite food(没有任何间隔),后跟 hot watercold porridge 的文档。查询应用于 my_text 字段。

这个查询将匹配 my_text 值为 my favorite food is cold porridge,但不匹配 when it's cold my favorite food is porridge

JSON复制

POST _search
{"query": {"intervals" : {"my_text" : {"all_of" : {"ordered" : true,"intervals" : [{"match" : {"query" : "my favorite food","max_gaps" : 0,"ordered" : true}},{"any_of" : {"intervals" : [{ "match" : { "query" : "hot water" } },{ "match" : { "query" : "cold porridge" } }]}}]}}}}
}

Intervals 查询的顶级参数

<field>

(必需,规则对象)您希望搜索的字段。

此参数的值是一个规则对象,用于基于匹配术语、顺序和接近度匹配文档。

有效的规则包括:

  • match

  • prefix

  • wildcard

  • regexp

  • fuzzy

  • range

  • all_of

  • any_of

match 规则参数

match 规则匹配分析过的文本。

  • query

    • (必需,字符串)您希望在提供的 <field> 中找到的文本。

  • max_gaps

    • (可选,整数)匹配术语之间的最大位置数。超过此距离的术语不被视为匹配。默认值为 -1

    • 如果未指定或设置为 -1,则匹配没有宽度限制。如果设置为 0,术语必须相邻。

  • ordered

    • (可选,布尔值)如果为 true,匹配术语必须按指定顺序出现。默认值为 false

  • analyzer

    • (可选,字符串)用于分析 query 中术语的分析器。默认值为顶级 <field> 的分析器。

  • filter

    • (可选,间隔过滤规则对象)可选的间隔过滤器。

  • use_field

    • (可选,字符串)如果指定,则从此字段匹配间隔,而不是顶级 <field>。术语使用此字段的搜索分析器进行分析。这允许您跨多个字段进行搜索,就像它们是同一个字段一样;例如,您可以将相同的文本索引到词干和非词干字段中,并搜索词干标记附近的非词干标记。

prefix 规则参数

prefix 规则匹配以指定字符集开头的术语。此前缀可以扩展以匹配最多 indices.query.bool.max_clause_count 搜索设置术语。如果前缀匹配更多术语,Elasticsearch 将返回错误。您可以在字段映射中使用 index-prefixes 选项来避免此限制。

  • prefix

    • (必需,字符串)您希望在顶级 <field> 中找到的术语的起始字符。

  • analyzer

    • (可选,字符串)用于规范化 prefix 的分析器。默认值为顶级 <field> 的分析器。

  • use_field

    • (可选,字符串)如果指定,则从此字段匹配间隔,而不是顶级 <field>

wildcard 规则参数

wildcard 规则使用通配符模式匹配术语。此模式可以扩展以匹配最多 indices.query.bool.max_clause_count 搜索设置术语。如果模式匹配更多术语,Elasticsearch 将返回错误。

  • pattern

    • (必需,字符串)用于查找匹配术语的通配符模式。

    • 此参数支持两个通配符操作符:

      • ?,匹配任何单个字符

      • *,匹配零个或多个字符,包括空字符

  • analyzer

    • (可选,字符串)用于规范化 pattern 的分析器。默认值为顶级 <field> 的分析器。

  • use_field

    • (可选,字符串)如果指定,则从此字段匹配间隔,而不是顶级 <field>

regexp 规则参数

regexp 规则使用正则表达式模式匹配术语。此模式可以扩展以匹配最多 indices.query.bool.max_clause_count 搜索设置术语。如果模式匹配更多术语,Elasticsearch 将返回错误。

  • pattern

    • (必需,字符串)用于查找匹配术语的正则表达式模式。

    • 避免使用通配符模式,如 .*.*?+。这可能会增加找到匹配术语所需的迭代次数,并降低搜索性能。

  • analyzer

    • (可选,字符串)用于规范化 pattern 的分析器。默认值为顶级 <field> 的分析器。

  • use_field

    • (可选,字符串)如果指定,则从此字段匹配间隔,而不是顶级 <field>

fuzzy 规则参数

fuzzy 规则匹配与提供的术语相似的术语,编辑距离由 Fuzziness 定义。如果模糊扩展匹配的术语超过 indices.query.bool.max_clause_count 搜索设置术语,Elasticsearch 将返回错误。

  • term

    • (必需,字符串)要匹配的术语。

  • prefix_length

    • (可选,整数)创建扩展时保持不变的起始字符数。默认值为 0

  • transpositions

    • (可选,布尔值)指示编辑是否包括两个相邻字符的换位(ab → ba)。默认值为 true

  • fuzziness

    • (可选,字符串)允许匹配的最大编辑距离。参见 Fuzziness 以获取有效值和更多信息。默认值为 auto

  • analyzer

    • (可选,字符串)用于规范化 term 的分析器。默认值为顶级 <field> 的分析器。

  • use_field

    • (可选,字符串)如果指定,则从此字段匹配间隔,而不是顶级 <field>

range 规则参数

range 规则匹配包含在提供范围内的术语。此范围可以扩展以匹配最多 indices.query.bool.max_clause_count 搜索设置术语。如果范围匹配更多术语,Elasticsearch 将返回错误。

  • gt

    • (可选,字符串)大于:匹配大于提供术语的术语。

  • gte

    • (可选,字符串)大于或等于:匹配大于或等于提供术语的术语。

  • lt

    • (可选,字符串)小于:匹配小于提供术语的术语。

  • lte

    • (可选,字符串)小于或等于:匹配小于或等于提供术语的术语。

all_of 规则参数

all_of 规则返回跨多个其他规则组合的匹配项。

  • intervals

    • (必需,规则对象数组)要组合的规则数组。所有规则必须在文档中生成匹配项,整体源才能匹配。

  • max_gaps

    • (可选,整数)匹配术语之间的最大位置数。规则生成的间隔超过此距离的不被视为匹配。默认值为 -1

  • ordered

    • (可选,布尔值)如果为 true,规则生成的间隔应按指定顺序出现。默认值为 false

  • filter

    • (可选,间隔过滤规则对象)用于过滤返回间隔的规则。

any_of 规则参数

any_of 规则返回其子规则生成的任何间隔。

  • intervals

    • (必需,规则对象数组)要匹配的规则数组。

  • filter

    • (可选,间隔过滤规则对象)用于过滤返回间隔的规则。

filter 规则参数

filter 规则基于查询返回间隔。有关示例,请参见过滤器示例。

  • after

    • (可选,查询对象)返回跟随 filter 规则间隔的间隔的查询。

  • before

    • (可选,查询对象)返回在 filter 规则间隔之前发生的间隔的查询。

  • contained_by

    • (可选,查询对象)返回被 filter 规则间隔包含的间隔的查询。

  • containing

    • (可选,查询对象)返回包含 filter 规则间隔的间隔的查询。

  • not_contained_by

    • (可选,查询对象)返回不被 filter 规则间隔包含的间隔的查询。

  • not_containing

    • (可选,查询对象)返回不包含 filter 规则间隔的间隔的查询。

  • not_overlapping

    • (可选,查询对象)返回不与 filter 规则间隔重叠的间隔的查询。

  • overlapping

    • (可选,查询对象)返回与 filter 规则间隔重叠的间隔的查询。

  • script

    • (可选,脚本对象)返回匹配文档的脚本。此脚本必须返回布尔值 truefalse

示例

以下查询包含一个 filter 规则。它返回包含 hotporridge 且两者之间不超过 10 个位置的文档,且两者之间没有 salty

JSON复制

POST _search
{"query": {"intervals" : {"my_text" : {"match" : {"query" : "hot porridge","max_gaps" : 10,"filter" : {"not_containing" : {"match" : {"query" : "salty"}}}}}}}
}

脚本过滤器

您可以使用脚本根据间隔的起始位置、结束位置和内部间隔数过滤间隔。以下 filter 脚本使用 interval 变量及其 startendgaps 方法:

JSON复制

POST _search
{"query": {"intervals" : {"my_text" : {"match" : {"query" : "hot porridge","filter" : {"script" : {"source" : "interval.start > 10 && interval.end < 20 && interval.gaps == 0"}}}}}}
}

注意事项

  • 最小化间隔

    • intervals 查询始终最小化间隔,以确保查询可以在线性时间内运行。这有时会导致意外结果,特别是在使用 max_gaps 限制或过滤器时。例如,考虑以下查询,搜索 hot porridge 中包含的 salty

    JSON复制

    POST _search
    {"query": {"intervals" : {"my_text" : {"match" : {"query" : "salty","filter" : {"contained_by" : {"match" : {"query" : "hot porridge"}}}}}}}
    }
    • 此查询不会匹配包含 hot porridge is salty porridge 的文档,因为 hot porridge 的匹配查询返回的间隔仅覆盖此文档中的前两个术语,这些术语不与覆盖 salty 的间隔重叠。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/894144.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HarmonyOS DevEco Studio模拟器点击运行没有反应的解决方法

HarmonyOS DevEco Studio模拟器点击运行没有反应的解决方法 翻遍了CSDN&#xff0c;试了所有办法都没办法&#xff0c;最后偶然间竟然解决了 解决方法其实很简单&#xff1a;本地模拟器下载路径下面不能有中文。。。。。 切换正确路径以后&#xff0c;成功运行&#xff0c;哦…

删除数组中的重复项(leetcode刷题)

题目描述&#xff1a; 给你一个 非严格递增排列 的数组 nums &#xff0c;请你 原地 删除重复出现的元素&#xff0c;使每个元素 只出现一次 &#xff0c;返回删除后数组的新长度。元素的 相对顺序 应该保持 一致 。然后返回 nums 中唯一元素的个数。 考虑 nums 的唯一元素的…

单片机基础模块学习——超声波传感器

一、超声波原理 左边发射超声波信号&#xff0c;右边接收超声波信号 左边的芯片用来处理超声波发射信号&#xff0c;中间的芯片用来处理接收的超声波信号 二、超声波原理图 T——transmit 发送R——Recieve 接收 U18芯片对输入的N_A1信号进行放大&#xff0c;然后输入给超声…

MySQL(高级特性篇) 14 章——MySQL事务日志

事务有4种特性&#xff1a;原子性、一致性、隔离性和持久性 事务的隔离性由锁机制实现事务的原子性、一致性和持久性由事务的redo日志和undo日志来保证&#xff08;1&#xff09;REDO LOG称为重做日志&#xff0c;用来保证事务的持久性&#xff08;2&#xff09;UNDO LOG称为回…

AI在自动化测试中的伦理挑战

在软件测试领域&#xff0c;人工智能&#xff08;AI&#xff09;已经不再是遥不可及的未来技术&#xff0c;而是正在深刻影响着测试过程的现实力量。尤其是在自动化测试领域&#xff0c;AI通过加速测试脚本生成、自动化缺陷检测、测试数据生成等功能&#xff0c;极大提升了测试…

实验一---典型环节及其阶跃响应---自动控制原理实验课

一 实验目的 1.掌握典型环节阶跃响应分析的基本原理和一般方法。 2. 掌握MATLAB编程分析阶跃响应方法。 二 实验仪器 1. 计算机 2. MATLAB软件 三 实验内容及步骤 利用MATLAB中Simulink模块构建下述典型一阶系统的模拟电路并测量其在阶跃响应。 1.比例环节的模拟电路 提…

【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】1.25 视觉风暴:NumPy驱动数据可视化

1.25 视觉风暴&#xff1a;NumPy驱动数据可视化 目录 #mermaid-svg-i3nKPm64ZuQ9UcNI {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-i3nKPm64ZuQ9UcNI .error-icon{fill:#552222;}#mermaid-svg-i3nKPm64ZuQ9UcNI …

指针(C语言)从0到1掌握指针,为后续学习c++打下基础

目录 一&#xff0c;指针 二&#xff0c;内存地址和指针 1&#xff0c;什么是内存地址 2&#xff0c;指针在不同系统下所占内存 三&#xff0c;指针的声明和初始化以及类型 1,指针的声明 2,指针 的初始化 1&#xff0c; 初始化方式优点及适用场景 4,指针的声明初始化类型…

【已解决】windows7虚拟机安装VMtools频繁报错

为了在虚拟机VMware中安装win7&#xff0c;题主先在网上下载了windows7 professional版本的镜像&#xff0c;在vmware中安装vmtools时报错&#xff0c;信息如下 &#xff08;安装程序无法继续&#xff0c;本程序需要您将此虚拟机上安装的操作系统更新到SP1&#xff09; 然后就…

单词翻转(信息学奥赛一本通1144)

题目来源 信息学奥赛一本通&#xff08;C版&#xff09;在线评测系统 题目描述 1144&#xff1a;单词翻转 时间限制: 1000 ms 内存限制: 65536 KB 提交数:60098 通过数: 26099 【题目描述】 输入一个句子(一行)&#xff0c;将句子中的每一个单词翻转后输出。 【输入…

从0到1:C++ 开启游戏开发奇幻之旅(二)

目录 游戏开发核心组件设计 游戏循环 游戏对象管理 碰撞检测 人工智能&#xff08;AI&#xff09; 与物理引擎 人工智能 物理引擎 性能优化技巧 内存管理优化 多线程处理 实战案例&#xff1a;开发一个简单的 2D 射击游戏 项目结构设计 代码实现 总结与展望 游戏…

【Block总结】DynamicFilter,动态滤波器降低计算复杂度,替换传统的MHSA|即插即用

论文信息 标题: FFT-based Dynamic Token Mixer for Vision 论文链接: https://arxiv.org/pdf/2303.03932 关键词: 深度学习、计算机视觉、对象检测、分割 GitHub链接: https://github.com/okojoalg/dfformer 创新点 本论文提出了一种新的标记混合器&#xff08;token mix…

(done) MIT6.S081 2023 学习笔记 (Day6: LAB5 COW Fork)

网页&#xff1a;https://pdos.csail.mit.edu/6.S081/2023/labs/cow.html 任务1&#xff1a;Implement copy-on-write fork(hard) (完成) 现实中的问题如下&#xff1a; xv6中的fork()系统调用会将父进程的用户空间内存全部复制到子进程中。如果父进程很大&#xff0c;复制过程…

鸢尾花书01---基本介绍和Jupyterlab的上手

文章目录 1.致谢和推荐2.py和.ipynb区别3.Jupyterlab的上手3.1入口3.2页面展示3.3相关键介绍3.4代码的运行3.5重命名3.6latex和markdown说明 1.致谢和推荐 这个系列是关于一套书籍&#xff0c;结合了python和数学&#xff0c;机器学习等等相关的理论&#xff0c;总结的7本书籍…

【愚公系列】《循序渐进Vue.js 3.x前端开发实践》033-响应式编程的原理及在Vue中的应用

标题详情作者简介愚公搬代码头衔华为云特约编辑&#xff0c;华为云云享专家&#xff0c;华为开发者专家&#xff0c;华为产品云测专家&#xff0c;CSDN博客专家&#xff0c;CSDN商业化专家&#xff0c;阿里云专家博主&#xff0c;阿里云签约作者&#xff0c;腾讯云优秀博主&…

【javaweb项目idea版】蛋糕商城(可复用成其他商城项目)

该项目虽然是蛋糕商城项目&#xff0c;但是可以复用成其他商城项目或者购物车项目 想要源码的uu可点赞后私聊 技术栈 主要为&#xff1a;javawebservletmvcc3p0idea运行 功能模块 主要分为用户模块和后台管理员模块 具有商城购物的完整功能 基础模块 登录注册个人信息编辑…

为什么LabVIEW适合软硬件结合的项目?

LabVIEW是一种基于图形化编程的开发平台&#xff0c;广泛应用于软硬件结合的项目中。其强大的硬件接口支持、实时数据采集能力、并行处理能力和直观的用户界面&#xff0c;使得它成为工业控制、仪器仪表、自动化测试等领域中软硬件系统集成的理想选择。LabVIEW的设计哲学强调模…

Fort Firewall:全方位守护网络安全

Fort Firewall是一款专为 Windows 操作系统设计的开源防火墙工具&#xff0c;旨在为用户提供全面的网络安全保护。它基于 Windows 过滤平台&#xff08;WFP&#xff09;&#xff0c;能够与系统无缝集成&#xff0c;确保高效的网络流量管理和安全防护。该软件支持实时监控网络流…

【PyTorch】6.张量形状操作:在深度学习的 “魔方” 里,玩转张量形状

目录 1. reshape 函数的用法 2. transpose 和 permute 函数的使用 4. squeeze 和 unsqueeze 函数的用法 5. 小节 个人主页&#xff1a;Icomi 专栏地址&#xff1a;PyTorch入门 在深度学习蓬勃发展的当下&#xff0c;PyTorch 是不可或缺的工具。它作为强大的深度学习框架&am…

[STM32 - 野火] - - - 固件库学习笔记 - - -十三.高级定时器

一、高级定时器简介 高级定时器的简介在前面一章已经介绍过&#xff0c;可以点击下面链接了解&#xff0c;在这里进行一些补充。 [STM32 - 野火] - - - 固件库学习笔记 - - -十二.基本定时器 1.1 功能简介 1、高级定时器可以向上/向下/两边计数&#xff0c;还独有一个重复计…