Elasticsearch中【文档查询】DSL语句以及对应的Java实现

目录

全文检索查询

精准查询

布尔查询 

排序、分页查询

高亮

地理查询

复合查询


 

Elasticsearch提供了基于JSON的DSL(Domain Specific Language)来定义查询。常见的查询类型包括:

  • 查询所有:查询出所有数据,一般测试用。例如:match_all

  • 全文检索(full text)查询:利用分词器对用户输入内容分词,然后去倒排索引库中匹配。例如:

    • match_query 

    • multi_match_query

  • 精确查询:根据精确词条值查找数据,一般是查找keyword、数值、日期、boolean等类型字段。例如:

    • ids

    • range

    • term

  • 地理(geo)查询:根据经纬度查询。例如:

    • geo_distance

    • geo_bounding_box

  • 复合(compound)查询:复合查询可以将上述各种查询条件组合起来,合并查询条件。例如:

    • bool

    • function_score

全文检索查询

单字段查询DSL:

GET /indexName/_search
{"query": {"match": {"字段名": "查询内容"}}
}

例子:

多字段查询DSL:(搜索字段越多,对查询性能影响越大 ,所以建议在创建索引时使用copy_to字段约束,将需要参与搜索的字段复制到all字段中)

        例如创建索引时,"name"字段设置了"copy_to"参数,将其值复制到"all"字段中。这意味着当你在Elasticsearch中索引一个文档时,文档的"name"字段的值会被同时复制到"all"字段中。这样一来,如果你想要在文档的所有字段中进行全文本搜索,只需要搜索"all"单个字段即可,而不需要分别搜索每个字段。

         这样对all进行单字段查询,性能也有很大提高。

GET /indexName/_search
{"query": {"multi_match": {"query": "搜索内容","fields": ["字段名1", " 字段名2"]}}
}

Java实现全文查询:

依赖引入可查看我另一张博文第三部分:

        //1.准备RequestSearchRequest request = new SearchRequest("hotel");//2.准备DSLrequest.source().query(QueryBuilders.matchAllQuery());//3.发生请求SearchResponse response = client.search(request, RequestOptions.DEFAULT);

 对SearchResponse返回结果进行处理:

        //获取最外层的hitsSearchHits hits = response.getHits();//获取总条数TotalHits totalHits = hits.getTotalHits();//获取里层的hitsSearchHit[] searchHits = hits.getHits();//遍历每条数据for (SearchHit hit : searchHits) {//获取文档 _idString docId = hit.getId();//获取每条数据的_source部分(json数据),获取后做下一步处理String sourceAsString = hit.getSourceAsString();}

返回数据格式

各种查询主要不同的 是query()中构建的是何种查询,例如这里是match_all查询

构建match查询

QueryBuilders.matchQuery("name","酒店")

精准查询

DSL语句:

GET /jungle_study/_search
{"query": {"term": {"city": {"value": "北京"}}}
}

构建精确查询

QueryBuilders.termQuery("city","北京")

布尔查询 

复合查询的一种

bool查询中的逻辑关系:

  • must:必须匹配的条件,可以理解为“

  • should:选择性匹配的条件,可以理解为“

  • must_not:必须不匹配的条件,不参与打分

  • filter:必须匹配的条件,不参与打分

DSL:(查询name字段有酒店,并且价格范围在100-500之间的数据)

GET /jungle_study/_search
{"query": {"bool": {"must": [{"term": {"city": "北京"}},{"range": {"price": {"gte": 100,"lte": 500}}}]}}
}

gte : >=  大于或等于

lte  : <=  小于或等于

gt   : >    大于

lt    : <    小于

构建布尔查询

QueryBuilders.boolQuery();
//添加查询条件
boolQuery.must(QueryBuilders.termQuery("city","上海")); //精确查询,添加city精确匹配条件
boolQuery.filter(QueryBuilders.rangeQuery("price").gte(100).lte(500)); //范围查询 ,添加条件价格在100-250之间

排序、分页查询

DSL:(排序和分页与query同级)

from :从哪条数据开始查

size :查询条数

sort :根据price(价格)倒叙排列查询结果

对应Java代码

    // 页码,每页大小int page = 1, size = 5;// 准备RequestSearchRequest request = new SearchRequest("jungle_study");// 准备DSLrequest.source().query(QueryBuilders.matchAllQuery());// 排序 sortrequest.source().sort("price", SortOrder.ASC);// 分页 计算from 和 sizerequest.source().from((page - 1) * size).size(size);

从DSL可以看出query和sort、from、size是同级,所以也是request.source()去点

高亮

根据搜索关键词对结果做高亮,就是在关键词中添加   <em></em> html标签

 DSL:(也是与query同级)

对查询内容 “酒店” 做高亮,高亮结果是与原数据  _source  同级的  highlight

当我们是使用  all  字段(对所有做过copy_to约束的字段)去做搜索时,需要配置require_field_match属性为false,表示不与查询字段  all  做匹配

 Java代码:

//用request.source()去点,进行配置高亮
request.source().highlighter(new HighlightBuilder().field("name").requireFieldMatch(false));

获取高亮结果:

            // 根据字段名获取高亮结果HighlightField highlightField = highlightFields.get("name");//不为空时才做下一步处理,if (highlightField != null) { // 获取高亮值String name = highlightField.getFragments()[0].string();//可以覆盖原来的值}

地理查询

矩形范围查询DSL:

top_left : 左上坐标点    

bottom_right  :右下坐标点

范围查询

查询一个坐标点的五公里范围内的数据

#根据中心点做范围查询
GET /jungle_study/_search
{"query": {"geo_distance": {"distance": "5km", "location": "31.21,121.5" }}
}

"121.5" 是经度(longitude)

"31.21" 是纬度(latitude)

Java中实现:

构建矩形范围查询条件

GeoBoundingBoxQueryBuilder location = QueryBuilders.geoBoundingBoxQuery("location");
//左上坐标点
GeoPoint geoPoint = location.topLeft();
geoPoint.resetLat(31.21);
geoPoint.resetLon(121.5);
//右下坐标点
GeoPoint bottomRight = location.bottomRight();
bottomRight.resetLat(31.21);
bottomRight.resetLon(121.5);

 构建距离范围查询条件

QueryBuilders.geoDistanceQuery("location").distance("5km");

复合查询

常见的有两种 布尔查询 算分函数查询

查询结果中有  _score  代表与搜索词条的关联度打分,结果按照分值降序排列,分越高则排在最前

 ES中使用BM25算法进行词条和文档的相关度做打分。

DSL:

GET /jungle_study/_search
{"query": {"constant_score": {"filter": {"term": { "user.id": "kimchy" }},"boost": 1.2}}
}

 有关复合查询的官方文档地址:Constant score query | Elasticsearch Guide [7.16] | Elastic

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/5008.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

全新突破:「Paraverse平行云」实现3D/XR企业级应用全面接入Apple Vision Pro

在前不久举行的GTC开发者大会上&#xff0c;英伟达引领行业风向&#xff0c;宣布其Omniverse平台能够助力企业将3D/XR应用流畅传输至Apple Vision Pro混合现实头显。在英伟达与苹果这两大科技巨头的合作下,此举标志着3D/XR技术迈向新纪元的关键一步。「Paraverse平行云」实时云…

《HCIP-openEuler实验指导手册》1.6 Apache静态资源配置

知识点 常用用途&#xff1a; 软件仓库镜像及提供下载服务&#xff1a; 配置步骤 删除网站主目录中的文件&#xff08;本实验机目录为/home/source ip为192.168.12.137 端口为81&#xff09; cd /home/source rm -rf *在主目录中新建6个文件夹如下图 mkdir test{1..6}新建…

将本地.mp4推流成rtsp流?(windows)

概述 如何在本地机器上进行rtsp推流整个操作&#xff1f; 1.软件安装 1. 推流-ffmpeg下载 从官网下载windows版本&#xff0c;该版本已经编译好了 放到C&#xff1a;下找一个目录解压&#xff0c;我放到C:\ffmpeg-7.0-essentials_build\进入系统环境变量设置&#xff1a;将…

使用nodejs和python脚本实现爬虫程序,并将抓取数据生成词云图看板

创建项目&#xff0c;初始化目录结构。 创建项目名称为pachong。运行 npm init -y 初始化项目。修改package.json文件中的type属性为module。安装 npm 包&#xff1a;npm install puppeteer #爬虫 | 自动化UI测试首先确保你的电脑上有python3环境安装两个python包 pip instal…

c#数据库: 8.在窗体上显示学生信息

以上一章学生信息表为例&#xff0c;首先将查询的学生信息存储到数据集中&#xff0c;然后将数据集与数据显示控件绑定&#xff0c;从而实现学生信息在窗体上的显示 &#xff08;1&#xff09;创建一个名为StudentGridView的窗体应用程序&#xff0c;为窗体添加一个DataGridVi…

Stable Diffusion 模型分享:Counterfeit-V3.0(动漫)

本文收录于《AI绘画从入门到精通》专栏&#xff0c;专栏总目录&#xff1a;点这里&#xff0c;订阅后可阅读专栏内所有文章。 文章目录 模型介绍生成案例案例一案例二案例三案例四案例五案例六案例七案例八 下载地址 模型介绍 高质量动漫风格模型。 条目内容类型大模型基础模…

Java进阶-JINQ详解与使用

本文详细介绍了JINQ&#xff08;Java Integrated Query&#xff09;&#xff0c;一种强化Java中数据查询能力的库&#xff0c;提供类SQL的查询语法和类型安全的操作。文章首先解释了JINQ的基本功能和应用&#xff0c;随后通过具体示例展示了如何使用JINQ进行数据过滤、投影、连…

Unity镂空图像做法

问题和解决方案 现在要完成一个需求&#xff0c;即镂空中间部分的image&#xff0c;外围image可以定义颜色并可选屏蔽点击&#xff0c;而中间的image需要透明且可以穿透&#xff0c;必须不能屏蔽点击。 由此拆分成了两个问题&#xff1a; 1.定义外围image颜色&#xff0c;内…

Facebook的语言学:社交媒体如何影响我们的沟通方式

1. 引言 社交媒体已经成为人们日常生活中不可或缺的一部分&#xff0c;而Facebook作为其中最具影响力的平台之一&#xff0c;不仅改变了人们之间的社交方式&#xff0c;也对我们的语言学产生了深远的影响。本文将深入探讨Facebook的语言学特点&#xff0c;以及它如何塑造和改变…

Spring6 当中 获取 Bean 的四种方式

1. Spring6 当中 获取 Bean 的四种方式 文章目录 1. Spring6 当中 获取 Bean 的四种方式每博一文案1.1 第一种方式&#xff1a;通过构造方法获取 Bean1.2 第二种方式&#xff1a;通过简单工厂模式获取 Bean1.3 第三种方式&#xff1a;通过 factory-bean 属性获取 Bean1.4 第四种…

【保姆级教程】用IDEA2023版本给RuoYi-Vue添加子模块

文章目录 前言添加子模块新建子模块新建子模块界面&#xff1f;新建子模块界面&#xff01; 修改pom依赖配置RuoYiApplication添加测试接口配置接口权限测试 前言 若依前后端分离框架能够极大方便当前开发任务&#xff0c;并且使用的技术栈也相当丰富&#xff0c;但是目前只提…

Docker 中安装单体架构 Redis 的 Shell 脚本

该脚本用于实现 root 用户在 Linux 操作系统下的 Docker 中安装单体架构 Redis Shell 脚本 Git 仓库地址 Gitee&#xff1a;https://gitee.com/tongchaowei/common-shell/tree/main/root 执行脚本 bash ./docker-redis-install-single.sh需要注意的 该脚本会先检查是否安…

数学建模--图论最短路径基础

1.图的定义 学过数据结构或者离散数学的小伙伴们应该知道图的概念&#xff0c;我在这里简单的介绍一下&#xff1a; 图的概念和我们理解的是很不一样的&#xff0c;这里的图并不是我们的生活里面的图片&#xff0c;而是一种表示不同的数据之间的关系&#xff0c;例如这里的5个…

C++中auto关键字的用法详解

1.简介 auto作为一个C语言就存在的关键字&#xff0c;在C语言和C之间却有很大区别。 在C语言中auto修饰的变量&#xff0c;是具有自动存储器的局部变量&#xff0c;但因为局部变量默认类别默认是auto修饰导致一直没有人去使用它。 C11中&#xff0c;标准委员会赋予了auto全新…

XY_RE复现(二)

一&#xff0c;何须相思煮余年 0x55 0x8b 0xec 0x81 0xec 0xa8 0x0 0x0 0x0 0xa1 0x0 0x40 0x41 0x0 0x33 0xc5 0x89 0x45 0xfc 0x68 0x9c 0x0 0x0 0x0 0x6a 0x0 0x8d 0x85 0x60 0xff 0xff 0xff 0x50 0xe8 0x7a 0xc 0x0 0x0 0x83 0xc4…

【智能算法】火烈鸟搜索算法(FSA)原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献 1.背景 2021年&#xff0c;W Zhiheng等人受到火烈鸟迁徙觅食行为启发&#xff0c;提出了火烈鸟搜索算法&#xff08;Flamingo Search Algorithm, FSA&#xff09;。 2.算法原理 2.1算法思想 FSA受到火烈鸟…

C++|STL简介-string-vector基础运用

目录 什么是STL STL里面有什么 容器 string 序列式容器 vector deque list 关联式容器 set multiset map multimap 算法 非可变序列算法 可变序列算法 排序算法 数值算法 什么是STL STL(标准模板库)&#xff1a;是C标准库的重要组成部分&#xff0c;不仅是一…

MVC架构简述

MVC简介 MVC 是一种非常常见且常用的分层架构&#xff0c;主要包括&#xff1b;M - mode 对象层&#xff0c;封装到 domain 里。V - view 展示层&#xff0c;但因为目前都是前后端分离的项目&#xff0c;几乎不会在后端项目里写 JSP 文件了。C - Controller 控制层&#xff0c…

站群SEO优化策略及其遭遇DDoS攻击时的应对方法

一、站群SEO优化策略 站群优化主要是指通过合理布局和内容优化提升一系列网站在搜索引擎中的整体排名表现。以下是一些关键步骤与相关代码示例&#xff08;以WordPress为例&#xff09;&#xff1a; 差异化内容建设&#xff1a; 每个站点的内容必须具有独立性和价值性&#x…

CSS-vminvmax单位

vmin 和 vmax 单位 vmin 是相对于视口宽度和高度中较小值进行计算&#xff0c;它的值为视口宽度和高度中的较小值的百分比。 例如&#xff0c;如果视口宽度为 800px&#xff0c;高度为 1000px&#xff0c;那么 1vmin 等于 8px&#xff08;800px 的 1%&#xff09;。 vmax 是…