elastic:nested实现对满足条件的数组元素聚合查询

0. 引言

某些业务场景下,我们要对数组元素进行聚合查询,就需要用到nested数据类型,但部分场景是针对数组中指定的元素进行聚合,于是就需要对数组元素进行限定,今天来看看这种场景如何实现。

1. 数据准备

首先我们准备一下模拟数据:一个订单下有各个商品,我们需要统计销售额前3的生鲜商品

mapping如下:

PUT orders 
{"settings": {"number_of_replicas": 0,"number_of_shards": 1},"mappings": {"properties": {"order_no": {"type": "keyword"},"create_user": {"type": "keyword"},"product_list":{"type": "nested","properties": {"name": {"type": "keyword"},"number": {"type": "integer"},"type": {"type": "keyword"}}}}}
}

提供点模拟数据,供大家演练

POST orders/_bulk 
{"index":{}}
{"order_no":"1","create_user":"张三","product_list":[{"name":"苹果", "number":2, "type":"生鲜"},{"name":"水壶", "number":2, "type":"百货"},{"name":"香蕉", "number":4, "type":"生鲜"}]}
{"index":{}}
{"order_no":"2","create_user":"李四","product_list":[{"name":"榴莲", "number":1, "type":"生鲜"},{"name":"小米手机", "number":2, "type":"百货"},{"name":"鲫鱼", "number":5, "type":"生鲜"}]}
{"index":{}}
{"order_no":"2","create_user":"周吴","product_list":[{"name":"苹果", "number":4, "type":"生鲜"},{"name":"香梨", "number":2, "type":"生鲜"},{"name":"毛巾", "number":4, "type":"百货"}]}

2. 实现

以下实现基于elasticsearch 7.13.0版本

1、我们来看直接查询的情况

GET orders/_search
{"size": 0,"aggs": {"product_agg": {"nested": {"path": "product_list"},"aggs": {"name_agg": {"terms": {"field": "product_list.name"},"aggs": {"number_sum": {"sum": {"field": "product_list.number"}},"sort": {"bucket_sort": {"sort": [{"number_sum.value": {"order": "desc"}}],"size": 3}}}}}}}
}

不做商品类型筛选的话,可以看到我们通过nested聚合来实现统计,通过bucket_sort来实现排序,同时再用size参数限定下前3输出,即可实现我们的需求。

  • nested agg官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/7.13/search-aggregations-bucket-nested-aggregation.html

  • bucket sort官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/7.13/search-aggregations-pipeline-bucket-sort-aggregation.html

在这里插入图片描述

但是从输出结果很明显的看出,这不是我们想要的结果,我们需要对数组内的type属性做一下筛选,只需要“生鲜”商品

而实现上es中提供了filter参数供我们来筛选聚合元素,我们可以利用它来实现聚合条件的筛选,如下,在官方文档中的filter用法如下:

  • filter agg 官方文档地址:https://www.elastic.co/guide/en/elasticsearch/reference/7.13/search-aggregations-bucket-filter-aggregation.html
    在这里插入图片描述

这里需要注意的是,要把嵌套的聚合新写一个agg然后放到filter同级下,也就是作为filter的子聚合;即将filter聚合的结果,作为下一次聚合的入参

GET orders/_search
{"size": 0,"aggs": {"product_agg": {"nested": {"path": "product_list"},"aggs": {"type_filter": {"filter": {"term": {"product_list.type": "生鲜"}},"aggs": {"name_agg": {"terms": {"field": "product_list.name"},"aggs": {"number_sum": {"sum": {"field": "product_list.number"}},"sort": {"bucket_sort": {"sort": [{"number_sum.value": {"order": "desc"}}],"size": 3}}}}}}}}}
}

执行出来的结果如下,符合预期
在这里插入图片描述

另外再附加上java client的实现代码,供大家参考,这里使用了RestHighLevelClient作为客户端

 @Resource
private RestHighLevelClient restClient;public void test() throws IOException {String outAggName = "product_agg";String filterAggName = "type_filter";String termAggName = "name_agg";TermsAggregationBuilder termsAggregationBuilder = AggregationBuilders.terms(termAggName).field("product_list.name");SearchSourceBuilder searchBuilder = new SearchSourceBuilder();searchBuilder.aggregation(AggregationBuilders.nested(outAggName, "product_list").subAggregation(AggregationBuilders.filter(filterAggName, new TermQueryBuilder("product_list.type", "生鲜")).subAggregation(termsAggregationBuilder.subAggregation(AggregationBuilders.sum("number_sum").field("product_list.number")).order(BucketOrder.aggregation("number_sum.value", false)))));searchBuilder.size(0);SearchRequest searchRequest = new SearchRequest("orders");searchRequest.source(searchBuilder);SearchResponse response = restClient.search(searchRequest, RequestOptions.DEFAULT);Map<String, Aggregation> resultMap = response.getAggregations().getAsMap();ParsedNested aggResults = (ParsedNested) resultMap.get(outAggName);ParsedFilter filterAgg = aggResults.getAggregations().get(filterAggName);ParsedStringTerms termAgg = filterAgg.getAggregations().get(termAggName);List<? extends Terms.Bucket> buckets = termAgg.getBuckets();for (Terms.Bucket bucket : buckets) {// TODO 获取分组结果}}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/230909.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【ECMAScript笔记一】初识JavaScript、变量的使用、数据类型包括哪些?

文章目录 1 初识JavaScript1.1 JS是什么1.2 JS的作用1.3 浏览器怎么执行JS1.4 编译性语言和解释型语言1.5 JS的组成1.6 JS的三种书写位置1.7 JS的注释1.8 JS的输入输出语句 2 变量2.1 变量的使用2.2 使用变量的注意点2.3 变量命名规范 3 数据类型3.1 简单数据类型3.1.1 数字型 …

6.s081操作系统Lab4: trap

文章目录 chapter 4概览4.1 CPU trap流程使用寄存器如果cpu想处理1个trap 4.2 用户态引发的trap4.2.1 uservec4.2.2 usertrap4.2.3 usertrapret和userretusertrapretuserret Lab4Backtrace (moderate)Alarm (hard) chapter 4 概览 trap的场景&#xff1a;系统调用&#xff0c…

2024年手把手教CleanMyMac X v4.14.6破解版安装激活图文教程

小编给您带来CleanMyMac X v4.14.6中文破解版&#xff0c;CleanMyMac X破解版是应用在MacOS上的一款Mac系统清理优化工具&#xff0c;使用cleanmymac x 中文破解版只需两个简单步骤就可以把系统里那些乱七八糟的无用文件统统清理掉&#xff0c;节省宝贵的磁盘空间。 CleanMyMac…

redis各种数据类型的应用场景

String应用场景 单值缓存 SET key value GET key 对象缓存 SET user:1 value(json格式数据)MSET user:1:name zhuge user:1:balance 1888 MGET user:1:name user:1:balance 分布式锁 SETNX product:10001 true //返回1代表获取锁成功 …

分布式锁业务场景驱动与共性

分布式锁线上真实案例架构设计哲学本质解剖 1. 业务场景驱动: ①. 交易商品库锁定,防止用户重复下单.②. MQ消息去重,防止消息重复消费:a. 发送端去重b. 消费端去重③. 订单操作变更协同:a. 在用户对商品下单后,订单状态为待支付,在某一时刻用户正在对该订单做支付操作,商家对…

Linux网络配置命令

ip man ip # 显示所有网络设备的状态 ip link show # 显示指定网络设备的详细信息 ip link show <device_name> # 启用网络设备 sudo ip link set <device_name> up # 禁用网络设备 sudo ip link set <device_name> down # 删除设备IP地址 sudo ip addr de…

使用案例总结Vlookup函数的30种用法

1 基础用法 =VLOOKUP(A12,B$1:D$8,3,0) 2 批量查找 =VLOOKUP(A11:A13,A2:C8,3,0) 3 模糊查找 =VLOOKUP("*"&D2&"*",A:B,2,0) 4 模糊查找2 =VLOOKUP(D10&"??",A:B,2,0) 5 模糊查找3 =

pycharm通过ssh连接远程服务器的docker容器进行运行和调试代码

pycharm连接远程服务器的docker容器通常有两种方法&#xff1a; 第一种&#xff1a;pycharm通过ssh连接已在运行中的docker容器 第二种&#xff1a;pycharm连接docker镜像&#xff0c;pycharm运行代码再自动创建容器 第一种方法比较通用简单&#xff0c;作者比较推崇。 条件…

特氟龙材质PFA、FEP、PTFE三种氟塑料试剂瓶区别

PFA、FEP、PTFE三种材质&#xff0c;都具有良好的耐化学性和耐热性。适合用于微量分析&#xff0c;痕量分析&#xff0c;超痕量分析ICP-MS/OES/AAS分析等实验。PFA、FEP、PTFE是三种常见的氟塑料材料&#xff0c;它们在石油化工、机械、半导体电子等领域得到广泛应用。虽然它们…

展示一段比较简单的人工智能自动做模型的程序

人工智能是一种模拟或模仿人类智能的技术。它通过使计算机系统具有一定的认知能力和学习能力&#xff0c;使其能够自动完成一系列复杂的任务。人工智能可以在各个领域应用&#xff0c;包括图像识别、语音识别、自然语言处理、机器学习等。人工智能还可以用于解决各种问题&#…

Docker 的基本概念、优势、及在程序开发中的应用

Docker 是一种容器化平台,它通过使用容器化技术,将应用程序及其依赖性打包到一个独立的、可移植的容器中,从而实现应用程序的快速部署、可靠性和可扩展性。 下面是 Docker 的一些基本概念和优势: 容器:Docker 使用容器化技术,将应用程序及其依赖性打包到一个可移植的容器…

CUDA C:线程、线程块与线程格

相关阅读 CUDA Chttps://blog.csdn.net/weixin_45791458/category_12530616.html?spm1001.2014.3001.5482 第一百篇博客&#xff0c;写点不一样的。 当核函数在主机端被调用时&#xff0c;它会被转移到设备端执行&#xff0c;此时设备会根据核函数的调用格式产生对应的线程(…

docker在线安装minio

1、下载最新minio docker pull minio/minio 2、在宿主机创建 /usr/local/data/miniodocker/config 和 /usr/local/data/miniodocker/data,执行docker命令 docker run -p 9000:9000 -p 9090:9090 --name minio -d --restartalways -e MINIO_ACCESS_KEYminio -e MINIO_SECRET_K…

力扣225. 用队列实现栈【附进阶版】

文章目录 力扣225. 用队列实现栈示例思路及其实现两个队列模拟栈一个队列模拟栈 力扣225. 用队列实现栈 示例 思路及其实现 两个队列模拟栈 队列是先进先出的规则&#xff0c;把一个队列中的数据导入另一个队列中&#xff0c;数据的顺序并没有变&#xff0c;并没有变成先进后…

引领半导体划片机行业,实现钛酸锶基片切割的卓越效能

在当今快速发展的半导体行业中&#xff0c;博捷芯以其卓越的技术实力和精准的行业应用&#xff0c;脱颖而出&#xff0c;再次引领行业潮流。这次&#xff0c;他们将先进的BJX3356划片机技术应用于钛酸锶基片的切割&#xff0c;为半导体制造行业的进一步发展提供了强大的技术支持…

基于知识库的接口自动化测试——结果模型化方法与装置的分析

一、背景 随着自动化测试的设计理念不断完善、新的技术不断应用&#xff0c;自动化测试资产的积累代价和维护成本不断降低&#xff0c;自动化测试资产的数量持续增长。同时&#xff0c;随着DevOps的普及&#xff0c;应用研发过程越来越敏捷&#xff0c;自动化测试能力逐步从测…

离线ODT线段树 + 二分双指针:CF1034D

https://www.luogu.com.cn/problem/CF1034D 多组询问查询区间并是好做的&#xff0c;经典套路&#xff1a;离线ODT线段树 考虑这道题&#xff0c;显然二分一下&#xff0c; 然后我们暴力跑ODT和线段树的过程&#xff0c; 每次在线段树上二分即可&#xff08;当然也可以建主席…

js输入框部分内容不可编辑,其余正常输入,el-input和el-select输入框和多个下拉框联动后的内容不可修改

<tr>//格式// required自定义指令<e-td :required"!read" label><span>地区&#xff1a;</span></e-td><td>//v-if"!read && this.data.nationCode 148"显示逻辑<divclass"table-cell-flex"sty…

camera曝光时间

曝光和传感器读数 相机上的图像采集过程由两个不同的部分组成。第一部分是曝光。曝光完成后&#xff0c;第二步就是从传感器的寄存器中读取数据并传输&#xff08;readout&#xff09;。 曝光&#xff1a;曝光是图像传感器进行感光的一个过程&#xff0c;相机曝光时间&#xf…

FFmpeg零基础学习(四)——CPU视频解码 重新编码

目录 前言正文一、核心代码二、重要的API1、avformat_alloc_context2、avformat_open_input3、avcodec_alloc_context34、avcodec_parameters_to_context5、avformat_alloc_output_context26、avformat_new_stream7、avcodec_parameters_from_context END、总结的知识与问题 参…