Elasticsearch嵌套查询

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

一、背景

最近在做基于宴会厅档期的商户搜索推荐时,如果用传统平铺式的mapping结构,无法满足需求场景,于是用到了Elasticsearch支持的Nested(嵌套)查询。

二、普通对象与嵌套对象的索引异同

如果一个对象不是嵌套类型,那么以如下原数据为例:

PUT /my_index/blogpost/1  
{  "title":"Nest eggs",  "body":  "Making your money work...",  "tags":  [ "cash", "shares" ],  "comments":[  {  "name":    "John Smith",  "comment": "Great article",  "age":     28,  "stars":   4,  "date":    "2014-09-01"  },  {  "name":    "Alice White",  "comment": "More like this please",  "age":     31,  "stars":   5,  "date":    "2014-10-22"  }  ]  
}

由于是json格式的结构化文档,es会平整成索引内的一个简单键值格式,如下:

{  "title":  [ eggs, nest ],  "body":  [ making, money, work, your ],  "tags":    [ cash, shares ],  "comments.name":    [ alice, john, smith, white ],  "comments.comment":  [ article, great, like, more, please, this ],  "comments.age":      [ 28, 31 ],  "comments.stars":     [ 4, 5 ],  "comments.date":      [ 2014-09-01, 2014-10-22 ]  
}

这样的话,像这种john/28,Alice/31间的关联性就丢失了,Nested Object就是为了解决这个问题。

将comments指定为Nested类型,如下mapping:

curl -XPUT 'localhost:9200/my_index' -d '  
{  "mappings":{  "blogpost":{  "properties":{  "comments":{  "type":"nested",   //声明为nested类型"properties":{  "name":    {"type":"string"},  "comment": { "type": "string"},  "age":     { "type": "short"},  "stars":   { "type": "short"},  "date":    { "type": "date"}  }  }  }  }  }  
}

这样,每一个nested对象将会作为一个隐藏的单独文本建立索引,进而保持了nested对象的内在关联关系,如下:

{ ①  "comments.name":    [ john, smith ],  "comments.comment": [ article, great ],  "comments.age":     [ 28 ],  "comments.stars":   [ 4 ],  "comments.date":    [ 2014-09-01 ]  
}  
{   "comments.name":    [ alice, white ],  "comments.comment": [ like,more,please,this],  "comments.age":     [ 31 ],"comments.stars":   [ 5 ],  "comments.date":    [ 2014-10-22 ]  
}  
{   "title":          [ eggs, nest ],  "body":         [ making, money, work, your ],  "tags":          [ cash, shares ]  
}  
①nested object

三、嵌套对象的查询

命令查询(输出结果1):

curl -XGET localhost:9200/yzsshopv1/shop/_search?pretty -d '{"query" : {"bool" : {"filter" : {"nested" : {"path":"hallList","query":{"bool":{"filter":{"term":{"hallList.capacityMin" : "11"}}}}}}}}}'
{"took" : 3,"timed_out" : false,"_shards" : {"total" : 5,"successful" : 5,"failed" : 0},"hits" : {"total" : 1,"max_score" : 0.0,"hits" : [ {"_index" : "yzsshopv1","_type" : "shop","_id" : "89999988","_score" : 0.0,"_source" : {"cityId" : "1","shopName" : "xxxx婚宴(yyyy店)","shopId" : "89999988","categoryId" : [ "55", "165", "2738" ],"hallList" : [ {"hallId" : "20625","schedule" : ["2017-11-10", "2017-11-09"],"capacityMax" : 16,"capacityMin" : 12},  {"hallId" : "21080","schedule" : [ "2017-12-10", "2017-09-09",  "2017-02-25"],"capacityMax" : 20,"capacityMin" : 11} ],"wedHotelTagValue" : [ "12087", "9601", "9603", "9602" ],"regionId" : [ "9", "824" ]}} ]}
}

java api查询封装:

BoolQueryBuilder boolBuilder = new BoolQueryBuilder();
NestedQueryBuilder nestedQuery = new NestedQueryBuilder("hallList", new TermQueryBuilder("hallList.capacityMin","11"));   //注意:除path之外,fieldName也要带上path (hallList)boolBuilder.filter(nestedQuery);
searchRequest.setQuery(boolBuilder); //设置查询条件

java api输出字段封装:

searchRequest.addField("shopId");
searchRequest.addField("hallList. schedule");
searchRequest.addField("hallList.capacityMin");
searchRequest.addField("hallList.capacityMax");

如果输出的outputField为searchRequest.addField("hallList"),则会报错:illegal_argument_exception,reason:field [hallList] isn't a leaf field;

如果输出的outputField为searchRequest.addField("capacityMin"),则不报错,但没有capacityMin字段的值;

正确调用search后的输出结果(输出结果2):

{"took" : 8,"timed_out" : false,"_shards" : {"total" : 5,"successful" : 5,"failed" : 0},"hits" : {"total" : 1,"max_score" : 0.0,"hits" : [{"_index" : "yzsshopv1","_type" : "shop","_id" : "89999988","_score" : 0.0,"fields" : {"shopId" : [ "89999988" ],"hallList.hallId" : [ "20625", "21080"],"hallList.capacityMin" : [12, 11 ],"hallList.capacityMax" : [16, 20 ],"hallList.schedule" : [ "2017-11-10", "2017-11-09",  "2017-12-10", "2017-09-09",  "2017-02-25"]}}]}
}

对比输出结果1和2发现,命令输出嵌套对象结果1没问题,但通过java api输出结果2时,嵌套对象内部的关系也会打乱,比如hallList.schedule字段,无法区分到底哪些值属于hallList.hallId-20625,哪些属于21080。

//============以下更新20170331===========

经过后续调试,发现要让java api输出正确结果的嵌套对象,不能通过searchRequest.addField的方式,因为嵌套对象并不是叶子节点,需要通过以下的方式添加输出字段:

searchRequest.setFetchSource(new String[]{"shopId","hallList"},new String[]{});

还有一个不足点是: 嵌套查询请求返回的是整个文本,而不仅是匹配的nested文本。

四、参考文档

  1. https://www.elastic.co/guide/en/elasticsearch/guide/master/nested-objects.html
  2. http://stackoverflow.com/questions/23562192/unable-to-retrieve-nested-objects-using-elasticsearch-java-api
  3. http://elasticsearch.cn/book/elasticsearch_definitive_guide_2.x/nested-aggregation.html

转载于:https://my.oschina.net/weiweiblog/blog/1572727

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/279639.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

写给深圳首期Python自动化开发周未班的信

你是否做了正确的决定? 深圳首期周未班的同学们大家好,我是Alex, 老男孩教育的联合创始人,Python项目的发起人,51CTO学院连续2届最受学员喜爱的讲师,中国最早一批使用Python的程序员,当然还有一堆头衔&…

网站跳出率的相关要点介绍

今天小峰seo博客和大家一起来探讨关于“网站跳出率的相关要点”,这里大体是分为三大要点:首先是进入的流量渠道,然后就是综合流量速度和内容的质量问题,细的来说就是我们的网站进来的用户是搜索什么关键词来的是通过百度还是搜狗或…

如何使用PowerShell提升开发效率(以Windows Embedded CE为例)

简介 本文讲述如何使用Powershell通过RAPI来控制Windows Embedded CE和Windows Mobile设备。 缘由 我入行的时候是做AS400 RPG和UNIX C开发的,所有开发环境都是字符界面,因此习惯了vigrepmake的开发模式。后来开始做Windows的开发,开始也不大…

视频图像传输学习笔记-基础小知识(一)

摄像头DVP与MIPI区别 DVP是并口,需要PCLK、VSYNC、HSYNC、D[0:11]——可以是8/10/12bit数据,看ISP或baseband是否支持;总线PCLK极限大约在96M左右,而且走线长度不能过长,所有DVP最大速率最好控制在72M以…

java程序员面试交流项目经验

粘贴自:https://blog.csdn.net/wangyuxuan_java/article/details/8778211 1:请你介绍一下你自己 这是面试官常问的问题。一般人回答这个问题过于平常,只说姓名、爱好、工作经验,这些简历上都有。其实,面试官最希望知道…

Windows7旗舰版磁盘分区详解—附分区步骤截图

最近工作中配置使用联想的Thinkpad TL系列本本.当然原装的系统时刚发布的Windows RTM旗舰版.在考虑买之前也参考了戴尔 苹果的等等, 但个人私下也是一直在用Tinkpad系列, 相比其他的品牌本人还是比较钟情于Tinkpad 非常实用的键盘. 以及简洁的外观.买回来一看这个TL系列原装的系…

outlook存档邮件_如何在Outlook 2013中存档电子邮件

outlook存档邮件We’ve always been told that backing up our data is a good idea. Well, that same concept can extend to email as well. You may want to archive your email every so often, such as monthly, quarterly, or even yearly. 我们一直被告知备份数据是一个…

洛谷 P1736 创意吃鱼法(多维DP)

题目描述 回到家中的猫猫把三桶鱼全部转移到了她那长方形大池子中,然后开始思考:到底要以何种方法吃鱼呢(猫猫就是这么可爱,吃鱼也要想好吃法 ^_*)。她发现,把大池子视为01矩阵(0表示对应位置无…

计算机组装和维护_如何构建自己的计算机,第二部分:组装在一起

计算机组装和维护So you’ve selected your parts, double- and triple-checked their compatibility, and waited for economy shipping to bring them all to your door. It’s time to get to the fun part: putting them all together. 因此,您已经选择了零件&a…

Python学习-集合的常见用法

st [1,2,3,4,5] ct [2,3,4,5,76] list set(["name", list, try]) list2 set(["name", list, try, but, test]) # 两个列表去重,利用集合st set(st) #设为集合 ct set(ct) print(st, type(st))sct0 st.union(ct) #并集 sct st | ct …

Autofac之自动装配

从容器中的可用服务中选择一个构造函数来创造对象,这个过程叫做自动装配。这个过程是通过反射实现的 默认 思考这么一个问题,如果注册类型中存在多个构造函数,那么Autofac会选择哪一个来创建类型的实例 答案是"尽可能最多参数" class ConstructorClass {p…

对Emlog 6.0 Beta的完整代码审计过程

Emlog 6.0 beta版本,这可能是最后一篇关于PHP语言CMS的代码审计文章,此次将详细记录完整的审计过程。 文章基本上完整记录小东的对此CMS审计过程,或许显得繁琐,但代码审计的过程就是这样,发现可能项,然后精…

SINOCES 2011

突然发现又好久没写过日志了 是在是太懒了… 难得休假去看了眼消费电子 感觉实在是一年不如一年 佳能、索尼不见踪影,相机满场没见一家(大牌子是真没见到) 华硕技嘉微星等主板厂商同样失踪… PC方面,联想貌似是来卖电脑包鼠标的&a…

esim卡与ms卡的区别_什么是eSIM,它与SIM卡有何不同?

esim卡与ms卡的区别With the launch of the Apple Watch 3, the term “eSIM” has been thrown around a lot. And now, Google’s Pixel 2 is the first phone to use this new technology, it’s time we take a closer look at what it is, what it does, and what this me…

机器学习实战之logistic回归分类

利用logistic回归进行分类的主要思想:根据现有数据对分类边界建立回归公式,并以此进行分类。 logistic优缺点: 优点:计算代价不高,易于理解和实现。缺点:容易欠拟合,分类精度可能不高。 .适用数…

HDU 6343.Problem L. Graph Theory Homework-数学 (2018 Multi-University Training Contest 4 1012)

6343.Problem L. Graph Theory Homework 官方题解: 一篇写的很好的博客: HDU 6343 - Problem L. Graph Theory Homework - [(伪装成图论题的)简单数学题] 代码: 1 //1012-6343-数学2 #include<iostream>3 #include<cstdio>4 #include<cstring>5 #include<…

Android GridView LruCache

照片墙这种功能现在应该算是挺常见了&#xff0c;在很多应用中你都可以经常看到照片墙的身影。它的设计思路其实也非常简单&#xff0c;用一个GridView控件当作“墙”&#xff0c;然后随着GridView的滚动将一张张照片贴在“墙”上&#xff0c;这些照片可以是手机本地中存储的&a…

如何在Android TV上自定义推荐行

When you fire up Android TV, the first thing you see is a list of movies and shows the system thinks you’ll like. It’s often full of the latest flicks or hottest news, but sometimes it could just be things relevant to your interests and the apps you have…

递归 段错误 习题

段错误 递归里面算阶乘 f(10000000)没有输出&#xff0c;使用gdb 显示 SIGSEGV--段错误编译后产生的可执行文件里面保存着什么&#xff1f;UNIX/Linux 用 ELFDOS下用COFFWindows用PE&#xff08;COFF扩充而得&#xff09;段&#xff08;segmentation&#xff09;二进制文件内的…

你知道你常用的dos和linux命令吗?

功能 Linux MS-DOS 进入到该目录 cd cd 列举文件 ls dir 创建目录 mkdir mkdir 清除屏幕 clear cls 复制文件 cp copy 移动文件 mv move 删除文件 rm del 查看文件 less more 文件重命名 mv ren 比较文件内容 diff fc 查看当前路径 pwd chd…