今天是刘小爱自学Java的第159天。
感谢你的观看,谢谢你。
学习计划安排如下:
- 索引库本质上和数据库类似,也是存储数据的,既然如此自然也会有增删改查。
- 那么这个索引库到底有何特别应用呢?
- 索引库的特别之处在于它的查询,用户搜索一个词语,响应哪些对应的数据给用户?
- 重点是match匹配查询和词条查询。
一、索引库的增删改查
1新增数据
①通过POST请求添加数据。
昨天我们给索引库设定了几个字段,以上述例子中的title字段为例,给其添加一条数据“小爱手机”,这样后面可以通过索引库来快速定位这条数据了。
通过响应结果可以看到result显示的是“created”,也就是新建了一个数据。
注意:这里的请求方式是POST,昨天关于索引库的创建时POST对应的是修改,PUT是新增,至于这儿为何是POST,暂时不清楚。
②随机生成id
系统会随机生成一个id来记录这条新增的数据,但是这个id太复杂了,不好记住。
所以在新增数据时自定义id。
2自定义id
在请求路径中指定id即可。
关于请求路径:索引库是liuxiaoai01,索引类型goods,id为1,添加了一条数据。
有了id之后我们就可以去进行修改和删除数据的操作了,如果不是系统随机的id不容易记住,使用起来不方便。
3修改数据
PUT请求就是修改了,但是要注意使用PUT必须要指定id,如果没有会报错。
其中关于id的作用:
- 如果id在文档中不存在,则新增该数据,就相当于通过POST添加了一条数据。
- 如果id在文档中存在,则修改对应id数据。
也通过PUT请求既能完成新增操作又能完成修改操作,一般都会直接使用PUT。
但也要知道使用POST新增数据这回事。
3删除数据
根据id即可删除对应的数据。
PS:观察响应结果result的值就能看出来进行了什么操作。
- created对应新增数据。
- update对应修改数据。
- delete对应删除数据。
4查询数据
同样的方式,GET请求即对应的查询操作,根据id即可查询出对应的数据。
但是这种方法基本不会用。
要知道用户在搜索的时候,他怎么可能知道商品对应的id是多少?
所以用户查询的时候是使用不到id查询的,就需要全文检索技术了,
二、基本的搜索
1匹配所有(match_all)
这里query代表的就是一个查询对象,里面编写具体的查询条件是怎样的:
- match_all即代表了匹配所有,也就对应了上图中的例子。
- match即匹配查询,怎么匹配可以自行说明。
- term即词条查询,查询的时候不考虑分词。
- ……除此之外,还有很多种查询类型。
其中查询条件根据查询类型的不同会有多种不同的写法,后续遇到了就说明。
现在主要讲解下match匹配查询和词条查询。
2匹配查询(match)
为了方便测试,我向索引库中添加了两条数据,现在索引库中一共有4条数据:
“小爱手机”,“大爱手机”,“超爱手机”以及“小爱电视”这4条。
match本身也就是匹配的意思,现在匹配和“小爱电视”相关的数据。
运行会发现“手机”相关的数据都被搜索出来了,这是为什么呢?
因为“小爱电视”先会被分词成“小”“爱”以及“电视”,和分词相关的数据都会被搜索出来。
其中响应的结果有个score属性,也就是得分的意思:score越高表示结果越匹配,
在电商网站上搜索某品牌手机,会发现:
- 该品牌其它产品也会被搜索出来。
- 手机壳啊什么的也会被搜索出来。
就是这么一个道理。
and关系
operator翻译过来是运算,意思就是将分词结果通过and连接起来。
查询条件是“小爱电视”,但是其被分词为了“小”,“爱”和“电视”,当然具体是不是这样分词我不太清楚,但思路是一样的:
- 如果不做说明默认or连接,那么查询到的数据的分词只要满足任意一个就可以。
- 如果说明是and连接,那么查询到的数据分词必须要包含“小”,“爱”和“电视”。
3词条匹配(term)
我们在通过词条匹配查询“小爱电视”会发现结果竟然一条数据都没有。
老实说这个结果让我很是懵逼,想了好久才明白,还不确定对不对,我大致说下:
我们在创建索引库的时候,title这个字段名类型是text,它是会分词的,并且分词器是IK,这个昨天就详细说明过。
所以今天往索引库中添加数据“小爱电视”,它会被分词成“小”、“爱”和“电视”。
索引库中title这个字段是没有“小爱电视”这个词的,它被分词了。
- 用match查询时本身也会将查询条件分词,所以会被查询到。
- 而用term查询时不会将查询条件分词,所以查询不到。
最后
行有不得反求诸己,我是@刘小爱
一个白天上班晚上学习的95后沪漂,不为其它,只为学会自律做好自己,也愿我的每日打卡能给你带来勇气,欢迎点赞关注和评论。