elasticsearch-7.15.2 配置IK中文分词器+拼音分词

在这里插入图片描述
在这里插入图片描述

文章目录

            • 1. 下载分词器
            • 2. es集成pinyin
            • 3. 启动es
            • 4. 自定义分词
            • 5. 映射模型
            • 6. 初始化数据
            • 7. 查询索引
            • 8. 效果图
            • 9. 开源项目

1. 下载分词器
  • ik中文分词器
    中文分词器:https://github.com/medcl/elasticsearch-analysis-ik

在这里插入图片描述

  • 拼音分词器
    链接:https://github.com/medcl/elasticsearch-analysis-pinyin
    在这里插入图片描述
2. es集成pinyin

方式任选其中一种即可

  • 第一种:在线安装
cd elasticsearch-7.15.2 
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.15.2/elasticsearch-analysis-ik-7.15.2.zip
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v7.15.2/elasticsearch-analysis-pinyin-7.15.2.zip
  • 第二种:下载解压
  • pinyin分词
    解压 elasticsearch-analysis-pinyin-7.15.2.zip,把解压后的文件夹elasticsearch-analysis-pinyin-7.15.2复制到elasticsearch-7.15.2\plugins目录下面,并重命名为analysis-pinyin
unzip elasticsearch-analysis-pinyin-7.15.2.zip
mv elasticsearch-analysis-pinyin-7.15.2 elasticsearch-7.15.2/plugins analysis-pinyin
  • ik中文分词
    解压 elasticsearch-analysis-ik-7.15.2.zip,把解压后的文件夹elasticsearch-analysis-ik-7.15.2复制到elasticsearch-7.15.2\plugins目录下面,并重命名为analysis-ik
unzip elasticsearch-analysis-ik-7.15.2.zip
mv elasticsearch-analysis-ik-7.15.2 elasticsearch-7.15.2/plugins analysis-ik

在这里插入图片描述

3. 启动es
  • windows
    在这里插入图片描述
  • linux
cd elasticsearch-7.15.2
bin/elasticsearch
4. 自定义分词

自定义分词:同时支持ik中文分词和pinyin分词

PUT /jd_goods
{"settings": {"analysis": {"analyzer": {"ik_smart_pinyin": {"type": "custom","tokenizer": "ik_smart","filter": ["my_pinyin", "word_delimiter"]},"ik_max_word_pinyin": {"type": "custom","tokenizer": "ik_max_word","filter": ["my_pinyin", "word_delimiter"]}},"filter": {"my_pinyin": {"type" : "pinyin","keep_separate_first_letter" : true,"keep_full_pinyin" : true,"keep_original" : true,"limit_first_letter_length" : 16,"lowercase" : true,"remove_duplicated_term" : true}}}}
}

在这里插入图片描述

5. 映射模型

重新指定文档类型映射拼音分词类型

POST /jd_goods/_mapping
{"properties": {"title": {"type": "text","analyzer": "ik_max_word_pinyin","search_analyzer": "ik_smart_pinyin"},"desc": {"type": "text","analyzer": "ik_max_word_pinyin","search_analyzer": "ik_smart_pinyin"},"img": {"type": "text"},"price": {"type": "text"}}
}

在这里插入图片描述

6. 初始化数据
PUT /gblfy/user/1
{"title":"女士包","img":"http://xxx.png","price":"22","desc": "一顿操作猛如虎,一看工资2500"
}

在这里插入图片描述

7. 查询索引
  • pinyi查询
GET jd_goods/_search
{"query": {"match": {"title": "nvbao"}}
}

在这里插入图片描述

  • ik中文查询
GET jd_goods/_search
{"query": {"match": {"title": "女包"}}
}

在这里插入图片描述

8. 效果图

在这里插入图片描述
在这里插入图片描述

9. 开源项目

https://gitee.com/gblfy/es7-jd-vue

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/516474.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Gartner 容器报告:阿里云与 AWS 并列第一,领先微软、谷歌

近日,国际知名调研机构 Gartner 发布 2020 年容器公有云竞争格局报告,阿里云再度成为国内唯一入选厂商。Gartner 报告显示,阿里云容器服务在中国市场表现强劲,产品形态丰富,在如 Serverless 容器、服务网格、安全沙箱容…

每个程序员都必须知道的8种通用数据结构

云栖号资讯:【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 数据结构是一种特殊的组织和存储数据的方式,可以使我们可以更高效地对存储的数据执行操作。数据结构在计算机科学…

ElasticSearch 从安装开始_01

文章目录1. windows 环境2. linux3. HEAD 插件安装4. 分布式安装5. Kibana 安装1. windows 环境 首先打开 Es 官网,找到 Elasticsearch: https://www.elastic.co/cn/downloads/elasticsearch 然后点击下载按钮,选择合适的版本直接下载即可。…

硅谷2020最新大数据学习路线:科学使用这一招,12周助你成为数据分析师

来源 | 智领云科技责编 | Carol数据科学到底是什么?数据科学是一门将数据变得有用的学科,它包含三个重要概念:统计、机器学习、数据挖掘/分析。《数据科学杂志》曾提出:“所谓的‘数据科学’,指的是那些任何与数据相关…

新基建带来新机遇!大数据产业发展需“四驱”推动

云栖号资讯:【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 近段时间以来,“新基建”一次热度不断攀升,受到了科技、产业界的高度关注。实际上,新基建…

Spring Boot简单多线程定时任务实现 | @Async | @Scheduled

Spring Boot简单多线程定时任务实现 实现步骤 1 创建一个Spring Boot项目 2 定义定时任务: package com.jmd.timertasktest.task;import org.springframework.context.annotation.Configuration; import org.springframework.scheduling.annotation.Async; impor…

【机器学习】AI系统实时监测独居老人症状

云栖号资讯:【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 老年人是疫情中的高危人群。美国疾病控制与预防中心3月18日发布的报告显示,在美国,约80%新冠肺炎死者…

老码农90%的程序员都是瞎努力!这份路线教你成为高手

在大数据浪潮当中,数据分析是这个时代的不二“掘金技能”。我们每一个人,每天无时无刻都在生产数据,一分钟内,微博上新发的数据量超过10万,b站的视频播放量超过600万......这些庞大的数字,意味着什么&#…

构建实时数据仓库首选,云原生数据仓库AnalyticDB for MySQL技术解密

阿里云分析型数据库重磅推出基础版,极大降低了用户构建数据仓库门槛。高度兼容MySQL,极低的使用成本和极高的性能,使中小企业也可以轻松的搭建一套实时数据仓库,实现企业数据价值在线化。 AnalyticDB for MySQL的产品系列包括基础…

ElasticSearch 中的中文分词器该怎么玩?_03

内置分词器 ElasticSearch 核心功能就是数据检索,首先通过索引将文档写入 es。查询分析则主要分为两个步骤: 词条化:分词器将输入的文本转为一个一个的词条流。 过滤:比如停用词过滤器会从词条中去除不相干的词条(的&a…

阿里云安全运营中心:DDoS攻击趁虚而入,通过代理攻击已成常态

应用层DDoS攻击与传统的DDoS攻击有着很大不同。传统的DDoS攻击通过向攻击目标发起大流量并发式访问造成服务不可用,系统瘫痪,这种方式比较容易被识破,且市场上已经有成熟的应对方案。而近年来兴起的应用层DDoS攻击流量则会伪装成正常的流量&a…

中国移动云智融合峰会 | 1+1>2, 引领创新发展

云智融合,揽胜九天乘着“新基建”的东风,云计算、人工智能等新技术已成为新一轮科技革命的重要推动力。9月22日,由中国移动政企事业部、技术部主办,中国移动云能力中心、研究院承办,中国移动科协协办的中国移动云智融合…

云原生安全助力在线教育三分钟搞定安全防护

导语 这个假期,一场不期而遇的疫情让远程教学成为新常态。在线学习成为全国各地老师和学生们的统一方式。据交银国际研究部数据显示,疫情期间,在线教育企业加速获客,春节后日活跃用户数较春节期间增长5000万,用户活跃…

ElasticSearch 索引基本操作_04

文章目录1. 新建索引2. 索引注意事项3. 更新索引4. 索引权限5. 索引查看6. 删除索引7. 索引关闭和打开8. 索引复制9. 索引别名1. 新建索引 插件新建索引 通过 head 插件新建索引 在 head 插件中,选择 索引选项卡,然后点击新建索引。新建索引时&#xf…

从零开始入门 K8s | 理解 RuntimeClass 与使用多容器运行时

作者 | 贾之光 阿里巴巴高级开发工程师 本文整理自《CNCF x Alibaba 云原生技术公开课》第 30 讲,点击直达课程页面。 关注“阿里巴巴云原生”公众号,回复关键词“入门”,即可下载从零入门 K8s 系列文章 PPT。 一、RuntimeClass 需求来源 …

从程序媛到微软全球 AKS 女掌门人,技术女神驾到!

来源 | CSDN据 Stack Overflow 发布的《2020年开发者年度调查报告》显示,在参与统计的 65,000 名程序员中,92%是男性程序员,男女比例悬殊。可回首 IT 历史长河,热爱技术、富有创新思维、编程能力超群的“代码女神”们始…

ElasticSearch 文档的添加、获取、更新、删除_05

文章目录新建文档获取文档批量获取文档更新查询更新删除文档批量操作新建文档 首先新建一个索引。 然后向索引中添加一个文档: PUT blog/_doc/1 {"title":"6. ElasticSearch 文档基本操作","date":"2021-12-07","c…

构建实时数据仓库首选,云原生数据仓库技术解密

阿里云分析型数据库重磅推出基础版,极大降低了用户构建数据仓库门槛。高度兼容MySQL,极低的使用成本和极高的性能,使中小企业也可以轻松的搭建一套实时数据仓库,实现企业数据价值在线化。 AnalyticDB for MySQL的产品系列包括基础…

阿里宜搭发布专有云版本,基于云原生的应用构建PaaS平台

4月8日,阿里巴巴旗下0代码应用搭建平台“宜搭”发布专有云版本,可以基于阿里云专有云为客户实施专有云部署,实现客户数据的专有云存储,为政府、大型企业提供高稳定、高安全的应用搭建服务,支持业务在线,实现…

ElasticSearch 文档路由,你的数据到底存在哪一个分片上_06

es 是一个分布式系统,当我们存储一个文档到 es 上之后,这个文档实际上是被存储到 master 节点中的某一个主分片上。 例如新建一个索引,该索引有两个分片,0个副本,如下: 接下来,向该索引中保存…