【ES】--ES集成自定义分词库

目录

  • 一、相关安装
    • 1、(window单机)elasticsearch安装
    • 2、安装Elasticvue插件
    • 3、ik分词器插件
    • 4、ES集成自定义词库

一、相关安装

1、(window单机)elasticsearch安装

Win10下下载ES组件,安装部署如下:JDK1.8、elasticsearch-7.3.2-windows-x86_64。
ElasticSearch下载地址:
https://www.elastic.co/downloads/elasticsearch
下载zip后,解压即可。双击执行bin目录下的elasticsearch.bat
在这里插入图片描述
浏览器输入:http://localhost:9200/ 有返回就表明成功。

2、安装Elasticvue插件

安装 Kibana 可能需要大量的磁盘空间及消耗内存。Elasticvue 是用vue开发的Elasticsearch的免费开源图形化操作插件,可以直接在浏览器中搜索和过滤集群数据,支持的功能如下:
集群概览
索引管理
搜索界面
查询接口(REST & API 浏览器)
快照管理
实用程序
在这里插入图片描述

3、ik分词器插件

ik分词器下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases?page=8
选择和ES相同版本
在这里插入图片描述
将下载的安装包在es安装目录下的plugins下新建一个ik文件夹、将文件解压。
在这里插入图片描述
再重新启动elasticsearch.bat,对应ik分词器就启动成功。
在这里插入图片描述
或者cmd输入命令也可确认安装的分词器有哪些

elasticsearch-plugin list
在这里插入图片描述
ik分词器主要有[“analyzer”: “ik_smart”]、[“analyzer”: “ik_max_word”]

4、ES集成自定义词库

在…\elasticsearch-7.3.2\plugins\ik\config下找到IKAnalyzer.cfg.xml,并打开,如下添加一个自定义的扩展字典myDict.dic,在这里添加词语,并设置编码格式是UTF-8。
在这里插入图片描述
如果是多个自定义词典,就用;拼接。
在这里插入图片描述
重启ES,如下表明已经加载了自定义的字典myDict.dic。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/681059.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Debezium发布历史124

原文地址: https://debezium.io/blog/2022/06/21/debezium-1-9-4-final-released/ 欢迎关注留言,我是收集整理小能手,工具翻译,仅供参考,笔芯笔芯. Debezium 1.9.4.Final Released June 21, 2022 by Chris Cranford …

qt “美颜”

要想成为一名优秀的qt工程师 学会使用qss编程也是重要的 不可获缺的一部分 qss 简介和优势 QSS(Qt Style Sheets)是一种用于定义Qt应用程序界面外观和样式的样式表语言。它类似于CSS(层叠样式表),但针对Qt框架进行了定…

末两位数(1992)_题解

【题解提供者】吴立强 解法 思路 指数函数增长速率过快,直接计算中间过程任何一种基本类型都无法存储。 通过乘法运算的规律,可以发现末两位数只和末两位数相关,故直接对中间结果保留末两位数(mod 100)即可避免乘法…

每日五道java面试题之java基础篇(七)

第一题. HashMap和HashTable有什么区别?其底层实现是什么? 区别 : HashMap⽅法没有synchronized修饰,线程⾮安全,HashTable线程安全;HashMap允许key和value为null,⽽HashTable不允许 底层实现…

容器高级知识: 适配器模式与 Sidecar 模式的区别

适配器模式与 Sidecar 模式的区别 在 Kubernetes 中,适配器模式和 Sidecar 模式都是扩展您的主应用程序容器功能的方法,但它们具有不同的目的和功能: Sidecar 模式: 通用目的: 为主应用程序提供 补充功能&#xff0…

(十五)springboot实战——spring securtity的核心过滤器介绍

前言 本节内容主要介绍spring securtity安全框架的一些核心过滤器及其作用,我们都清楚spring securtity安全框架底层是基于filter过滤器实现的,采用的是责任链的设计模式,它有一条很长的过滤器链。本次spring securtity原理介绍使用的版本是…

H12-821_31

31.下面是一台路由器的部分配置,关于该配置描述正确的是: A.源地址为1.1.1.1的数据包匹配第一条ACL语句rule 0,匹配规则为允许 B.源地址为1.1.1.3的数据包匹配第三条ACL语句rule 2,匹配规则为拒绝 C.源地址为1.1.1.4的数据包匹配第四条ACL语句rule 3,匹配规则为允许 D.源地址为…

Android13多媒体框架概览

Android13多媒体框架概览 Android 多媒体框架 Android 多媒体框架旨在为 Java 服务提供可靠的接口。它是一个系统,包括多媒体应用程序、框架、OpenCore 引擎、音频/视频/输入的硬件设备,输出设备以及一些核心动态库,比如 libmedia、libmedi…

探索Gorm - Golang流行的数据库ORM框架

🏷️个人主页:鼠鼠我捏,要死了捏的主页 🏷️系列专栏:Golang全栈-专栏 🏷️个人学习笔记,若有缺误,欢迎评论区指正 前些天发现了一个巨牛的人工智能学习网站,通俗易懂&…

14.7 OpenGL图元装配和光栅化:早期各片段测试

早期各片段测试 Early Per-Fragment Tests layout(early_fragment_tests) in; 如果片段着色器指定了 Early_fragment_tests 布局限定符,则将在片段着色器执行之前执行本节中描述的每个片段测试。 否则,它们将在片段着色器执行后执行。在光栅化阶段生成片…

自动化测试工具

自动化测试工具有很多种,比如: Appium 。Appium是一个移动端自动化测试开源工具,支持iOS和Android平台,支持Python、Java等语言,即同一套Java或Python脚本可以同时运行在iOS和Android平台。 Appium是一个开源测试自动…

8个Python编程进阶常用技巧!

前言 介绍 Python 炫酷功能(例如,变量解包,偏函数,枚举可迭代对象等)的文章层出不穷。但是还有很多 Python 的编程小技巧鲜被提及。因此,本文会试着介绍一些其它文章没有提到的小技巧,这些小技…

多态

多态的基本语法 多态分为两类 静态多态: 函数重载 和 运算符重载属于静态多态,复用函数名动态多态: 派生类和虚函数实现运行时多态 静态多态和动态多态区别: 静态多态的函数地址早绑定 - 编译阶段确定函数地址动态多态的函数地址晚绑定 - 运行阶段确…

中科大计网学习记录笔记(十):P2P 应用

前言: 学习视频:中科大郑烇、杨坚全套《计算机网络(自顶向下方法 第7版,James F.Kurose,Keith W.Ross)》课程 该视频是B站非常著名的计网学习视频,但相信很多朋友和我一样在听完前面的部分发现信…

Centos7离线安装MySQL5.7

卸载mariadb rpm -e --nodeps mariadb-libs可以使用rpm -qa|grep mariadb命令检测是否卸载完成。 关闭selinux 将/etc/selinux/config文件中的SELINUX设置为disabled下载MySql的相关rpm包 打开https://dev.mysql.com/downloads/mysql/ 选择Red Hat Enterprise Linux / Oracle L…

Linux 终端入门

简介 这个教程是 Linux 基础知识系列中的第一篇,涵盖了如何开始使用终端、Linux 命令行以及执行命令。如果你是 Linux 新手,你需要熟悉终端,因为它是与 Linux 服务器交互的标准方式。 这个教程是针对 Ubuntu 22.04 服务器编写的&#xff0c…

离散数学截图

二元运算及其性质 二元运算中的特殊元 半群和独异点 代数系统的同态与同构 下确界是最大的下界,而在4、5、6三个下界里面,4和5都比6大。可4和5之间没办法分出大小,所以这个哈斯图没有下确界

操作系统面试问题——说一下什么是零拷贝?

零拷贝是一种IO操作优化技术,主要用于减少CPU在用户态和内核态之间的上下文切换次数以及减少数据拷贝次数,可以显著提高数据传输的效率。 传统的拷贝方式需要频繁的切换状态,读数据时需要将数据从硬盘加载到内核缓冲区,再从内核缓…

Git、github与gitee码云

1.git核心是两个仓库:本地仓库和远程仓库 主要用于团队合作和代码版本控制(个人现有版本代码出错可回溯上个提交版本的代码) 远程仓库国际主流githut,但外网速度问题,国内可使用码云gitee github:https:…

Ping的过程详解

Ping是一种常用的网络工具,用于测试与目标主机之间的网络连接和延迟。下面是Ping的基本过程: 发送ICMP Echo请求: 发起Ping操作的主机(通常是客户端)会构建一个ICMP Echo请求报文,将其发送给目标主机&…