怎么安装IK分词器

.安装IK分词器

1.在线安装ik插件(较慢)

# 进入容器内部
docker exec -it elasticsearch /bin/bash
​
# 在线下载并安装
./bin/elasticsearch-plugin  install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip
​
#退出
exit
#重启容器
docker restart elasticsearch

2.离线安装ik插件(推荐)

1)查看数据卷目录

安装插件需要知道elasticsearch的plugins目录位置,而我们用了数据卷挂载,因此需要查看elasticsearch的数据卷目录,通过下面命令查看:

docker volume inspect es-plugins

显示结果:

[{"CreatedAt": "2022-05-06T10:06:34+08:00","Driver": "local","Labels": null,"Mountpoint": "/var/lib/docker/volumes/es-plugins/_data","Name": "es-plugins","Options": null,"Scope": "local"}
]

说明plugins目录被挂载到了:/var/lib/docker/volumes/es-plugins/_data这个目录中。

2)解压缩分词器安装包

下面我们需要把课前资料中的ik分词器解压缩,重命名为ik

链接:https://pan.baidu.com/s/1KLi71wyX4Znq7GE0jCRUUg?pwd=a3km 
提取码:a3km

3)上传到es容器的插件数据卷中

也就是/var/lib/docker/volumes/es-plugins/_data

把解压的文件拉到数据卷中:

4)重启容器

# 4、重启容器
docker restart es
# 查看es日志
docker logs -f es

5)测试:

IK分词器包含两种模式:

  • ik_smart:最少切分

  • ik_max_word:最细切分

GET /_analyze
{"analyzer": "ik_max_word","text": "北京欢迎你我家大门常打开"
}

结果:

{"tokens" : [{"token" : "北京","start_offset" : 0,"end_offset" : 2,"type" : "CN_WORD","position" : 0},{"token" : "欢迎","start_offset" : 2,"end_offset" : 4,"type" : "CN_WORD","position" : 1},{"token" : "你我","start_offset" : 4,"end_offset" : 6,"type" : "CN_WORD","position" : 2},{"token" : "我家","start_offset" : 5,"end_offset" : 7,"type" : "CN_WORD","position" : 3},{"token" : "大门","start_offset" : 7,"end_offset" : 9,"type" : "CN_WORD","position" : 4},{"token" : "常打","start_offset" : 9,"end_offset" : 11,"type" : "CN_WORD","position" : 5},{"token" : "打开","start_offset" : 10,"end_offset" : 12,"type" : "CN_WORD","position" : 6}]
}

扩展词词典和停用词词典

1)打开IK分词器config目录:

 2)在IKAnalyzer.cfg.xml配置文件内容添加并创建文件:

3)重启elasticsearch

docker restart es

完事

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/620140.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

学习笔记-数据容器:dict(字典)

一.字典的定义 1.语法 使用{ }存储原始,每一个元素是一个键值对每一个键值对包含Key和Value(用冒号分隔)键值对之间使用逗号分隔Key和Value可以是任意类型的数据(key不可为可变类型(列表集合字典))Key不可重复&#…

LeetCode304. Range Sum Query 2D - Immutable

文章目录 一、题目二、题解 一、题目 Given a 2D matrix matrix, handle multiple queries of the following type: Calculate the sum of the elements of matrix inside the rectangle defined by its upper left corner (row1, col1) and lower right corner (row2, col2)…

蓝桥——第 3 场 小白入门赛(A-D)

文章目录 一、题目A.召唤神坤基本思路:代码 B.聪明的交换策略基本思路:代码 C.怪兽突击基本思路:代码 D.蓝桥快打基本思路代码 一、题目 A.召唤神坤 基本思路: 贪心, 使结果最大,希望两边w[i],w[k]是较大…

Oracle数据库 CentOS7上修改hostname后无法启动解决办法

目录 一、问题背景 二、解决问题 三、重启数据库 四、重启监听 一、问题背景 CentOS系统需要修改hostname,修改后oracle数据库无法启动和正常运行。 系统:CentOS7.3 数据库版本:Oracle 11g Express Edtion 二、解决问题 通过which orac…

提交代码,SVN被锁定,提示:svn is already locked解决方案

今天遇到一个问题,svn 在提交代码的时候出现了svn is already locked,解决方案如下图 点击clean up 点击ok即可 来看官方对clean up的解释:它的作用就是查找工作拷贝中的所有遗留的日志文件,删除进程中工作拷贝的锁。 参考&…

tl431几种不常见的接法

tl431可调电源电路图分析 精密电压基准IC TL431是我们常见的精密电压基准IC ,应用非常广泛。其输出压连续可调达36V,工作电流范围宽达0.1--100mA,动态电阻典型值为0.22欧,输出杂波低。图1是利用它作电压基准和驱动外加场效应管K7…

(学习日记)2024.01.09

写在前面: 由于时间的不足与学习的碎片化,写博客变得有些奢侈。 但是对于记录学习(忘了以后能快速复习)的渴望一天天变得强烈。 既然如此 不如以天为单位,以时间为顺序,仅仅将博客当做一个知识学习的目录&a…

Springboot WebFlux项目结合mongodb进行crud

第一步:创建项目 第二步:给mongodb插入数据 第三步:创建实体类 package org.cyl.test02.entity;// Task.java import lombok.Data;Data public class Task {private String id;private String description; }第四步:创建Reposito…

CSS 面试题

CSS 面试题 1. 什么是盒模型(Box Model)?它由哪些部分组成? 答案:盒模型是指在 CSS 中,每个元素都被看作是一个矩形的盒子,该盒子由四个部分组成:内容(content&#xf…

C语言指针进阶学习心得-函数指针,指针函数,指针数组,数组指针

一&#xff1a;指针数组和数组指针 1.指针数组&#xff1a;指针数组的元素都是指向某种数据类型的指针 例&#xff1a; 声明方式&#xff1a;int *ptr[3]; ptr数组的元素都是指向int类型的数据 #include <stdio.h>int main() { int *ptr[3];//数组…

FreeRTOS 学习相关笔记 附C语言内容补充

学习视频为【正点原子】手把手教你学FreeRTOS实时系统 文章目录 RTOS 入门裸机RTOSFreeRTOS任务调度方式任务状态 FreeRTOS 移植系统配置文件 API函数任务创建和删除动态方式创建任务静态方式创建任务删除任务 任务挂起和恢复函数调度器挂起与恢复临界区任务调度器的挂起和恢复…

鸿蒙开发已解决-Failed to connect to gitee.com port 443: Time out 连接超时提示

文章目录 项目场景:问题描述原因分析:解决方案:解决方案1解决方案2:解决方案3:此Bug解决方案总结解决方案总结**心得体会:解决连接超时问题的三种方案**项目场景: 导入Sample时遇到导入失败的情况,并提示“Failed to connect to gitee.com port 443: Time out”连接超…

实战使用工具appuploader上线发布苹果商店

实战使用工具appuploader上线发布苹果商店 我们发布ios应用的时候&#xff0c;步骤繁琐&#xff0c;非常耗时&#xff0c;appuploader工具就是解决一站式从上传到发布到appstore应用商店的&#xff0c;当我们开发完app后&#xff0c;需要将ipa/apk提交给测试人员测试&#xff0…

【python】No module named ‘pip‘问题

一、问题描述 win11上安装的Python版本有几个&#xff0c;不知道那里出问题了。用pip总是提示&#xff1a; Traceback (most recent call last): File "<frozen runpy>", line 198, in _run_module_as_main File "<frozen runpy>", line …

完整的JAVA酒店管理系统源码带安装部署文档

完整的JAVA酒店管理系统源码带安装部署文档 002.png (135.63 KB, 下载次数: 0) 下载附件 设为封面 半小时前 上传

鸿蒙开发现在就业前景怎样?

随着科技的不断进步&#xff0c;鸿蒙系统逐渐崭露头角&#xff0c;成为智能设备领域的一颗新星。作为华为自主研发的操作系统&#xff0c;鸿蒙系统拥有着广阔的市场前景和就业机会。那么&#xff0c;鸿蒙开发的就业前景究竟怎样呢&#xff1f; 一、市场需求持续增长 随着鸿蒙…

OpenHarmony源码解析之编译构建

前言 OpenHarmony是由开放原子开源基金会&#xff08;OpenAtom Foundation&#xff09;孵化及运营的开源项目&#xff0c;目标是面向全场景、全连接、全智能时代、基于开源的方式&#xff0c;搭建一个智能终端设备操作系统的框架和平台&#xff0c;促进万物互联产业的繁荣发展…

Redis五大数据类型以及相关操作

Redis五大数据类型 文章目录 Redis五大数据类型key字符串string操作命令列表list集合set哈希hash有序集合zset (sorted set) key keys * 查看当前库的所有键exists <key> 判断某个键是否存在type <key> 查看键的类型del <key> 删除某个键expire <key>…

vue3-计算属性

计算属性 模板中的表达式虽然方便&#xff0c;但也只能用来做简单的操作。如果在模板中写太多逻辑&#xff0c;会让模板变得臃肿&#xff0c;难以维护。 根据作者今年是否看过书展示不同信息 <script lang"ts" setup> import { ref, reactive } from "…

Spring DI的理解和实现方式

Spring DI&#xff1a; 名词解释&#xff1a;依赖注入&#xff0c;是对IOC概念的不同角度的描述&#xff0c;是指应用程序在运行时&#xff0c; 每一个bean对象都依赖IOC容器注入当前bean对象所需要的另外一个bean 对象。&#xff08;例如在MyBatis整合Spring时&#xff0c;Sq…