Elasticsearch 8.X 分词插件版本更新不及时解决方案

1、关于 Elasticsearch 8.X IK 分词插件相关问题

球友在 ElasticSearch 版本选型问题中提及:如果要使用ik插件,是不是就使用目前最新的IK对应elasticsearch的版本“8.8.2”?

https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v8.8.2

如果要使用最新es版本,而IK没有对应的,老师有推荐的其他类似插件吗?谢谢!——问题来源:https://t.zsxq.com/13YX8fFQy

bb762d980d7915f5d5c143ba9cf90919.png

2、  说一下  Elasticsearch 中文分词插件

  • IK Analyzer

描述:基于词典的中文分词插件。

资源链接:https://github.com/medcl/elasticsearch-analysis-ik

目前业界使用相对广泛,尤其中小型企业。

  • HanLP

描述:基于NLP技术,提供了一系列中文处理能力的分词插件。

资源链接:https://github.com/KennFalcon/elasticsearch-analysis-hanlp
  • Jieba

描述:结巴分词的Elasticsearch插件版本。

资源链接:https://github.com/sing1ee/elasticsearch-jieba-plugin
  • Ansj

描述:速度快,能够识别新词的中文分词插件。

资源链接:https://github.com/NLPchina/elasticsearch-analysis-ansj
  • SmartCN

描述:Elasticsearch自带的基于Lucene的中文分词插件。

资源链接:Elasticsearch官方文档
  • MMSEG

描述:基于词典的复杂切分算法中文分词插件。5.X版本后未再更新

资源链接:https://github.com/medcl/elasticsearch-analysis-mmseg

根据具体的应用场景和需求,可以选择合适的中文分词插件。

另外,需要注意的是,当使用插件时要确保其版本与Elasticsearch版本相匹配,以避免可能出现的兼容性问题。

3、IK 分词插件如何使用最新版本?

开篇提及问题本质:Elasticsearch 更新版本快, 而 IK 更新较慢的问题。举例:如下图所示,当前是 2023年10月20日,Elasticsearch 最新版本为:8.10.4,而 IK 插件的版本为:8.9.0。

149c1952d19d30dd8222dedcd8e7e73f.png

44e72251c5c237fa539a6858e2aeaed0.png

两者类型不匹配,安装的时候会报错。

怎么办?这其实就是开篇问题所在。

咱们可以分析一下 IK 插件的代码,插件源码近1年+几乎没有任何更新。

也就是说:是不是只手动改一下配置文件,自己手动下载部署可不可以呢?

其实是可以的,咱们归拢一下步骤。

步骤1:下载当前最新的 IK 插件。

1c2140d1728a4d814fd35a5efe5c61be.png

步骤2:解压源码

这里的外层文件名是我手动由 8.9.0 改成 8.10.2 的,我的虚拟机集群是 8.10.2 版本。

36aaa913b4cb4a5a4e0a4aebf7a58650.png

修改配置:

36a1c166db9777604692129feff88d98.png

如上内容由原来的版本号 8.9.0,改成 8.10.2 就可以了!

完成后新版本打包,如下所示,打包为:elasticsearch-analysis-ik-8.10.2.zip文件。

ac37a2bb9767871c6dbbd83ecdae2482.png

步骤3:安装 Elasticsearch IK插件。

如下图所示,参考IK的文档,我们采取方式1。

8ecfd79816ff4b494e927710e4be162d.png

第一步:解压elasticsearch-analysis-ik-8.10.2.zip到如下的 plugins 下的 ik 文件夹下。

c0dc5f062bc16d7e1f8f017558126d51.png

ik 文件需要我们提前手动创建。

解压后效果:

第二步:重启 Elasticsearch。

088b0aed86bbda9d9a43920d3a301474.png

步骤4:验证 IK 插件是否成功。

这个创建个索引,指定映射中的某个字段为 ik_max_word 或者  ik_smart 就可以了。

PUT test_index_001
{"mappings": {"properties": {"title": {"type": "text","analyzer": "ik_max_word"}}}
}

4、小结

改动非常小,只为版本适配问题。更多类似问题,欢迎留言交流。

  • 推荐阅读

  • 全网首发!从 0 到 1 Elasticsearch 8.X 通关视频

  • 重磅 | 死磕 Elasticsearch 8.X 方法论认知清单

  • 如何系统的学习 Elasticsearch ?

  • 那些 ChatGPT4 也搞不定的 Elasticsearch 问题,请抛给我们!

84443e0da272f73c85c0dd71c98efc07.jpeg

更短时间更快习得更多干货!

中国50%+Elastic认证专家出自于此!

d8564eabb8553df345608531e9b1355c.gif

比同事抢先一步学习进阶干货!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/113220.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python异常及解决方法汇总

文章目录 1、flask异常:TypeError: __init__() got an unexpected keyword argument unbound_message参考文献 1、flask异常:TypeError: init() got an unexpected keyword argument ‘unbound_message’ 解决方法: pip install Flask2.1.3…

怎么获取开源的商城源码

前言 开源的商城源码是指可以自由获取、使用和修改的商城程序代码,通常由开源社区或个人开发者贡献和维护。有许多开源的商城源码可以用于建立自己的商城网站,这篇文章将为您介绍如何找到这些源码。 GitHub搜索 GitHub是一个国际知名的开源代码托管平…

K8s 概念及组件

K8s 的全称为Kubernetes,是一种开源的容器编排平台,用于自动化部署以及扩展和管理容器化的应用程序,它提供了一种容器编排和管理的方式,可以帮助开发人员更轻松的管理容器化的应用程序,并且提供了一种跨多个主机的自动…

Jmeter性能测试 —— jmeter之使用ServerAgent监控服务器

ServerAgent 性能测试时我们关注的重要指标是:并发用户数,TPS,请求成功率,响应时间,服务器的CPU,memory, I/O disk等。Jmeter的聚合报告可以查看并发数、吞吐量、请求成功率、响应时间等&#…

Reasoning with Language Model Prompting: A Survey

本文是LLM系列的文章,针对《Reasoning with Language Model Prompting: A Survey》的翻译。 语言模型提示推理:综述 摘要1 引言2 前言3 方法分类4 比较和讨论5 基准与资源6 未来方向7 结论与视角 摘要 推理作为解决复杂问题的基本能力,可以…

ERR_PNPM_LINKING_FAILED Error: EPERM: operation not permitted, rename

webstorm终端pnpm报错  ERR_PNPM_LINKING_FAILED  Error: EPERM: operation not permitted, rename ’ 报错原因:powershell权限不够 解决办法:提升权限/在文件打开Powershell安装依赖

发现一款非常好用的学术GPT,可形成知识库,并分析论文,根据观点生成文字

发现一款非常好用的学术GPT,支持CHATGPT3.5交互、论文分析与生成,目前作者并未全面推广,仅在小圈子里使用,可以保证后端api的使用稳定性,不会出现大量用户共享gpt 服务,导致gpt调用超时的情况。 使用方法&a…

java经典面试题总结

1.请简述Java的继承,重写和多态的概念和运用 继承是一种Java中重要的面向对象编程方式,它允许一个类从另一个类继承某些属性和方法,在这种关系下,子类可以重写父类的方法,从而实现不同的行为。 多态是继承实现的一种关…

关系数据库-postgresql-基础

文章目录 介绍linux下安装postgresql源码安装navicat连接 介绍 Postgresql官网开源的关系型数据库; linux下安装 Ubuntu下可以使用apt包管理器安装;参考地址CentOS下可以使用yum包管理器安装;OpenSuse下可以使用zypper包管理器安装&#xf…

基于Python3的Scapy构造DNS报文

一:DNS协议 DNS(Domain Name System)协议是计算机网络中的一种基础协议,它用于将域名(如www.baidu.com)转换为IP地址(如192.168.0.1),从而实现计算机之间的通信。 DNS 分…

React基础: 项目创建 JSX 基础语法 React基础的组件使用 useState状态 基础样式控制

01 React 文章目录 01 React一、React是什么1、React的优势 二、React开发环境搭建1、创建项目2、运行项目3、项目的目录结构 三、JSX基础1、什么是 JSX代码示例: 2、JSX使用场景2.1代码示例: 3、JSX中实现列表渲染4、JSX - 实现基本的条件渲染5、JSX - …

喜讯!持安科技入选2023年北京市知识产权试点单位!

近日,北京市知识产权局发布了“2023年度北京市知识产权试点示范单位及2020年度北京市知识产权试点示范单位复审通过名单”名单。 经过严格的初审、形式审核和专家评审,北京持安科技有限公司入选“2023年北京市知识产权试点单位”。 北京市知识产权试点示…

并发性Socket通信源码(基于linux环境下多线程)

服务器端&#xff1a;server.c 1 #include <stdio.h>2 #include <stdlib.h>3 #include <unistd.h>4 #include <string.h>5 #include <arpa/inet.h>6 #include <pthread.h>7 void* working(void *arg);8 //信息结构体9 struct sockinfo10 …

《数据结构、算法与应用C++语言描述》-队列的应用-图元识别问题

《数据结构、算法与应用C语言描述》-队列的应用-图元识别问题 图元识别 问题描述 数字化图像是一个 mxm 的像素矩阵。在单色图像中&#xff0c;每一个像素要么为0&#xff0c;要么为 1。值为0的像素表示图像的背景。值为1的像素表示图元上的一个点&#xff0c;称其为图元像素…

BLUE引擎变量数据分析

今天跟大家说一下BLUE引擎的变量运用&#xff0c;以及使用中的小细节。大家在使用变量的时候&#xff0c;自定义变量不要以P、G、M、I、D、N、A开头。 变量与变量之间的常用格式: SMALL M88 <$STR(G88)> ;检测私人变量M88&#xff0c;是否小于全局变量G88 LARGE M88 &l…

Rust错误处理

返回值和错误处理 panic 深入剖析 主动调用 fn main() {panic!("crash and burn"); }backtrace 栈展开 panic 时的两种终止方式 当出现 panic! 时&#xff0c;程序提供了两种方式来处理终止流程&#xff1a;栈展开和直接终止 何时该使用 panic! 先来一点背景知…

分布式定时任务xxljob

xxl-job的xxl为作者名徐雪里拼音首字母。 xxl-job的作者是2015年开始开发这个项目&#xff0c;那时候springmvcbootstrapadminlte 大行其道&#xff0c;所以这个框架调度器一直沿用这个架构。 一、运行调度器 调度器可以集群或单点运行&#xff0c;以单点运行为例 下载代码…

前端 CSS 经典:box-shadow

1. 基础属性 /* box-shadow: h-shadow v-shadow blur spread color inset; */ box-shadow: 10px 10px 2px 2px red inset; h-shadow: 必填&#xff0c;水平阴影的位置&#xff0c;允许负值 v-shadow: 必填&#xff0c;垂直阴影的位置&#xff0c;允许负值 blur: 可选&#xff…

Linux shell编程学习笔记14:编写和运行第一个shell脚本hello world!

* 20231020 写这篇博文断断续续花了好几天&#xff0c;为了说明不同shell在执行同一脚本文件时的差别&#xff0c;我分别在csdn提供线上Linux环境 &#xff08;使用的shell是zsh&#xff09;和自己的电脑上&#xff08;使用的shell是bash&#xff09;做测试。功夫不负有心人&am…

视频怎么压缩?视频过大这样压缩变小

在日常生活中&#xff0c;我们常常会遇到需要压缩视频的情况&#xff0c;视频压缩不仅可以减小文件大小&#xff0c;方便存储和传输&#xff0c;还可以在保证质量的同时&#xff0c;满足不同的使用需求。那么&#xff0c;如何有效地压缩视频呢&#xff1f; 方法一&#xff1a;嗨…