ES学习日记(八)-------ik安装和简易使用

一、下载和安装

https://github.com/infinilabs/analysis-ik.git

网络不好可以用这个地址,注意:ik版本要和es版本保持一致

现成地址

注意es用户操作或给es用户权限

plugins新建ik文件夹,并把压缩包解压到ik

unzip elasticsearch-analysis-ik-7.4.2.zip

/bin目录启动es:

二、简易使用

1.新建索引

打开head,新建索引ik

没有安装head的同学也可以直接敲命令创建索引(分片数5,副本数1),

curl -X PUT http://localhost:9200/ik -H 'Content-Type:application/json' -d'{"settings":{"number_of_shards":5"number_of_replicas": 1}
}'
2.创建索引映射

映射:可以理解为mysql里面的字段,字段有varchar、double、bigint等;

常见类型有text(可以做分词)、keyword(关键词,无法分词)double、integer

官方解释如下图:

命令

curl -XPOST http://localhost:9200/ik/_mapping -H 'Content-Type:application/json' -d'{"properties":{"content":{"type": "text","analyzer":"ik_max_word","search_analyzer":"ik_smart"}}
}'

Analyzer分词配置解释:
·ik smart:粗粒度分词,比如中华人民共和国国歌,会拆分为中华人民共和国,国歌,
ik max_word:细粒度分词,比如中华人民共和国国歌,会拆分为中华人民共和国,中华人民,中华,华人人民共和国,人民,人,民,共和国,共和,和,国国,国歌,会穷尽各种可能的组合。

3.添加数据

示例数据:

curl -XPOST http://localhost:9200/ik/_create/1 -H 'Content-Type:application/json' -d'{"content":"美国留给伊拉克的是个烂摊子吗"}'
curl -XPOST http://localhost:9200/ik/_create/2 -H 'Content-Type:application/json' -d'{"content":"公安部:各地校车将享最高路权"}'
curl -XPOST http://localhost:9200/ik/_create/3 -H 'Content-Type:application/json' -d'{"content":"中韩渔警冲突调查:韩警平均每天扣1艘中国渔船"}'
curl -XPOST http://localhost:9200/ik/_create/4 -H 'Content-Type:application/json' -d'{"content":"中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"}'

执行结果:不要关注过程,过程不重要...

打开head,切换索引ik,点击搜索查看刚才插入的数据

4.查询

没有head的同学用命令:

curl -XGET http://localhost:9200/ik/_search?pretty -H 'Content-Type:application/json' -d'{"query": {"term" :{"content" : "中国"}}
}'

高亮查询,看标签,命令应该没问题

curl -XGET http://localhost:9200/ik/_search?pretty -H 'Content-Type:application/json' -d'
{"query" : { "match" : { "content" :"中国"}},"highlight" :{"pre_tags" :["<font color=red>" ],"post_tags" :["</font>"],"fields" :{"content" :{}}}
}'

写在最后

ik分词器有自己的分词规则,比如我拿刚才数据,搜"中"的结果

所以,这个分词,不是说有这个字,我就能分到,是有自己的规则的,是在添加数据时,按照规则进行分词,不是他的词,分不出来也搜不到,这点注意一下。

好了,这就是ik中文分词器,其实不需要做太多,就把分词器放到plugins里面启动,然后设置mapping,试着analyzer就可以了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/788306.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GPT4不限制使用次数了!GPT5即将推出了!

今天登录到ChatGPT Plus账户&#xff0c;出现了如下提示&#xff1a; 已经没有了数量和时间限制的提示。 更改前&#xff1a;每 3 小时限制 40 次&#xff08;团队计划为 100 次&#xff09;&#xff1b;更改后&#xff1a;可能会应用使用限制。 GPT-4放开限制 身边订阅了Ch…

Quill文档(四):使用Parchment克隆Medium

为了提供一致的编辑体验&#xff0c;您需要一致的数据和可预测的行为。不幸的是&#xff0c;DOM缺乏这两个特性。现代编辑器的解决方案是维护自己的文档模型来表示它们的内容。对于Quill来说&#xff0c;Parchment就是这样的解决方案。它在自己的代码库中组织&#xff0c;并拥有…

使用 PyArmor 加密一个 Python 包

如果你想要使用 PyArmor 加密一个 Python 包&#xff08;也就是一个包含多个模块的目录&#xff09;&#xff0c;你可以按照以下步骤进行&#xff1a; 安装 PyArmor&#xff1a;首先确保 PyArmor 已经被安装在你的环境中。如果未安装&#xff0c;可以通过 pip 安装&#xff1a;…

elment UI el-date-picker 月份组件选定后提交后台页面显示正常,提交后台字段变成时区格式

需求&#xff1a;要实现一个日期的月份选择<el-date-picker :typeformData.dateType :value-formatdateFormat v-modelformData.leaveFactoryDateplaceholder选择月份></el-date-picker>错误示例&#xff1a;将日期显示类型(type)dateType或将日期绑定值的格式(val…

LabVIEW专栏三、探针和断点

探针和断点是LabVIEW调试的常用手段&#xff0c;该节以上一节的"测试耗时"为例 探针可以打在有线条的任何地方&#xff0c;打上后&#xff0c;经过这条线的所有最后一次的数值都会显示在探针窗口。断点可以打在程序框图的所有G代码对象&#xff0c;包括结构&#xf…

【stm32】USART编码部分--串口数据包

USART串口数据包【源码放在最后】 关于数据包的分类 关于数据包的发送 如果想要发送Hex数据包&#xff0c;定义一个数组填充数据&#xff0c;然后使用串口模块函数SendArray进行发送 如果想要发送文本数据包&#xff0c;写一个字符串然后调用SendString进行发送 对于发送数据…

Spark 起源发展与项目架构说明

文章目录 前言Spark 的起源Spark 是什么速度易用性模块化可扩展性 分析方法的统一Spark SQLSpark MLlibSpark Structured StreamingGraphX Spark的分布式执行Spark driverSparkSessionCluster managerSpark executor部署模式分布式数据和分区 开发的经验Spark 的使用人群与使用…

关于其他服务器篡改请求头导致登录失效

问题描述 此问题是单点登录转发问题&#xff0c;客户服务器域名访问一个本程序对外接口获取token&#xff0c;并跳转至本系统登录页面&#xff0c;在网关日志中发现token为空的异常。 问题排查 1、拿token在postman中发送&#xff0c;发现请求是成功的&#xff0c;本程序通过n…

App测试中ios和Android的区别

1、Android长按home键呼出应用列表和切换应用&#xff0c;然后右滑则终止应用&#xff1b; 2、多分辨率测试&#xff0c;Android端20多种&#xff0c;ios较少&#xff1b; 3、手机操作系统&#xff0c;Android较多&#xff0c;ios较少且不能降级&#xff0c;只能单向升级&…

InfluxDB2的数据查询示例

有用influxdb2 不支持sql&#xff0c;并且实质是个列存储数据库&#xff0c;这里基于 influxdb-client-java 和 beanutils反射&#xff0c;写了个数据查询&#xff0c;把结果以行对象的形式返回的工具类。 package com.joy.malltools.influxdb2;import com.influxdb.client.Q…

越南工厂连接中国总部服务器解决方案---案例分享

随着全球化的不断深入&#xff0c;许多中国企业走出国门&#xff0c;在世界各地设立分支机构和生产基地。然而&#xff0c;随之而来的是跨国网络通信的挑战。近期&#xff0c;客户越南的工厂与中国总部之间的网络连接出现了一些问题&#xff0c;这直接影响了企业的日常运营效率…

vscode shadertoy插件,非常方便的glsl着色器编写工具

很著名的shadertoy网站&#xff0c;集合了非常多大神利用数学写出美妙的shader效果。像shadertoy创始人之一的IQ大神它在这方面有很多的建树。他的利用光线步进和躁声可以创建很多不可思议的3D场景。 vscode有一件shadertoy的插件&#xff0c;安装后可以新建一个*.glsl文件&am…

使用 FinalShell 进行远程连接(ssh 远程连接 Linux 服务器)

目录 前言 基本使用教程 新建远程连接 连接主机 自定义命令 路由追踪 前言 后端开发&#xff0c;必然需要和服务器打交道&#xff0c;部署应用&#xff0c;排查问题&#xff0c;查看运行日志等等。一般服务器都是集中部署在机房中&#xff0c;也有一些直接是云服务器&am…

Synchronized锁升级过程

无锁-->偏向锁---> 轻量级锁---->重量级锁 ①、从无锁到偏向锁&#xff1a; 当一个线程首次访问同步块时&#xff0c;如果此对象无锁状态且偏向锁未被禁用&#xff0c;JVM 会将该对象头的锁标记改为偏向锁状态&#xff0c;并记录下当前线程的 ID。此时&#xff0c;对…

IntelliJ IDEA - 快捷键 Win Mac 对照表

基本 Ctrl CommandAlt Option WinMacCtrl YCommand DeleteCtrl WOption 方向键上Ctrl NCommand OCtrl F11Option F3Shift F11Command F3Ctrl SpaceControl SpaceCtrl 方向键Option 方向键Alt Control VAlt EnterOption EnterAlt InsertCommand NAlt 方…

Flume学习笔记

视频地址:https://www.bilibili.com/video/BV1wf4y1G7EQ/ 定义 Flume是一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输的系统。 Flume高最要的作用就是实时读取服务器本地磁盘的数据,将数据写入HDFS。 官网:https://flume.apache.org/releases/content/1.9.0/…

云智慧发布对象关系型数据库CloudPanguDB,打破传统技术壁垒

近日&#xff0c;云智慧推出关系型数据库CloudPanguDB&#xff08;中文名称&#xff1a;盘古数据库&#xff09;&#xff0c;旨在通过高兼容性能和创新技术架构&#xff0c;降低企业项目整体运营成本。 无论是处理海量复杂数据&#xff0c;还是构建清晰有序的数据结构关系&…

练习 17 Web [极客大挑战 2019]PHP

常见的网站源码备份文件名和后缀&#xff0c;反序列化攻击 unserialize()&#xff1a;wakeup绕过&#xff0c;private类以及属性序列化后的%00修改 开靶机 提到”备份“ 那看看有没有backup.php啥的 如果网站存在备份文件&#xff0c;常见的备份文件后缀名有&#xff1a;“.gi…

嵌入式数据库-Sqlite3

阅读引言&#xff1a; 本文将会从环境sqlite3的安装、数据库的基础知识、sqlite3命令、以及sqlite的sql语句最后还有一个完整的代码实例&#xff0c; 相信仔细学习完这篇内容之后大家一定能有所收获。 目录 一、数据库的基础知识 1.数据库的基本概念 2.常用数据库 3.嵌入式…

Qt中的OpenGL

一、OpenGL简介 1.1什么是OpenGL Open Graphics Library&#xff0c;它是一个由Khronos组织制定并维护的规范(Specification)OpenGL核心是一个C库&#xff0c;同时也支持多种语言的派生 1.2 核心模式&#xff08;Core-profile&#xff09; 也叫可编程管线&#xff0c;提供了…