为Elasticsearch添加中文分词

Elasticsearch的中文分词很烂,所以我们需要安装ik。首先从github上下载项目,解压:

  1. cd /tmp
  2. wget https://github.com/medcl/elasticsearch-analysis-ik/archive/master.zip
  3. unzip master.zip
  4. cd elasticsearch-analysis-ik/

然后使用mvn package 命令,编译出jar包 elasticsearch-analysis-ik-1.4.0.jar。

  1. mvn package

将jar包复制到Elasticsearch的plugins/analysis-ik 目录下,再把解压出的ik目录(配置和词典等),复制到Elasticsearch的config 目录下。然后编辑配置文件elasticsearch.yml ,在后面加一行:

  index.analysis.analyzer.ik.type : "ik"

重启service elasticsearch restart 。搞定

准备工作:创建索引,录入测试数据

先为后面的分词器效果对比做好准备,我的Elasticsearch部署在虚拟机 192.168.159.159:9200 上的,使用chrome的postman插件直接发http请求。第一步,创建index1 索引:

转载于:https://www.cnblogs.com/ytfcz/p/4275639.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/460512.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mmc命令(do_mmcops函数的源码分析)

以下内容源于网络资源的学习与整理,如有侵权请告知删除。 在文章如何将镜像烧写至iNand(fastboot命令的源码分析)中写到,system、kernel、bootloader的烧写都是write_to_ptn函数直接或间接调用do_mmcops函数来完成的。这里简单分…

你知道自己执行的是哪个jre吗?

多个JRE 我在做《Java日志工具之java.util.logging.Logger》的DEMO时,修改java.util.logging.Logger的配置文件,怎么修改都不起作用,因此打印了系统属性"java.home",才知道自己使用的是 C:\Program Files\Java\jre7 &am…

lvs-健康检查方式

一、TCP 4层检查virtual_server 192.168.2.213 80 { delay_loop 6 lb_algo wlc #采取权重式最少链接分配 lb_kind DR #采取DR模式protocol TCPreal_server 192.168.2.220 80 { TCP_CHECK { #TCP 检查 connect_port 4000 con…

Leetcode编程事宜

中文网站 题库 - 力扣 (LeetCode) 全球极客挚爱的技术成长平台 英文网站 Problems - LeetCode 账号相关 账号是主邮箱账号,密码是“姓的拼音身份证后6位”。 编程计划 (1)先从简单的题目刷起。 (2)不要求每道题都要解答…

JAXB解析XML

首先根据XML文件编写.xsd文件&#xff0c;例如&#xff1a; <?xml version"1.0" encoding"UTF-8"?><schema xmlns:tns"www.hisense.com" xmlns"http://www.w3.org/2001/XMLSchema" targetNamespace"www.hisense.com&q…

无需写try/catch,也能正常处理异常

对于企业应用的开发者来说&#xff0c;异常处理是一件既简单又复杂的事情。说其简单&#xff0c;是因为相关的编程无外乎try/catch/finallythrow而已&#xff1b;说其复杂&#xff0c;是因为我们往往很难按照我们真正需要的策略来处理异常。我一直有这样的想法&#xff0c;理想…

vs2010插件

转载于:https://www.cnblogs.com/tinytiny/p/3608030.html

leetcode1——两数之和

一、提出问题 给定一个整数数组 nums 和一个整数目标值 target&#xff0c;请你在该数组中找出 和为目标值 target 的那 两个 整数&#xff0c;并返回它们的数组下标。 你可以假设每种输入只会对应一个答案。但是&#xff0c;数组中同一个元素在答案里不能重复出现。 你可以按…

iOS性能优化技术

小小总结&#xff0c;后续继续跟进。 1. 提高应用性能的几个开发细节 * 尽量避免使用constraint实现动画 * 尽量避免使用数组的删除操作 * 尽量避免使用 NSString&#xff1a;&#xff1a;stringWithFormat * 尽量避免使用 NSImage&#xff1a;&#xff1a;imageWithContentOfF…

如何脱离SDK,使用DW5.5和phonegap以及JQMobile搭建开发环境

也许有些人是学C出身&#xff0c;对于Java几乎不了解。一时心血来潮想学学android开发&#xff0c;于是下载了Eclipse&#xff0c;安装了SDK&#xff0c;有模有样的学习起来。也许是懒惰了&#xff0c;对于java一直总是提不起精神。于是确定使用DreamweaverJquery mobilePhoneg…

leetcode2——两数相加

一、提出问题 给你两个非空的链表&#xff0c;表示两个非负的整数。它们每位数字都是按照逆序的方式存储的&#xff0c;并且每个节点只能存储一位数字。请你将两个数相加&#xff0c;并以相同形式返回一个表示和的链表。 你可以假设除了数字 0 之外&#xff0c;这两个数都不会以…

7-5 单源最短路径

7-5 单源最短路径 请编写程序求给定正权有向图的单源最短路径长度。图中包含n个顶点&#xff0c;编号为0至n-1&#xff0c;以顶点0作为源点。 输入格式: 输入第一行为两个正整数n和e&#xff0c;分别表示图的顶点数和边数&#xff0c;其中n不超过20000&#xff0c;e不超过10…

32为Linux安卓AVD启动报错

2019独角兽企业重金招聘Python工程师标准>>> 当使用android的AVD时提示以下错误&#xff1a;Starting emulator for AVD NexusOne ERROR: 32-bit Linux Android emulator binaries are DEPRECATED, to use them you will have to do at least one of the following:…

hdu 2007 - 平方和与立方和

题目大意&#xff1a; 给定一段连续的整数&#xff0c;求出他们中所有偶数的平方和以及所有奇数的立方和。 解答&#xff1a; 坑你没商量&#xff01;要考虑输入数a,b的大小。如果a>b,需要交换a&#xff0c;b的值。转载于:https://www.cnblogs.com/ZJUT-jiangnan/p/3613488.…

(原创)优酷androidclient 下载中 bug 解决

在网络情况不好的情况下&#xff0c;优酷androidclient下载视频会终止&#xff0c;用户放弃下载点击 删除该任务以后&#xff0c;切换到网络好的情况下进行下载&#xff0c;会显示该视频已在下载队列里&#xff0c;然后clientUI界面却什么都看不到。导致用户根本无法下载。 事实…

填问卷,得《2015中国呼叫中心知识库现状与问题报告》

为了解中国呼叫中心知识库运营现状和存在的主要问题&#xff0c;掌握呼叫中心知识库的总体发展水平&#xff0c;中国知识管理中心&#xff08;KMCenter&#xff09;面向全国呼叫中心发起“2015中国呼叫中心知识库现状与问题调研”活动&#xff0c;主要通过问卷调研和典型用户访…

C语言经典算法100例-031-判断星期几

题目如下&#xff1a; 请输入星期几的第一个字母来判断一下是星期几&#xff0c;如果第一个字母一样&#xff0c;则继续判断第二个字母。 比较简单&#xff0c;直接看程序吧。 #include <stdio.h> #include <stdlib.h> #include <conio.h> int main() {char …

ARM汇编的特点

以下内容源于网络资源的学习与整理&#xff0c;如有侵权请告知删除。 一、LDR/STR架构 ARM采用RISC架构&#xff0c;CPU本身不能直接读取内存&#xff0c;需要先将内存中的内容加载到CPU的通用寄存器中才能被CPU处理。换言之&#xff0c;寄存器是CPU和内存进行数据交换的中介。…

持久代是方法区还是堆中的?

2019独角兽企业重金招聘Python工程师标准>>> 昨天跟一哥们讨论&#xff0c;持久代在方法区&#xff0c;属不属于堆中的? 它的意思是持久代不属于堆,属于方法区&#xff0c;而我则认为持久代属于方法区也属于堆。 结果今天上网一查,还真的是。下面是解释: 持久代”仅…

妈的我好像发现是哪出问题了

我不能被这个破玩意卡这么久。 今晚的第一个收获是&#xff0c;我在下载方法里面&#xff0c;获取了API写完了文件而且关闭了之后又加上了一段代码用来测试。 内容是打开刚刚写好的文件&#xff0c;把里面的内容打印到日志上&#xff0c;结果我发现不但文件存在&#xff0c;而且…