【转载保存】lucene优秀文章整理

 

 

Lucene解析 - 基本概念:
 https://www.jianshu.com/p/fbb171e73721?from=timeline&isappinstalled=0
  
 Lucene DocValues——没有看懂:
 https://www.cnblogs.com/bonelee/p/6669263.html
  
 Lucene DocValues详解:
 https://blog.csdn.net/zteny/article/details/60633374
  
 Solr DocValues详解:
 https://mozhenghua.iteye.com/blog/2275932
  
 相关度
  
 搜索引擎的检索模型-查询与文档的相关度计算:
 https://blog.csdn.net/hguisu/article/details/7981145
  
 Elasticsearch中的相似度模型:
 https://www.cnblogs.com/sheeva/p/6847309.html
  
 BM25和Lucene Default Similarity比较:
 https://www.cnblogs.com/sheeva/p/6846885.html
  
 分词
  
 史上最全中文分词工具整理:
 https://blog.csdn.net/fendouaini/article/details/82027310
  
 中文分词器分词效果评估对比:
 https://github.com/ysc/cws_evaluation
  
 Ansj中文分词:
 https://github.com/NLPchina/ansj_seg
  
 HanLP中文分词:
 https://github.com/hankcs/hanlp-lucene-plugin
  
 IK中文分词:
 https://github.com/magese/ik-analyzer-solr
  
 jieba中文分词:
 https://github.com/huaban/jieba-analysis
  
 Jcseg中文分词:
 https://github.com/lionsoul2014/jcseg
  
 mmseg4j中文分词:
 https://github.com/chenlb/mmseg4j-core
  
 NLPIR中文分词:
 https://github.com/NLPIR-team/nlpir-analysis-cn-ictclas
  
 THULAC中文分词:
 https://github.com/thunlp/THULAC-Java
 https://github.com/yizhiru/thulac4j
  
 Java分布式中文分词组件 - word分词:
 https://github.com/ysc/word
  
 索引
  
 MySQL和Lucene索引对比分析:
 https://www.cnblogs.com/luxiaoxun/p/5452502.html
  
 时间序列数据库的秘密:
 https://www.infoq.cn/article/database-timestamp-01
 https://www.infoq.cn/article/database-timestamp-02
 https://www.infoq.cn/article/database-timestamp-03
  
 Lucene 索引文件宏观结构:
 http://blog.sina.com.cn/s/blog_48a45b950100kqc0.html
  
 ----- 4.x -----
  
 Lucene(修真篇):
 https://qindongliang.iteye.com/category/282568
 Lucene(仙界篇):
 https://qindongliang.iteye.com/category/297975
 Lucene(神界篇):
 https://qindongliang.iteye.com/category/317466
  
 Lucene 原理与代码分析完整版:
 http://www.cnblogs.com/forfuture1978/category/300665.html
  
 Lucene技术学习总结:
 https://www.mayou18.com/category/7pJjYrLb.html
  
 ----- 5.x -----
  
 Lucene介绍与入门使用:
 https://www.cnblogs.com/xiaobai1226/p/7652093.html
  
 lucene原理及java实现:
 https://blog.csdn.net/liuhaiabc/article/details/52346493
  
 Lucene检索源码解析:
 https://blog.csdn.net/huangzhilin2015/article/details/89329854
 https://blog.csdn.net/huangzhilin2015/article/details/89372127
  
 一步一步跟我学习Lucene:
 https://blog.csdn.net/wuyinggui10000/article/category/3173543
  
 Lucene5学习:
 https://blog.csdn.net/sc736031305/article/category/8475280
  
 Lucene多线程创建索引及多目录下查询索引:
 http://blog.csdn.net/qs_5683955/article/details/51281943
  
 Lucene打分公式详解(TFIDFSimilarity):
 https://blog.csdn.net/huangzhilin2015/article/details/89296203
  
 ----- 6.x -----
  
 Lucene 6.0实战:
 http://codepub.cn/tags/Lucene/
  
 Lucene深入学习:
 https://blog.csdn.net/jiangchao858/article/category/7242214
  
 深入理解Lucene默认打分算法:
 https://www.biaodianfu.com/lucene-score.html
  
 ----- 7.x -----
  
 搜索引擎:
 https://www.cnblogs.com/leeSmall/category/1210814.html
  
 LuXugang的博客:
 https://www.amazingkoala.com.cn/
  
 太美博客:
 https://www.tiomg.org/blog?category=13ea0af8-5f27-4bce-8c83-ac14849b73aa
  
 Lucene 实战教程:
 https://www.xttblog.com/?s=Lucene+%E5%AE%9E%E6%88%98%E6%95%99%E7%A8%8B
  
 lucene增量建立索引,近实时查询以及多线程建立索引的项目实例:
 

https://blog.csdn.net/m0_37556444/article/details/82777547?tdsourcetag=s_pcqq_aiomsg

 

 

转载:https://github.com/HongZhaoHua/jstarcraft-rns/blob/master/src/main/java/com/jstarcraft/rns/search/lucene.txt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/508899.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

lucene中write.lock索引锁机制的原理

write.lock加锁的实现原理: 实现源码(lucene 6.0): Override protected Lock obtainFSLock(FSDirectory dir, String lockName) throws IOException {Path lockDir dir.getDirectory();// Ensure that lockDir exists and is a…

正则表达式大全

[正则表达式]文本框输入内容控制 整数或者小数:^[0-9]\.{0,1}[0-9]{0,2}$ 只能输入数字:"^[0-9]*$"。 只能输入n位的数字:"^\d{n}$"。 只能输入至少n位的数字:"^\d{n,}$"。 只能输入m~n位的数字&am…

天气数据获取接口和网址汇总

免费API:https://www.sojson.com/blog/305.html 爬取网址:http://www.weather.com.cn/ https://www.tianqi.com/chinacity.html

鸡汤

史蒂芬柯维的7个习惯就是自己的原则和价值观: 积极主动以终为始要事第一双赢思维知彼解己综合综效不断更新 稻盛和的原则和价值观比如六项精进: 付出不亚于任何人的努力要谦虚,不要骄傲要每天反省或者就要感谢积善行,思利他不要…

【转载保存】索引文件锁LockFactory

索引文件锁LockFactory LockFactory在Lucene中用来对索引文件所在的目录进行加锁,使得同一时间总是只有一个IndexWriter对象可以更改索引文件,即保证单进程内(single in-process)多个不同IndexWriter对象互斥更改(多线程持有相同引用的IndexW…

lucene大牛博客汇总保存

https://www.amazingkoala.com.cn/Lucene/Index/http://codepub.cn/tags/Lucene/

no segments* file found in SimpleFSDirectory问题总结

lucene6.0版本 场景一:第一次启动程序索引库为空抛出异常 最近在写lucene发现利用lucene6.0版本时候如果索引库为空构建indexWriter,代码如下: IndexWrterConfig config new IndexWriterConfig(analyzer); IndexWriter indexWriter new …

lucene Term查询

查询demo Path path Paths.get(util.Directory.GetAppPath("indexDir"));IndexReader reader DirectoryReader.open(FSDirectory.open(path));//获取IndexSearcher对象IndexSearcher indexSearcher new IndexSearcher(reader);Query query new TermQuery(new Ter…

IndexOptions类说明

IndexOptions是在lucene-core-x.jar包下面,其作用是在新建索引时候选择索引属性。 IndexOptions是一个枚举类: 枚举变量说明: NONE不被索引DOCS_AND_FREQS文档和词频建立索引DOCS_AND_FREQS仅对文档和词频建立索引DOCS_AND_FREQS_AND_POSIT…

【转载保存】lucene正则查询使用注意

今天要分享的是关于lucene中另外一种丰富的查询方式----正则查询,lucene内置了许多的查询API,以及更强大的自定义查询方式的QueryParse,大部分情况下我们使用内置的查询API,基本上就可以满足我们的需求了,但是如果你想…

lucene 各个版本介绍

官方说明文档:https://lucene.apache.org/core/8_3_0/changes/Changes.html#v8.3.0.other 开源中国翻译:https://www.oschina.net/p/lucene

【转载保存】搜索引擎调研文档

搜索引擎选型调研文档 Elasticsearch简介* Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。 它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。 Elasticsearch是一个建立在全…

webmagic抓取实例

git地址:https://github.com/code4craft/webmagic/tree/master/webmagic-samples/src/main/java/us/codecraft/webmagic/samples

lucene详细说明文档

以下部门功能在lucene5以上版本可能有的API所有改变 目录1.简介 2.了解索引操作 2.1倒排索引 2.2字段类型 2.3细分 2.4文件编号 2.5搜索索引 3.创建索引 4.基本索引操作 4.1核心索引类 4.2将数据添加到索引 5.文件和领域 5.1文件 5.2领域 5.3在Lucene中增强文档 1.简介 该索引是…

SimpleDateFormat(线程不安全)与DateTimeFormatter(线程安全)

https://www.liaoxuefeng.com/wiki/1252599548343744/1303985694703650

【转载保存】java8新特性学习

编者注:Java 8已经公布有一段时间了,种种迹象表明Java 8是一个有重大改变的发行版。 在Java Code Geeks上已经有大量的关于Java 8 的教程了,像玩转Java 8——lambda与并发,Java 8 Date Time API 教程: LocalDateTime和…

influxDb 异常:{“error“:“retention policy not found: default“}

第一次用influxDb,通过java客户端插入数据的时候总是报这个异常,后来发现命令行中插入数据是好的,但是客户端就是不行,后来检查代码发现是自己的配置中保留策略名写错了 。 修改代码:将RETENTION_POLICY_DEFAULT值设置…

【转载保存】什么是线程阻塞?为什么会出现线程阻塞?

为什么会出现线程阻塞? 1.睡眠状态:当一个线程执行代码的时候调用了sleep方法后,线程处于睡眠状态,需要设置一个睡眠时间,此时有其他线程需要执行时就会造成线程阻塞,而且sleep方法被调用之后,…

【转载保存】ThreadPoolExecutor类使用详解

线程启动原理线程中断机制多线程实现方式FutureTask实现原理线程池之ThreadPoolExecutor概述线程池之ThreadPoolExecutor使用线程池之ThreadPoolExecutor状态控制线程池之ThreadPoolExecutor执行原理线程池之ScheduledThreadPoolExecutor概述线程池的优雅关闭实践 转载&#x…