lucene学习笔记_学习Lucene

lucene学习笔记

我目前正在与一个团队合作,开始一个基于Lucene的新项目。 虽然大多数时候我会争论使用Solr还是Elasticsearch而不是简单的Lucene,但这是一个有意识的决定。 在这篇文章中,我正在整理一些学习Lucene的资源–希望您对他们有所帮助,或者可以提示我错过了哪些资源。

项目文件

当然,首选的是出色的项目文档 。 它包含所有模块的Javadoc(最重要的模块是core , analyzers-common和queryparser ),还包含进一步的文档,例如,一个简单的演示应用程序的说明以及对分析 , 查询和评分的有用介绍。 您可能还对标准索引文件格式感兴趣。

除了发行版随附的文档外, 项目Wiki中还有很多信息,但您需要知道要查找的内容。 您还可以加入邮件列表以了解其他用户的操作。

查看分析仪组件时, Solr Start网站可能会有用。 尽管专用于Solr ,但分析器组件的列表对于确定Lucene 的分析器也很有用。 它还包含Javadocs的可搜索版本 。

图书

有关该主题的经典书籍是《 Lucene in Action》 。 在超过500页上,它详细解释了所有基本概念。 不幸的是,其中一些信息已经过时,许多代码示例不再起作用。 此外,不包括较新的概念。 仍然是学习Lucene的推荐文章。

我读过的另一本书是在Packt出版的Lucene 4 Cookbook 。 它包含更多当前示例,但不适合学习基础知识。 另外,在我看来,好像没有任何编辑在写这本书,有很多重复,错别字和断句。 (我在写博客时会犯很多语法错误,但我希望从出版的书中得到更多的语法。)

您还可以通过在基于Lucene的其中一台搜索服务器上阅读一本书来了解有关Lucene不同方面的很多知识。 我可以推荐《 Elasticsearch in Action》 ,《 Solr in Action》和《 Elasticsearch – The Definitive Guide》 。 (如果您会读德语,那我当然是在邀请您阅读有关Elasticsearch的书 。)

博客,会议和视频

关于Lucene的博客文章不计其数,非常好的介绍是Andrew Montalenti撰写的Lucene:The Good Parts 。 一些博客在Lucene上发布常规文章,推荐的则是Mike McCandless (现在主要是弹性Blog上的博客 ), OpenSource Connections , Flax和Uwe Schindler 。 弹性Blog上有很多有关Lucene的内容,如果您想了解当前的发展,我可以推荐“ Elasticsearch和Apache Lucene的本周”系列。 Lucidworks博客上也有一些有趣的帖子,我敢肯定,我在这里忘记提及很多其他博客。

Lucene是两个较大的会议的常规主题: Lucene / Solr Revolution和Berlin Buzzwords 。 您可以在他们的网站上找到许多有关过去事件的录像。

资料来源

最后,该项目是开源的,因此您可以通过阅读库或测试的源代码来了解很多内容。

另一种选择是查看使用它的应用程序,Solr和Elasticsearch。 当然,您需要围绕项目的源头找到自己的方式,但是有时候这并不难。 Elasticsearch的一个示例:如果您想了解如何在Lucene中实现常见的multi_match-Query,您将很容易找到创建Lucene查询的MultiMatchQuery类。

我错过了什么?

希望这篇文章对您有用。 我确信我错过了许多学习Lucene的宝贵资源。 如果您想添加一个,请在评论中或在Twitter上告诉我。

翻译自: https://www.javacodegeeks.com/2016/05/learning-lucene-2.html

lucene学习笔记

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/335829.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

websocket没准备好如何解决_那些很重要,但是不常用的技术,websocket

目录1. 为什么会有websocket2. websocket协议格式3. 协议具体实现一、为什么需要 WebSocket?初次接触 WebSocket 的人,都会问同样的问题:我们已经有了 HTTP 协议,为什么还需要另一个协议?它能带来什么好处?…

DFS深搜与BFS广搜专题

一般搜索算法的流程框架 DFS和BFS与一般搜索流程的关系 如果一般搜索算法流程4使用的是stack栈结构(先进后出,后进先出)那么就会越搜越深。即,DFS,DFS只保存当前一条路径,其目的是枚举出所有可能性。反之,如果流程4使…

cloud foundry_使用“另类” Cloud Foundry Gradle插件无需停机

cloud foundry我一直在尝试编写用于将应用程序部署到Cloud Foundry的gradle插件 ,并在上一篇文章中写了有关此插件的文章 。 现在,我通过使用两种方法支持将无停机时间部署到Cloud Foundry中来增强此插件: 自动驾驶风格部署和更常用的蓝绿色风…

lisp文字上标源码_创建文本/标注样式源码 - AutoLISP/Visual LISP 编程技术 - CAD论坛 - 明经CAD社区 - Powered by Discuz!...

本帖最后由 zhengxiansz 于 2014-4-27 11:27 编辑GU_xl你好!请帮我看一下这个创建文本/标注样式源码。第一次输入IT1命令时没有报错的提示。如果重复输入IT1命令时就会提示该名称已被使用,是否重新定义?请问有什么方法可以解决吗?…

从前有座山,山里有座庙:递归之法

递归描述 递归调用是函数内部调用自身的过程,递归必须要有结束条件,否则会进入无限递归状态。无法停止。 我们称这个条件为(递归基) 递归原理 递归包括(递推)和(回归),…

你只是看起来很努力_我的方法在这方面看起来很大吗?

你只是看起来很努力以下Java方法的大小是多少? public Collection getDescription() {SystemLibrary systemLib registry.get(SystemLibrary.class);Analysis analysis systemLib.getCurrentAnalysis(registry);return getDescription(analysis);}这个不起眼的方…

0xFFFFFF的问题

这个有两个结果:16777215和-1 如果是单纯的16 进制数,那么转换为10 进制数为16777215。相信这个转换结果很好理解:15*16^015*16^1...15*16^5。j即(int型所能表示的最大值) 第二种情况就是 0xFFFFFF 如果是在计算机中…

js模仿f11全屏_JS实现全屏预览F11功能的示例代码

老是不通过,没办法,只能是重新发布了,反正我就是杠上了,大大小小写过很多前端特效,当然也经常在网上copy或者修改人家的代码,我觉得也挺好的,为什么?!因为我想这样&#…

懒惰学习_懒惰评估

懒惰学习最近,我正在编写log4j附加程序,并希望在自定义附加程序创建过程中使用logger记录一些诊断详细信息,但是log4j初始化仅在创建附加程序实例后才完成,因此在此阶段记录的消息将被忽略。 我感到需要在自定义附加程序中进行延…

leetcode(动态规划专题)

线性DP 53. 最大子数组和 思路 code int maxSubArray(vector<int>& nums) {//res:最后所有状态的最终Max结果//lat:当前f[i]状态的Maxint res INT_MIN, last 0;for (int i 0; i < nums.size(); i){//当前f[i]状态最大值(使用下面的状态转移方程得出)//f[i] …

买个云服务器有啥用_买了一台云服务器到底能干嘛?

提起云计算、大数据&#xff0c;好像都属于科技前沿的东西&#xff0c;总是觉得它离我们很遥远。但是科技的发展应该是要惠及普罗大众的&#xff0c;所以云计算的发展也并不是与我们毫不相干的&#xff0c;很多云计算方面的功能是我们工作生活可以用到、并解决问题的&#xff0…

leetcode(链表专题)

数组模拟链表 #include<iostream> using namespace std;const int N 100; // 单链表 // head存储链表头&#xff0c;e[]存储节点的值&#xff0c;ne[]存储节点的next指针&#xff0c;idx表示当前用到了哪个节点 int head, e[N], ne[N], idx;// 初始化 void init() {hea…

lagom cqrs_Java和Lagom的CQRS

lagom cqrs我很高兴在Chicago Java User Group上进行了讨论&#xff0c;并讨论了Lagom如何实现CQRS&#xff08;命令查询责任隔离模式&#xff09;。 值得庆幸的是&#xff0c;有一个录音&#xff0c;我还把这些幻灯片发布在slideshare上 。 抽象&#xff1a; 一旦应用程序变…

python项目管理器 宝塔面板 django 404_宝塔面板成功部署Django项目流程(图文)

上线 Django 项目记录&#xff0c;超简单&#xff0c;避免无意义的踩坑&#xff01;第一步&#xff1a;安装python管理器在宝塔在线面板安装“ python项目管理器 ”第二步&#xff1a;安装适配python版本因为服务器 centos7 系统默认的 python 版本是 2.7而我们项目是基于最新版…

leetcode(字符串专题)

5. 最长回文子串 思路

使用Spring boot,Thymeleaf,AngularJS从零开始构建新的Web应用程序–第3部分

在之前的博客中&#xff0c;我们使用Thymeleaf&#xff0c;Bower和Bootstrap构建了登录页面&#xff0c;并将其部署到了Heroku。 在此博客中&#xff0c;我们将介绍用于前端的AngularJS和在后端的Spring Boot Web服务的一些功能。 我们将从“登录/注销”部分开始。 让我们开始…

android的oomkiller_Android Low memory killer

Android Low memorykillerby 永远的伊苏Android中&#xff0c;进程的生命周期都是由系统控制的&#xff0c;即使用户关掉了程序&#xff0c;进程依然是存在于内存之中。这样设计的目的是为了下次能快速启动。当然&#xff0c;随着系统运行时间的增长&#xff0c;内存会越来越少…

C++ 11 深度学习(十二)函数新特性、内联函数、const详解

函数后置返回类型 //后置返回类型 auto fun(int, int)->int; 内联函数 在函数定义前增加关键字 inline ,使得该函数变成内联函数 (1) 适用于函数体很小&#xff0c;调用很频繁的函数类型&#xff0c;可以引入内联函数 (2) inline影响编译器&#xff0c;在编译阶段对inc…

apache pdfbox_Apache PDFBox 2

apache pdfboxApache PDFBox 2已于今年早些时候发布 &#xff0c; Apache PDFBox 2.0.1和Apache PDFBox 2.0.2已发布。 Apache PDFBox是开源的&#xff08; Apache许可证版本2 &#xff09;并且基于Java&#xff08;因此易于使用&#xff0c;包括Java &#xff0c; Groovy &…

cad坐标归零lisp_CAD图怎么归零

展开全部原理&#xff0c;就是把图元Z轴线移动的负无穷远&#xff0c;然e68a84e8a2ad62616964757a686964616f31333335336530后移动到正无穷&#xff0c;除了块就可以Z轴线归零了。用autoLISP来解决。;;;;;;Z坐标归零;;(defun c:z0 ( / &kw &k1 #os1)(setvar "cmde…