学习Lucene

我目前正在与一个团队合作,开始一个基于Lucene的新项目。 虽然大多数时候我会争论使用Solr还是Elasticsearch而不是简单的Lucene,但这是一个有意识的决定。 在这篇文章中,我正在整理一些学习Lucene的资源–希望您对他们有所帮助,或者可以提示我错过了哪些资源。

项目文件

当然,首选的是出色的项目文档 。 它包含所有模块的Javadoc(最重要的模块是core , analyzers-common和queryparser ),还包含进一步的文档,例如,一个简单的演示应用程序的说明以及对分析 , 查询和评分的有用介绍。 您可能还对标准索引文件格式感兴趣。

除了发行版随附的文档之外, 项目Wiki中还有很多信息,但是您需要知道要查找的内容。 您也可以加入邮件列表以了解其他用户的操作。

查看分析仪组件时, Solr Start网站可能会有用。 尽管专用于Solr ,但分析器组件列表对于确定Lucene 的分析器也很有用。 它还包含Javadocs的可搜索版本 。

图书

关于该主题的经典书籍是《 Lucene in Action》 。 在超过500页上,它详细解释了所有基本概念。 不幸的是,其中一些信息已经过时,许多代码示例不再起作用。 此外,不包括较新的概念。 仍然是学习Lucene的推荐文章。

我读过的另一本书是在Packt出版的Lucene 4 Cookbook 。 它包含更多当前示例,但不适合学习基础知识。 另外,在我看来,好像没有任何编辑在写这本书,有很多重复,错别字和断句。 (我在写博客时会犯很多语法错误,但是我希望从出版的书中得到更多的语法。)

通过在基于Lucene的搜索服务器之一上阅读一本书,您还可以了解有关Lucene不同方面的很多知识。 我可以推荐《 Elasticsearch in Action》 ,《 Solr in Action》和《 Elasticsearch – The Definitive Guide》 。 (如果您会读德语,那我当然是在邀请您阅读有关Elasticsearch的书 。)

博客,会议和视频

关于Lucene的博客文章不计其数,非常好的介绍是Andrew Montalenti撰写的Lucene:The Good Parts 。 一些博客会定期在Lucene上发布文章,推荐的文章是Mike McCandless (现在主要是弹性Blog上的博客 ), OpenSource Connections , Flax和Uwe Schindler 。 弹性Blog上有很多有关Lucene的内容,如果您想了解当前的发展,我可以推荐“ Elasticsearch和Apache Lucene的本周”系列。 Lucidworks博客上也有一些有趣的帖子,我敢肯定,我在这里忘记提及很多其他博客。

Lucene是两个较大的会议的常规主题: Lucene / Solr Revolution和Berlin Buzzwords 。 您可以在他们的网站上找到许多有关过去事件的录像。

资料来源

最后,该项目是开源的,因此您可以通过阅读库或测试的源代码来了解很多内容。

另一种选择是查看使用它的应用程序,Solr和Elasticsearch。 当然,您需要围绕项目的源头找到自己的方式,但是有时候这并不难。 Elasticsearch的一个示例:如果您想了解如何在Lucene中实现常见的multi_match-Query,则可以轻松找到创建Lucene查询的MultiMatchQuery类。

我错过了什么?

希望这篇文章对您有用。 我确信我错过了许多学习Lucene的宝贵资源。 如果您想添加一个,请在评论中或在Twitter上告诉我。

翻译自: https://www.javacodegeeks.com/2016/05/learning-lucene-2.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/353479.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MATLAB递归程序的调试方法

MATLAB具有和VC类似的调试功能,各功能的按钮图标和VC也很相似,基本可以使用VC的调试思想。MATLAB自己的特点:一. 查看中间变量。1. 在调试状态下,鼠标放在变量上就可以显示变量的基本信息。2. 在调试状态下,在命令行输…

DHCP服务(dhcpd)

DHCP动态分配主机地址(Dynamic Host Configuration Protocol) 动态主机配置协议(DHCP)是一种基于UDP协议且仅限于在局域网内部使用的网络协议,主要用于大型的局域网环境或者存在较多移动办公设备的局域网环境中&#x…

最健康的睡眠时间究竟是多少?

我每天都睡足8个小时,怎么还是这么困啊?”很多男性朋友都有这样的疑问。不是说每天8个小时的睡眠是最健康的,为什么那些一天睡5、6个小时的人看上去反而更生龙活虎、精力充沛呢? 怪8小时不如6小时的精神 睡眠不足会导致精力不济、…

Matlab Compiler路径

Matlab Compiler run-time找了半天就在自己的安装目录下D:\Program Files\MATLAB\R2011b\toolbox\compiler\deploy\win32\MCRInstaller.ex

EF context.SaveChanges()特点

EF context.SaveChanges()特点1 一次连接保存多条数据(工作单元模式);2 内部通过事务来执行,如果一条数据保存失败,执行回滚操作;3 延时加载var userListfrom u in context.UserInfo select u;foreach(var …

spring aop示例_Spring Profile模式示例

spring aop示例最近,我们介绍了Spring Profiles的概念。 此概念是针对不同部署环境的轻松配置区分符。 直接的用例(已提出)是对相关的类进行注释,以便Spring根据活动的配置文件加载适当的类。 但是,这种方法可能并不…

如何提高学习效率?

学习效率 目录 介绍如何提高规律展开介绍如何提高规律展开编辑本段介绍 学习效率对中学生的重要性无须在此多言。提高孩子的学习效率是每个老师的心愿,更是学生及其家长的追求目标。学习兴趣、学习能力和学习效率三者是和谐统一的辩证关系,将这三项标准严…

基于Matlab/Simulink不平衡电网工况下级联H桥光伏并网逆变器仿真模型

本次更新的内容为级联H桥光伏并网逆变器相关的控制,后面会针对储能系统在级联H桥拓扑上的应用进行分享。由于传统发电造成的环境污染问题和光伏电池板价格持续创新低,太阳能从众多种类的可再生能源中拔地而起,因而光伏逆变器成为国内外学者和…

MATLAB格式化字符串

sprintf(%s City %d Quarter,str,i);

“速课小龙”项目冲刺3

第三天 日期:2018/6/15 一.今日完成任务情况及遇到的问题 姓名完成情况遇到的问题解决方法邓旭 通过对昨天的知识进行再学习,已经能进行文件上传。并且开始着手于出题模块。 今天着手只是模型的基础层搭建,所以难度相对较少。未有问题解决陈逸…

Java和Lagom的CQRS

我很高兴在Chicago Java User Group上进行了讨论,并讨论了Lagom如何实现CQRS(命令查询责任隔离模式)。 值得庆幸的是,有一个录音,我还把这些幻灯片发布在slideshare上 。 抽象: 一旦应用程序变得相当复杂…

matlab字符串处理

matlab字符串处理 %字符串处理 a= a;b=b b;c=cccc;m= length(a);%获取字符串长度 str = [str1,str2];%无缝连接两个字符串 d=strcat(a,c);%连接两个字符串,每个字符串最右边的空格被裁切 e=strvcat(a,b,m);%连接多行字符串,每行长度可不等,自动把非最长字符串最右边补空…

一天最好学习时间

一天中各个时段的学习状态k 时间状态适合做的事情 6、 7点机体休息完毕并进入如兴奋状态,肝脏已将体内的毒素全部排净,头脑清醒,大脑记忆力强。 第一次最佳记忆期8、9点 神经兴奋性提高,记忆仍保持最佳状态,心…

PAT 之 A+B和C

时间限制 1000 ms 内存限制 32768 KB 代码长度限制 100 KB 判断程序 Standard 题目描述 给定区间 [-2的31次方, 2的31次方] 内的3个整数 A、B 和 C&#xff0c;请判断 AB 是否大于 C。 输入描述 输入第1行给出正整数T(<10)&#xff0c;是测试用例的个数。随后给出T组测试用例…

使用Spring boot,Thymeleaf,AngularJS从零开始构建新的Web应用程序-第2部分

在本系列博客中&#xff0c;我们将使用Springboot&#xff0c;Angular等构建完整的Web应用程序。 在上一个博客中&#xff0c;我们与Thymeleaf建立了基本的登录页面。 在此博客中&#xff0c;我们将介绍bower &#xff0c;它用于管理前端依赖项&#xff0c;例如CSS&#xff0c…

MATLAB字符串和ASCII码的转换

字符串转ASCII码&#xff1a;abs&#xff0c;如&#xff1a;abs(a);abs(what);ASCII码转字符串&#xff1a;char&#xff0c;如&#xff1a;char(97);char([97,98,99]);

怎么样开会才有效果?

SAP项目实施过程中&#xff0c;难免不了要开不少的会议&#xff0c;无论是最前期的选型&#xff0c;还是商谈&#xff0c;乃至后面上线评审都免不了将很多项目干系人聚在一起就出现的问题或大家关心的问题摆在台面上做探讨。但只要你开过大会议你就会知道很多时候开会纯粹是为了…

一天中的最佳学习时间

一天中的最佳学习时间   一个人在一天的不同时期&#xff0c;大脑活动的效率是不同的&#xff0c;学习时间的最佳选择应该是一天中大脑最清醒的时侯。   生理学家研究认为&#xff0c;一天之内有4个学习的高效期。如果你使用得当&#xff0c;可以轻松自如地掌握、消化、巩…

MATLAB字符串数组中查找指定子串

1. strfindFind one string within another Syntaxk strfind(str, pattern)&#xff1b; k strfind(cellstr, pattern)&#xff1b;2. 如果使用的cell并且比较麻烦&#xff0c;可以自己写查找函数id zeros(0,1); for i1:size(txt,1)if strcmp(txt{i},str)id(end1) i;end en…

网络15软工个人作业5——软件工程总结

一、请回望开学时的第一次作业&#xff0c;你对于软件工程课程的想象 1. 对比开篇博客你对课程目标和期待&#xff0c;“希望通过实践锻炼&#xff0c;增强计算机专业的能力和就业竞争力”&#xff0c;对比目前的所学所练所得&#xff0c;在哪些方面达到了你的期待和目标&#…