lucene中对不同的域使用不同的分析器

在lucene使用过程中,如果要对同一IndexWriter中不同Document,不同Field中使用不同的analyzer,我们该如何实现呢?

通过对《lucene in action》的阅读,发现是可以解决这一问题的。lucene可以正对整个IndexWriter对象或者每一个document对象或者特定Field使用不同的分析器。

Analyzer analyzer = new StandardAnalyzer();

IndexWriter writer = new IndexWriter(direcotry, analyzer, true); //

Document doc = new Document();

doc.add(new Field("title", "this is title", Field.Store.COMPRESS,Field.Index.TOKENIZED,Field.TermVector.WITH_POSITIONS_OFFSETS));

doc.add(new Field("content", "this is content", Field.Store.COMPRESS,Field.Index.TOKENIZED,Field.TermVector.WITH_POSITIONS_OFFSETS));

writer.addDocument(doc); //这是大部分情况下使用的一个方法

其实还有另外一个方法,原型如下:

lucene自带文档 写道
addDocument(Document doc, Analyzer analyzer)
Adds a document to this index, using the provided analyzer instead of the value of getAnalyzer().

所以我们还可以写成这样:
writer.addDocument(doc, analyzer);
 // 这里的analyzer是指另外一个你指定的analyzer,不同于上面的StandardAnalyzer

 那么如何针对特定Field使用不同分析器呢,lucene包里面有个PerFieldAnalyzerWrapper类,解决了这一问题,这是lucene的文档里面的一段话:

lucene自带文档 写道
Example usage:

PerFieldAnalyzerWrapper aWrapper = new PerFieldAnalyzerWrapper(new StandardAnalyzer());
aWrapper.addAnalyzer("firstname", new KeywordAnalyzer());
aWrapper.addAnalyzer("lastname", new KeywordAnalyzer());

In this example, StandardAnalyzer will be used for all fields except "firstname" and "lastname", for which KeywordAnalyzer will be used.

A PerFieldAnalyzerWrapper can be used like any other analyzer, for both indexing and query parsing.
PreFieldAnalyzerWrapper类的构造函数中需要一个默认的分析器作为参数。为了给不同的Field指定不同的analyzer,就需要调用该类的addAnalyzer()方法。上面的E文相信大家都能看懂的,就不需要我来翻译了,我的英语很差,着急啊,呵呵。

也就是说大家以前初始化分析器的时候用这一句:
Analyzer analyzer = new StandardAnalyzer();  

 现在可以改用
PerFieldAnalyzerWrapper analyzer = new PerFieldAnalyzerWrapper(new StandardAnalyzer());  

然后如果需要特定域的分析器就调用addAnalyzer方法
analyzer.addAnalyzer("fieldname", new KeywordAnalyzer());  
 
对了,最后说一下,PerFieldAnalyzerWrapper类也是在org.apache.lucene.analysis包下面的,只需要
import org.apache.lucene.analysis.PerFieldAnalyzerWrapper;  

转载于:https://www.cnblogs.com/lindayyh/archive/2009/10/23/1588883.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/435741.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【转】Ubuntu Desktop下自动启动终端并运行脚本

转自:Ubuntu Desktop下自动启动终端并运行脚本 - 简书 alexubuntu19:~# lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 19.04 Release: 19.04 Codename: disco alexubuntu19:~# uname -a Linux ubunt…

使用js实现换肤功能

Skin.html <html xmlns"http://www.w3.org/1999/xhtml"> <head> <meta http-equiv"Content-Type" content"text/html; charsetgb2312" /> <title>网页焕肤</title> <style type"text/css"> #main…

【转】开机出现 error:file “/boot/grub/i386-pc/normal.mod“ not found 错误提示

今天用ubuntu启动盘格式化了一个分区后&#xff0c;更改了分区顺序&#xff0c;导致找不到normal.mod文件。 现在openSUSE系统无法启动。 error:file "/boot/grub/i386-pc/normal.mod" not found grub rescue> 在网上查询了很多&#xff0c;步骤如下&#xff…

VB用API实现各种对话框(总结)(转载)

标准对话框(SmDialog) Option Explicit 定义一个全局变量,用于保存字体的各种属性 Public Type SmFontAttr FontName As String 字体名 FontSize As Integer 字体大小 FontBod As Boolean 是否黑体 FontItalic As Boolean 是否斜体 FontUnderLine …

【转】DICOM简述!!!!

转自&#xff1a;DICOM简述 - 简书 视频教程&#xff1a;https://www.bilibili.com/video/av66144772 DICOM&#xff08;Digital Imaging and Communications in Medicine&#xff09;即医学数字成像和通信&#xff0c;是医学图像和相关信息的国际标准&#xff08;ISO 12052&…

WinCE OAL中的OEMIoControl函数

关于OEMIoControl函数&#xff0c;我在2008年1月份写过一篇blog叫“WinCE BSP中OAL层中的OEMIoControl介绍”&#xff0c;已经比较详细的介绍了OEMIoControl&#xff0c;今天在这里只是对OEMIoControl中比较常用的case说一说。看看PB的文档就知道OEMIoControl可以包含很多case而…

实用MYSQL语句收集

SQL分类&#xff1a; DDL—数据定义语言(Create&#xff0c;Alter&#xff0c;Drop&#xff0c;DECLARE) DML—数据操纵语言(Select&#xff0c;Delete&#xff0c;Update&#xff0c;Insert) DCL—数据控制语言(GRANT&#xff0c;REVOKE&#xff0c;COMMIT&#xff0c;ROLLBAC…

【转】xilinx usb下载器 速度高速极限设置 JTAG-SMT2 JTAG-HS2 JTAG-HS3和Platform Cable USB DLC9 DLC10速度测试

xilinx usb下载器 下载速度极限设置以及高速JTAG-SMT2(HS1 HS2 HS3)和DLC9 DLC10 速度测试 对于一款xilinx的下载器&#xff0c;研发和烧录以及boss都最关心下载速度的极限值。因为速度快可以在短时间内完成下载和仿真采集数据等任务。时间就是金钱&#xff0c;能节约时间大家…

DataGridView中的CheckBox

1.为DataGridView添加一列类型为DataGridViewCheckBoxColumn的列, 如果想CheckBox能单独选择的话,就一定要为DataGridView启用编辑.否则就去掉启用编辑的勾选项. 2.DataGridView中CheckBox的全选与不全选 一般会使用Button,LinkLabel,CheckBox来做为事件的起点,那么就可以在相应…

WinCE的I2C驱动程序设计

1 I2C 通信协议及S3C2410 芯片介绍 I2C(Inter Integrated Circuit) 总线是1980 年由Philips 公司推出的。 I2C 总线用两条线&#xff08;SDA 和SCL &#xff09;在总线和装置之间传递信息&#xff0c;在微控制器和外部设备之间进行串行通信或在主设备和从设备之间进行双向数据传…

【转】vivado18.3的安装 安装教程

原装性能 Xilinx下载器 赛灵思下载线 Platform Cable USB仿真器 Xilinx下载器 CPLD FPGA digilent usb JTAG SMT2 高速 赛灵思线 转自&#xff1a;Vivado18.3的安装 安装教程_Daniel_Banana的博客-CSDN博客 本文内容学习自【ALINX】FPGA ZYNQ视频教程——AX7010/AX7020教程—…

局域网共享设置

我们在多机使用时候&#xff0c;连机使用共享文件是最常用到的&#xff0c;如何设置共享文件呢&#xff1f;下面我们就来一一介绍。首先我们要看看共享文件时需要的基本条件。 windows网上邻居互访的基本条件&#xff1a; 1) 双方计算机打开&#xff0c;且设置了网络共享资源&a…

【转】5分钟了解FPGA之Xilinx 7系列

转自&#xff1a;http://xilinx.eetrend.com/content/2019/100042384.html xilinx7系列FPGA主要包括&#xff1a;Spartan-7、Artix-7、Kintex-7、Virtex-7。其性能/密度/价格也随着系列的不同而提升。 Spartan7系列是7系列中的屌丝青年&#xff0c;拥有最低的价格、最低的功耗…

WinCE 修改系统字体 开启ClearType平滑字体

系统字体&#xff1a; "Wt"宽度[正负相等:A-A,并且过大的时候例如这里的:fffffff4按XFFFFFFFF-X]"Ht"高度[正负相等:A-A,并且过大的时候例如这里的:fffffff4按XFFFFFFFF-X]"Nm""字体名称""CS"[0使用系统默认,1使用Nm] &quo…

不允许后退提交数据的方法(抗重复刷新提交)

试试了一下在 .NET中通过如下语句Response.Cache.SetCacheability(System.Web.HttpCacheability.NoCache);就可以使页面的缓存失效&#xff0c;每次都需要获取新页面。 转载于:https://www.cnblogs.com/0000/archive/2009/11/11/1601036.html

【转】FPGA到底是啥?

转自&#xff1a;FPGA到底是啥&#xff1f; - 知乎 怎么才叫学会了FPGA&#xff0c;怎么才叫学好了FPGA&#xff1f;我相信有很多朋友有类似的问题&#xff0c;因为在多数人的潜意识里&#xff0c;FPGA是非常高深莫测的技术&#xff0c;能够玩转FPGA的都是大神级的人物。 其实…

VS配合VSS时,编译报错:未能向文件“....csproj.FileListAbsolute.txt”写入命令行,对路径的访问被拒绝。...

最近帮别人调试的时候&#xff0c;出现这个问题。环境&#xff1a;VS2008VSS2005&#xff0c;多人配合完成一个项目。 在编译的时候报错&#xff1a;未能向文件“....csproj.FileListAbsolute.txt”写入命令行,对路径的访问被拒绝。 在网上开始查找出错的解决方法&#xff0c;终…

【转】重新打包DebianISO实现无人应答安装(UEFI+BIOS)

转自&#xff1a;重新打包DebianISO实现无人应答安装&#xff08;UEFIBIOS&#xff09; - 全部 - 真不是你的 之前我写过打包DebianISO的文章&#xff0c;但是那种打包的方法只能用在引导是BIOS的机器上&#xff0c;按照正常的情况&#xff0c;应该是UEFIBIOS同时支持。 正好前…

定制mini2440 wince启动界面

定制mini2440 wince启动界面过程 我的显示屏是7寸的&#xff0c;所以应该按照分辨率制作一张800*480像素的图片。 详细步骤如下&#xff1a; 1、我用photoshop的制作的&#xff0c;如下图&#xff1a; 2、用bmp2T.exe转换这个图片&#xff0c;在命令符下输入bmp2T空格图片名…

Copying to tmp table Problem Solving

Labels: MySQL, MySQL_Problem_Solving 今天一早突然系统突然报慢&#xff0c;查了一下是以下语句&#xff1a; 6177700 username ip db——name Query 549 Copying to tmp table SELECT ....................原因如下&#xff1a;Copying to tmp table on disk The tempora…