Lucene实战之初体验

前言

     最早做非结构化数据搜索时用的还是lucene.net,一直说在学习java的同时把lucene这块搞一搞,这拖了2年多了,终于开始搞这块了。

 

开发环境

    idea2016、lucene6.0、jdk1.8

 

使用lucene准备条件

1、pom.xml

2、测试数据。  我从博客园首页拿了几条数据,直接写了个伪Dao返回一个List<Blog>

public List<Blog> listBlogs(){List<Blog> list = new ArrayList<Blog>();Blog b1=new Blog(6538488,"风过无痕-唐","你真的了解volatile吗,关于volatile的那些事","http://www.cnblogs.com/tangyanbo/p/6538488.html");Blog b2=new Blog(6541312,"布鲁克石","TypeScript设计模式之职责链、状态","http://www.cnblogs.com/brookshi/p/6541312.html");Blog b7=new Blog(6547215,"嵘么么","轻松理解JavaScript闭包","http://www.cnblogs.com/rongmm/p/6547215.html");Blog b3=new Blog(6541220,"一线码农","使用Task的一些知识优化了一下同事的多线程协作取消的一串代码","http://www.cnblogs.com/huangxincheng/p/6541220.html");Blog b4=new Blog(6516387,"xybaby","并发与同步、信号量与管程、生产者消费者问题","http://www.cnblogs.com/xybaby/p/6516387.html");Blog b5=new Blog(6532713,"王福朋","深入理解 JavaScript 异步系列(4)—— Generator","http://www.cnblogs.com/wangfupeng1988/p/6532713.html");Blog b6=new Blog(6517788,"欢醉","入坑系列之HAProxy负载均衡","http://www.cnblogs.com/zhangs1986/p/6517788.html");list.add(b1);list.add(b2);list.add(b3);list.add(b4);list.add(b5);list.add(b6);list.add(b7);return list;}

 

IndexSearcher搜索

1、搜索体验,基于servlet开发,直接接受路径参数key

2、先写入索引

public class IndexWriterServlet extends HttpServlet {@Overrideprotected void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {String index_path="d:\\indexDir";Directory dir=null;Analyzer analyzer=null;IndexWriterConfig config=null;IndexWriter indexWriter=null;try {dir =new SimpleFSDirectory(Paths.get(index_path));analyzer=new StandardAnalyzer();config =new IndexWriterConfig(analyzer);indexWriter =new IndexWriter(dir,config);BlogDao blogDao=new BlogDao();List<Blog> list = blogDao.listBlogs();for (Blog blog:list){Document document=new Document();document.add(new Field("id",blog.getId().toString(),TextField.TYPE_STORED));document.add(new Field("author",blog.getAuthor(),TextField.TYPE_STORED));document.add(new Field("title",blog.getTitle(),TextField.TYPE_STORED));document.add(new Field("url",blog.getUrl(),TextField.TYPE_STORED));indexWriter.addDocument(document);}indexWriter.commit();System.out.println("====索引创建完成====");}catch (Exception ex){ex.printStackTrace();}finally {if(indexWriter !=null){indexWriter.close();}}}@Overrideprotected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {doGet(req,resp);}
}

2、查询索引数据

public class IndexReaderServlet extends HttpServlet {@Overrideprotected void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {Directory dir =null;DirectoryReader reader =null;IndexSearcher searcher=null;String index_path="d:\\indexDir";try{//dir =new RAMDirectory();dir =new SimpleFSDirectory(Paths.get(index_path));reader = DirectoryReader.open(dir);searcher=new IndexSearcher(reader);String key = req.getParameter("key");Query query = new TermQuery(new Term("title",key));TopDocs rs=searcher.search(query,100);resp.setContentType("text/html");resp.setCharacterEncoding("UTF-8");PrintWriter out = resp.getWriter();StringBuilder strHtml =new StringBuilder();for (int i = 0; i < rs.scoreDocs.length; i++) {Document firstHit = searcher.doc(rs.scoreDocs[i].doc);strHtml.append("title:"+firstHit.getField("title").stringValue()+"<br>");strHtml.append("author:"+firstHit.getField("author").stringValue()+"<br>");strHtml.append("<a href='"+firstHit.getField("url").stringValue()+"'>"+ firstHit.getField("url").stringValue()+"</a><br>");strHtml.append("====================================================<br>");}out.write(strHtml.toString());}catch (Exception ex){ex.printStackTrace();}finally {reader.close();}}@Overrideprotected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {doGet(req,resp);}
}

  

总结

     读写索引用到的几个关键类:IndexWriter、IndexSearcher、Directory、DirectoryReader、Document、TermQuery、Field

转载于:https://www.cnblogs.com/sword-successful/p/6547965.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/429547.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#中变量(成员变量、局部变量、全局变量)的作用域

不管在任何编程语言中都有变量的定义&#xff0c;变量就像是一个容器&#xff0c;不同的变量会在内存中占据不同大小的内存空间。定义变量后会将分配的地址绑定在这个变量名上&#xff0c;以后对该变量名的操作就是对该内存地上存储内容的操作。 namespace test {class myTest…

Servelt中的ServletContext对象

转载于:https://www.cnblogs.com/yxh-only/p/6548046.html

export function函数传参_从底层看前端(七)—— JavaScript到底有多少种函数?

在上篇文章中我们了解到了执行上下文是什么&#xff0c;也知道了任何语句的执行都会依赖特定的上下文。一旦上下文被切换&#xff0c;整个语句的效果可能都会发生变化。那么&#xff0c;切换上下文的时机就显得非常重要。在JavaScript中&#xff0c;切换上下文最主要的场景就是…

liunx常用命令0

1 开启Linux操作系统&#xff0c;要求以root用户登录GNOME图形界面&#xff0c;语言支持选择为汉语 点击“未列出&#xff1f;”-->输入root和密码 2 使用快捷键切换到虚拟终端2&#xff0c;使用普通用户身份登录&#xff0c;查看系统提示符 ctrlaltf2 3 使用命令退出虚拟终…

2个td合成一个td_18个月16个爆款,合成类玩法的下一个机会在哪?

18个月16个爆款&#xff01;近日&#xff0c;编者体验了近18个月爆款小程序榜单之中的游戏&#xff0c;体验之后编者发现&#xff0c;在这200多款游戏中&#xff0c;有16款都应用了合成类玩法&#xff0c;而且部分游戏是数次登榜&#xff0c;比如枪火工厂、全民养鲲、世界争霸等…

在线代码图片生成工具carbon

在日常工作中时常需要和同事间进行代码的沟通和交流&#xff0c;有时只是需要讨论某一段代码的内容&#xff0c;因此不必将整个文件发给同事。通常可以将部分代码进行截图&#xff0c;或者直接将部分代码复制粘贴发送给同事。但以上方法或因为代码太长需要多次截图&#xff0c;…

antd 日期时间选择_Excel最全时间类函数总结,有必要收藏一下哦

Excel数据格式中&#xff0c;一共分十一类&#xff0c;其中两类分别是日期与时间。Excel中存在大量公式用于处理这两个类型的数据&#xff0c;下面一一介绍与之相关的函数。年月日函数Excel函数中分别用year()、month()、day()函数返回一日期的年、月、日&#xff0c;这三个函数…

C#中的变量类型(值类型、引用类型)

C#中的变量类型&#xff1a; 值类型&#xff1a;值类型直接存储的是变量的值&#xff0c;变量空间在栈上分配&#xff0c;分配速度比较快。给变量赋值时需注意变量类型的取值范围&#xff0c;给变量赋不合理的值会导致编译器报错。布尔类型的变量只有两种可选择的值true/false&…

Java:IDEA下使用JUNIT

单元测试的基本使用 一、环境配置 使用idea IDE 进行单元测试&#xff0c;首先需要安装JUnit 插件。 1.安装JUnit插件步骤 File-->settings-->Plguins-->Browse repositories-->输入JUnit-->选择JUnit Generator V2.0安装。 2.使用JUnit插件 在需要进行单元测试…

arcore之路-unity开发从入门到实践_Unity游戏开发——单例模式的最佳实践

0.前言StarryFun&#xff1a;Unity游戏开发——关于单例模式的理解​zhuanlan.zhihu.com之前一篇文章讲了单例模式的简单理解&#xff0c;自知其中有很多不严谨的地方&#xff0c;由于本萌新也是在学习阶段&#xff0c;所以去翻看了开源的项目都是怎么实现的&#xff0c;发现了…

光耦的简介

光耦&#xff0c;光电耦合器的简称&#xff0c;它是以光信号作为介质传输电信号的元器件。光耦的输入端和输出端信号可以非常好的进行隔离&#xff0c;因此在隔离电路中经常会见到光耦。光耦合器一般由三部分组成&#xff1a;光的发射、光的接收及信号放大。输入的电信号驱动发…

接待员如何向客人upsell_客房留言卡也能收获好评,看看高情商酒店如何做的?...

客人对酒店最客观的评价从点评中就能看到&#xff0c;那酒店服务如何才能被客人看到呢&#xff1f;可不可以通过一张留言卡&#xff0c;被客人感知到呢&#xff1f;本文整理了多个客房服务实际场景案例&#xff0c;帮助酒店了解如何写好这张留言卡。一、什么场景下放置留言卡&a…

“2020 RT-Thread开发者大会” 思考感悟

从2019年开始参加RT-Thread的一次线下培训活动后&#xff0c;就深深的喜欢上这个国产的RTOS&#xff0c;之后RT-Thread举办的活动基本都有参加&#xff08;但每次活动抽奖都抽不到&#xff01;&#xff09;。当然&#xff0c;最为盛大的还属一年一度的RT-Thread开发者大会&…

小红书笔记_小红书的沙雕笔记,害人不浅啊

话说&#xff0c;当代人的十大必备软件是什么&#xff1f;要猫姐来说的话。除了微信微博抖音&#xff0c;小红书也肯定少不了&#xff01;它简直就是大部分PLMM的“种草神器”。就连明星都纷纷入驻小红书变身为“美妆博主”。前一阵上了热搜榜和李晨分手的范冰冰也是小红书的一…

2020 RT-Thread开发者大会 ART-Badge电子胸牌(可二次开发)

2020 RT-Thread开发者大会 ART-Badge电子胸牌&#xff08;可二次开发&#xff09;&#xff0c;动手实验IOT会场有介绍使用PersimmonUI设计器进行柿饼UI的开发&#xff0c;使用拖拽控件、注册事件的方式进行GUI的开发。开发语言使用JS&#xff0c;界面实现非常方便&#xff0c;后…

datatables分页下一页不能点击_干货,删不掉Word文末最后一页?学会5个方法,再也不愁啦...

在处理Word文档时&#xff0c;经常会在文档最后出现一页空白&#xff0c;非常讨厌&#xff0c;更可恶的是总是删不掉&#xff0c;按退格键或者delete键都无济于事。你是不是也正在为删除Word文末空白页发愁呢&#xff1f;有没有好的方法解决这一问题呢&#xff1f;有的&#xf…

计分员计分程序

1.估计这个任务需要多长时间&#xff1a;两星期 2.需求分析&#xff1a; 作为一名现场记分员&#xff0c;我希望详细记录比赛现场比分增长情况&#xff0c;以便观众及运动员、教练员及时掌握比赛状况。&#xff08;满意条件&#xff1a;每一次比分的改变&#xff0c;都要形成一…

蓝牙入门基础知识(一)

蓝牙起源 1995年5月20日&#xff0c;在美国华盛顿州&#xff0c;索尼爱立信、IBM、英特尔、诺基亚、东芝成立了蓝牙技术联盟&#xff08;Bluetooth Special Interest Group&#xff0c;SIG&#xff09;。SIG是一个制定蓝牙规范&#xff0c;推送蓝牙技术发展的国际组织。SIG授权…

C#语言入门详解---委托(刘铁猛)

委托&#xff1a;函数指针的升级版&#xff0c;可以类比C语言中的函数指针进行理解 变量的本质就是以变量名所对应的内存地址为起点的一段内存&#xff0c;这段内存中存储的就是变量的数据&#xff0c;这段内存的大小由变量的数据类型决定。 函数代表算法&#xff0c;函数的本…