LinkedIn已将可自定义的索引引擎IndexTank开源

LinkedIn已将IndexTank开源,这是一种运行在云中的文档索引引擎,它让用户可以自定义编制索引的过程,并对结果进行微调。

IndexTank是在一年之前发布的,在十月份被LinkedIn收购,并在最近开放了源代码。IndexTank是与Google自定义搜索类 似的云服务,它基于Amazon Web Services运行,给网站提供了为其中的内容编制索引的功能,而网站的访问者会在稍后搜索这些内容。IndexTank声称他们的用户拥有完全的控制 权,可以决定对什么编制索引,何时编制索引,以及如何对结果排序。这意味着网站可以在搜索结果的基础之上,对想要优先显示的文档做出改善,而不需要依赖于Google的搜索算法。

和很多站点不同,IndexTank不会爬取网页的内容,从而对其建立索引,而是会由站点向索引引擎发送要索引的数据。这样,文档在创建之后就可以索引到,这提供了实时的结果。另外,我们可以免费添加这项服务。

IndexTank包括三个主要组件:

  • 索引引擎——只对简单文本建立索引的引擎。而PDF、微软文档以及其他文档类型需要在建立索引之前转换为文本格式。
  • API——可以通过Java、Python、.NET、Ruby和PHP客户端访问的RESTful的接口。
  • Nebulizer——一种多租户框架,其中存放不限数量、运行在IaaS基础架构上的索引引擎。

IndexTank加入了Zoie,那是一种基于Apache Lucene构建的实时搜索引擎,并由LinkedIn于2008年开源。

IndexTank声称他们已经在一年间吸引了成千上万的用户,其中最值得关注的就是Reddit,但这家公司在被LinkedIn收购的时候还没有盈利。

IndexTank的源代码可以在GitHub:Index Engine和API plus Nebulizer处下载。

转载于:https://www.cnblogs.com/shihao/archive/2012/01/05/2313233.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/297570.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机职称 计算机二级证,国家计算机二级证书含金量有多高

首先感谢你的邀请,我们都知道在大学生涯考证中,计算机二级#计算机二级#基本是在校大学生必备的证书。当然我说的必考证书是针对已经了解计算机证书的,当然可能还有一些人不了解,那学姐简单来说一下,什么是全国计算机二…

无法使用此安装程序来安装 .net framework_NuGet是什么?理解与使用(上)

如果你了解python,那么它类似pip。如果你了解nodejs,那么它类似npm。如果你了解ruby,那么它类似gem。对,它就是一个包(package)管理平台,确切的说是 .net平台的包管理工具,它提供了一…

NoSQL 是否可以用来做日志中心 ?

咨询区 ikrain:请问大家在分布式程序中用 nosql 来做日志中心的经验?我做了一些研究,发现用 Mongodb 做日志中心是一个非常好的选择,而且我发现 log4net 对它也是直接集成的,比如: log4mongo-net 。不知道大家可推荐这…

effective C++ 条款 3:尽可能使用const

const 修饰指针&#xff1a;如果关键字const出现在星号*左边&#xff0c;表示被指物是常量&#xff0c;如果const出现在*右边表示指针自身是常量&#xff0c; 如果出现在两边表示被指物和指针都是常量&#xff1b; const std::vector<int>::iterator iter vec.begin(); …

为团委出书写:《打造社团品牌:请给我一个理由,让我记住你!》

前些日子&#xff0c;大学母校的棋社社长欢欢给我打电话&#xff0c;说团委要出一本论述社团发展的书&#xff0c;希望我这个老社长代表翰轩棋社写一篇文字&#xff0c;说最好要5000字&#xff0c;我当时觉得压力巨大&#xff0c;现在经过几个日夜终于写出来了&#xff0c;没想…

长能耐了?想造反了?你老婆没了.......

1 提出问题的人一律直接解决掉▼2 今年的心理阴影是金字塔和钢琴键带来的▼3 广州考如何催收房租&#xff1f;▼4 想起了大雄的衣柜......▼5 这简直一毛一样▼6 我今天非要跳上去不可&#xff01;突然想到我还有点急事&#xff0c;告辞……▼7 据说&#xff0c;有不少男…

php 无限查找下级业绩_PHP 面试踩过的坑

因为最近需要面试&#xff0c;所以特意整理了一下面试所经历的一些面试题。分享一下&#xff0c;希望对自己有用&#xff0c;也对其他人有用。尚未有答案的&#xff0c;后面会陆续更新&#xff0c;如果有补充答案的&#xff0c;也十分感激。1.get,post 的区别**显示有区别 **ge…

蓝牙Bluetooth技术手册规范下载【转】

蓝牙Bluetooth技术手册规范下载 http://www.crifan.com/summary_bluetooth_specification_download/ 【背景】 之前就已经整理和转帖了和蓝牙技术相关的一些内容&#xff1a; 【资源下载】bluetooth 协议 spec specification 蓝牙1.1、蓝牙1.2、蓝牙2.0&#xff08;蓝牙2.0EDR&…

微型计算机原理中LEA,微型计算机系统原理及应用(第2版)第2章

第二章微型计算机指令系统题2-1 试分别说明以下各指令的源操作数属于何种寻址方式。答&#xff1a;1、MOV AX ,[SP] ——寄存器间接寻址2、MOV DS ,AX ——寄存器寻址3、MOV DI ,0FF00H ——立即数寻址4、MOV BX ,[2100H] ——直接寻址5、MOV CX ,[SI5] ——变址寻址6、MOV AX …

python获取历史双色球数据_你的梦想,我来买单!Python分析双色球中奖号码竟成功获取特等奖

关于双色球的话题估计大家都听的很多&#xff0c;毕竟成本很低&#xff0c;但是收获很高。毕竟当利润达到100&#xff05;时,就有人敢于铤而走险。当利润达到200&#xff05;时,他们就敢于冒上断头台的危险。 而当利润达到300%他们就会践踏人间的一切法律。更何况是n倍的利润刺…

[恢]hdu 2147

2011-12-20 15:42:45 地址&#xff1a;http://acm.hdu.edu.cn/showproblem.php?pid2147 题意&#xff1a;n*m的棋盘&#xff0c;一开始在右上角。每次只能走到左、下 或者左下。判胜败。 mark&#xff1a;简单博弈。n、m同时为奇数则败。 代码&#xff1a; # include <stdi…

分布式、微服务必须配个日志管理系统才优秀,Exceptionless走起~~~

前言在真实的项目中&#xff0c;不管是功能日志、错误日志还是异常日志&#xff0c;已经是项目的重要组成部分。在原始的单体架构&#xff0c;通常看日志的方式简单粗暴&#xff0c;直接登录到服务器&#xff0c;把日志文件拷贝下来进行分析&#xff1b;而如今分布式、微服务架…

Hotspot hotswap, who and who are best freinds

Hotspot&hotswap,whoandwhoarebestfreinds(点击这里查看ppt)java动态替换的ppt。hotspot&hotswapwhoandwhoarebestfriendsxuanxitaobao.comwhyweneedhotswap&#xff1f;主管:你在偷懒&#xff1f;汇编开发人员&#xff1a;我在编译。C开发人员:我在编译打包部署。java…

《TCP/IP详解卷1:协议》第6章 ICMP:Internet控制报文协议-读书笔记

章节回顾&#xff1a; 《TCP/IP详解卷1&#xff1a;协议》第1章 概述-读书笔记 《TCP/IP详解卷1&#xff1a;协议》第2章 链路层-读书笔记 《TCP/IP详解卷1&#xff1a;协议》第3章 IP&#xff1a;网际协议&#xff08;1&#xff09;-读书笔记 《TCP/IP详解卷1&#xff1a;协议…

10以内的分解与组成怎么教_狗狗酷炫的飞盘游戏怎么玩?分解步骤教你快速学会...

现在的铲屎官都喜欢训练自己的狗狗&#xff0c;训练狗狗不仅可以增加狗狗与主人的感情&#xff0c;还能增强狗狗的协调性&#xff0c;开发狗狗的智力&#xff0c;可谓一举两得。其中飞盘是大家都比较爱的活动&#xff0c;经常看看狗狗以华丽的身姿一跃接起主人扔的飞盘&#xf…

计算机组成与系统 报告,计算机组成与系统结构实验报告2

计算机组成与系统结构实验报告,西北工业大学评语: 课中检查完成的题号及题数&#xff1a; 成绩:自评成绩:95课后完成的题号与题数&#xff1a;实验报告实验名称&#xff1a; 班级&#xff1a;1.4 CPU 与简单模型机设计实验 日期&#xff1a; 2015.11.16 杨添文10011303 学号&am…

c++ 异步下获取线程执行结果_前端异步编程的那些事

啊一、异步编程的运行机制我们学习Javascript语言的时候就知道它的执行环境是”单线程“的。所谓”单线程“&#xff0c;就是指一次只能处理一个任务。如果有多个任务&#xff0c;就必须排队&#xff0c;前面一个任务完成&#xff0c;再执行后面一个任务。常见的浏览器无响应(假…

自动驾驶规划算法

本文将讲解BFS&#xff0c;Dijstra&#xff0c;A*&#xff0c;动态规划的算法原理&#xff0c;不正之处望读者指正&#xff0c;希望有兴趣的读者能在评论区提出一些这些算法的面试考点&#xff0c;共同学习&#xff0c;一起进步 0 图论基础 图有三种&#xff1a;无向图、有向…

印度网民集体删除中国APP,网友评论亮了

全世界只有3.14 % 的人关注了爆炸吧知识最近&#xff0c;国外有一款Remove China Apps火了。这款APP只有一个功能&#xff1a;可以一键扫描用户手机里的应用&#xff0c;识别出自中国公司的应用&#xff0c;并进行一键删除的骚操作。应用的主图标、界面&#xff0c;甚至特意使用…

SQL Server 负载均衡集群(转)

SQL Server 负载均衡集群一个应用系统随着业务量的提高,以及访问量和数据流量的快速增长&#xff0c;各个核 心部分的处理性能和计算强度也相应增大&#xff0c;使得单一设备根本无法承担。在此情况下&#xff0c;如果扔掉现有设备去做大量的硬件升级&#xff0c;必将造成现有资…