搜索准确性提升 20%,Jina Reranker 成为 RAG 优化的新标杆!

在整合大型语言模型(LLM)到业务流程时,企业经常会遇到一些头疼的问题,比如怎样保持数据时效性、避免幻觉现象,以及如何保护数据安全等等。为了解决这些问题,检索增强生成(RAG)技术应运而生,它不仅帮助我们克服了这些挑战,还引领了信息检索的新方向。

虽然 RAG 系统及其科普非常流行,但在实际使用中,我们会发现它“入门易,精通难”。目前,业界的讨论主要集中在如何改进内容提取、文档分块,以及 Embedding 模型等技术,但很少有人提到提升搜索准确度的关键步骤 —— Reranker。

日前,我们正式发布了 Jina Reranker(jina-reranker-v1-base-en),专为提高搜索准确性打造。Jina Reranker 在多个权威测评中屡获领先,实验数据显示,相比简单 RAG 系统,搭载该模型的检索系统命中率提高 8%,MRR 更是飙升 33%。

模型链接: https://jina.ai/reranker/

什么是 Reranker

你可能会问,既然向量检索已经根据相似度给出了初步排序,为什么我们还需要 Reranker 呢?

下表阐述了向量检索和 Reranker 模型之间的主要差异。

尽管向量检索初步完成了排序,但这种文档级别的粗排往往忽略了用户真实的检索意图,并且难以捕捉语义细节,尤其是在处理复杂查询时,最终结果未必匹配用户需求,此外,虽然得分最高的文档或许相关,但其余排名的文档相关性可能大打折扣。

这时,Reranker 就成为了向量检索的有力补充,在查询时进行 Token 级别的深度分析,能够更精确地理解用户的真实意图,从而提升搜索结果的相关性和准确性。这不仅优化了用户体验,减少了用户筛选结果的工作量,还使得搜索系统能够更好地适应多变和复杂的用户需求。

整个过程如下图所示,首先利用向量检索的高效和简便,快速召回候选文档,随后由 Reranker 对每个候选文档逐一打分,实现二次重排,从而提升搜索结果的相关性和准确度。

通过将两种方法有效结合,可以综合其高效、准确的优点,满足用户对于高速度与高准确度的双重需求。

Jina Reranker 模型亮点

四大榜单排名领先

我们采用了 LlamaIndex RAG、BEIR、MTEB 和 LoCo 等多个权威测试,并将 Jina Reranker 与其他三家领先的 Reranker ——BGE(BAAI)、BCE(网易有道)和 Cohere 进行了横向比较。全面评估了 Reranker 模型在查询理解、上下文匹配、排序精度等多个维度的表现。

其中,LlamaIndex RAG 侧重检验 RAG 应用场景下的表现,BEIR 测试信息检索模型的相关性和排名质量,MTEB 专门考察 Reranker 能力,而 LoCo 则着眼于模型在长文本下对局部一致性的把握程度。

LlamaIndex RAG

我们复现了 LlamaIndex 的 RAG 模型评估实验,评估了 RAG 任务中不同 Embeddings 和 Reranker 模型的组合效果。可以看到,在 Jina Reranker 加持下,平均命中率提升了 7.9%,MRR 提升了 33.7%。

Jina Reranker 一大亮点是它的通用性。无论是搭配我们自家的 jina-embeddings-v2-base-en,还是其他如 bge-base-en-v1.5、bce-embedding-base-v1 或 CohereV3-en,Jina Reranker 都能持续提升命中率和 MRR。这种灵活性让它成为了一个在各种场景下都能大显身手的工具。

LlamaIndex 评估链接:https://blog.llamaindex.ai/boosting-rag-picking-the-best-embedding-reranker-models-42d079022e83

BEIR

BIER(Benchmarking IR)评估模型的检索有效性,包括相关性和 NDCG。BIER 分数越高,匹配和搜索结果排名越准确。可以看到 Jina Reranker 排名高于其他 Reranker 模型。

MTEB

在 MTEB 的 Reranker 任务上进行测试,Jina Reranker 表现同样出色,表现领先其他模型。

LoCo

LoCo 衡量模型对局部一致性和上下文的理解,特别是超长文本(token 个数大于 1K)情形下的模型表现。Jina Reranker 在多个数据集上都取得了最高的 LoCo 分数,说明其识别相关信息并确定其优先级的能力很好。

Jina Reranker 在 LlamaIndex RAG、BEIR、MTEB 和 LoCo 等多个测评里,都拿下了最高的平均得分,稳稳地站在了行业前列。这些测试结果也 证明了 Jina Reranker 的通用性,能够与不同的 Embeddings 模型协同工作,无论在哪种应用场景下都能提供显著的性能提升。

长文本能力

Jina Reranker 还特别擅长处理长文本。它能支持长达 512 token 的查询和最长 8192 token 的超长文档输入,一次还能处理多达 2048 个候选文档!

这种顶级的长文本能力使其可广泛应用于分析研报、法律文书、客服聊天等众多场景,大幅提升了文本分析和内容生成的质量。

RAG 场景支持

值得一提的是,Jina Reranker 还针对 RAG 领域的特点进行了专门的模型优化,大幅提升了大型语言模型的响应精度。

如何 Jina Reranker

想要亲自体验 Jina Reranker 的在多个权威测评中的卓越表现、强大的长文本处理能力以及广泛的适用性吗?

只需访问 http://jina.ai/reranker,无需绑定信用卡,你可以直接获取免费 API 密钥,包括一百万 Token,立刻开始提升你的搜索系统。

如图所示,只需输入查询内容和相关文档(目前只支持英文文本),系统便会迅速返回包含文档相关性得分的 JSON 格式响应,让您一目了然地看到搜索结果的优化排序。我们提供 100 万 Token 免费试用额度,助您轻松验证 Jina Reranker 对搜索效果的显著改善。

很快,Jina Reranker 还会在 AWS SageMaker 市场上线,提供更多安全便捷的部署选项。我们期待你的反馈,一起推动搜索技术的进步!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/722556.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

盘点国内大厂的10个AI创作工具,看看你都用过哪些?

国内大厂的 AI 创作工具,目前已经非常多了,而且有很多都是大家耳熟能详的。 下面整理了一些,包含 AI 绘画、AI 视频、AI 智能体、AI 大模型等多个方向的国内大厂 AI 创作工具。 发现有几款 AI 工具,还真的非常好用。看看这些 AI…

深入浅出Redis(三):Redis数据的存储、删除以及淘汰

引言 Redis是一款基于键值对的数据结构存储系统,它的特点是基于内存操作、单线程处理命令、IO多路复用模型处理网络请求、键值对存储与简单丰富的数据结构等等 本篇文章不像以往文章围绕Redis某个特点来讲解,而是作为过渡介绍,来说一说Redi…

基于springboot的大型商场应急预案管理系统论文

大型商场应急预案管理系统 摘要 随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了大型商场应急预案管理系统的开发全过程。通过分析大型商场应急预案管理系统管理的不足,创建了一个计算机管理大型商场应急…

软件测试开发环境、测试环境、准生产环境、生成环境

在一个项目开发到发布的整个过程中,会使用到很多个环境进行测试和运行项目。最基本的开发环境、测试环境、准生产环境、生成环境 一、开发环境 开发环境顾名思义就是我们程序猿自己把项目放到自己的电脑上,配置好以后,跑起来项目&#xff0…

如何器测试IP池的质量?代理IP是怎么在问卷调查中应用的呢?

在数字时代,数据收集和分析变得日益重要,而问卷调查作为一种常见的数据收集工具,其效率和准确性直接影响着研究的可信度和有效性。为了实现这一目标,代理IP在问卷调查中的应用变得愈发关键。本文旨在探讨如何测试IP池的质量&#…

真机测试——关于荣耀Magic UI系列HBuilder真机调试检测不到解决办法

​​​​​出现这种状况怎么办 1、开启USB调试 2、重点来了——我们要选择USB配置,选择音频来源 3、连接OK

vue3基础教程(2)——创建vue3+vite项目

博主个人微信小程序已经上线:【中二少年工具箱】。欢迎搜索试用 正文开始 专栏简介1. 前言2.node版本检测3.创建vue项目 专栏简介 本系列文章由浅入深,从基础知识到实战开发,非常适合入门同学。 零基础读者也能成功由本系列文章入门&#x…

javascript数组排序的方法

目录 基本用法 按照数字大小排序 按照降序排序 按照字符串长度排序 按照对象属性排序 在JavaScript中,数组排序通常使用Array.prototype.sort()方法。这个方法会按照指定的顺序对数组的元素进行排序,并返回排序后的数组。如果未指定比较函数&#x…

Springboot配置MySQL数据库

Springboot配置MySQL数据库 一、创建springboot项目&#xff0c;并添加如下依赖 <dependency><groupId>com.mysql</groupId><artifactId>mysql-connector-j</artifactId><scope>runtime</scope> </dependency>二、在applica…

基于springboot+vue的酒店管理系统

博主主页&#xff1a;猫头鹰源码 博主简介&#xff1a;Java领域优质创作者、CSDN博客专家、阿里云专家博主、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战&#xff0c;欢迎高校老师\讲师\同行交流合作 ​主要内容&#xff1a;毕业设计(Javaweb项目|小程序|Pyt…

实现session共享的方法总结完整版

文章目录 实现session共享的方法总结完整版1、使用共享数据库&#xff1a;2、使用粘性会话&#xff08;Sticky Session&#xff09;&#xff1a;3、使用缓存系统&#xff1a;4、使用分布式文件系统&#xff1a;5、使用中央认证服务&#xff1a;6、使用会话复制&#xff1a;7、使…

100%开源大模型OLMo:代码/权重/数据集/训练全过程公开,重定义AI共享

前言 近日&#xff0c;艾伦人工智能研究所联合多个顶尖学术机构发布了史上首个100%开源的大模型“OLMo”&#xff0c;这一举措被认为是AI开源社区的一大里程碑。OLMo不仅公开了模型权重&#xff0c;还包括了完整的训练代码、数据集和训练过程&#xff0c;为后续的开源工作设立…

三星成功研发出业界首款12层堆叠HBM3E

三星电子有限公司成功研发出业界首款12层堆叠HBM3E DRAM——HBM3E 12H&#xff0c;这是迄今为止容量最大的HBM产品。这款新型HBM3E 12H内存模块提供了高达1,280GB/s的史上最高带宽&#xff0c;并拥有36GB的存储容量&#xff0c;相较于之前的8层堆叠HBM3 8H&#xff0c;在带宽和…

ECMAScript6

课程链接 目录 相关介绍什么是ECMA什么是ECMAScript为什么学习ES6 letconst变量解构赋值模板字符串对象简化写法箭头函数函数参数的默认值rest参数扩展运算符Symbol迭代器生成器函数与调用Promise介绍与基本用法Promise封装读取文件Promise.prototype...then方法Promise.catch…

CCDP.01.寄主机SSH连接虚拟机的QA

V0.0 初始版本-2024.2.29 检查VM的网卡配置 如上图&#xff0c;如果enp0s3网卡没有出现形如10.0.0.??/24的ip配置&#xff0c;说明该网卡配置存在错误&#xff0c;或者没有“使能”该网卡。在RockyLinux8.X中可检查“ifcfg-enp0s&#xff1f;” vi /etc/sysconfig/network-…

【JS】WebSocket实现简易聊天室

【JS】WebSocket实现简易聊天室 聊天室思路示例 聊天室思路 聊天室思路 1、连接服务器先建立连接&#xff0c;默认生成匿名用户(admin01) 2、客户端发送消息&#xff0c;其它客户端用户都会同步接收消息(服务端接受消息广播所有连接用户) 3、客户端修改昵称&#xff0c;其它客…

数据结构之七大排序

&#x1d649;&#x1d65e;&#x1d658;&#x1d65a;!!&#x1f44f;&#x1f3fb;‧✧̣̥̇‧✦&#x1f44f;&#x1f3fb;‧✧̣̥̇‧✦ &#x1f44f;&#x1f3fb;‧✧̣̥̇:Solitary_walk ⸝⋆ ━━━┓ - 个性标签 - &#xff1a;来于“云”的“羽球人”。…

FreeRTOS操作系统学习——FreeRTOS工程创建

FreeROTS工程创建 详细步骤 如无特殊情况&#xff0c;大部人都要配置为外部高速时钟 另外&#xff0c;本实验使用了FreeRTOS&#xff0c;FreeRTOS的时基使用的是Systick&#xff0c;而 STM32CubeMX中默认的HAL库时基也是Systick&#xff0c;为了避免可能的冲突&#xff0c;最…

java014 - Java继承

1、继承 1.1 继承概述 继承是面向对象的三大特征之一&#xff0c;可以使得子类具有父类的属性和方法&#xff0c;还可以在子类中重新定义&#xff0c;追加属性和方法。 1.2 继承格式 public class 子类类名 extends 父类类名 {} 范例&#xff1a;public class son extends …

鸿蒙应用组件

基础组件 索引组件—AlphabetIndexer&#xff08;相当于安卓的seedbar&#xff09; 使用&#xff1a;AlphabetIndexer(value: {arrayValue: Array<string>, selected: number})空白填充组件—Blank&#xff08;占位使用&#xff0c;当父组件为Row/Column/Flex时生效&am…