以FastGPT为例提升Rag知识库应用中的检索召回命中率

提升Rag知识库应用中的检索召回命中率

在构建Rag(Retrieval-Augmented Generation)知识库应用时,检索召回知识片段的命中率是至关重要的。高效、准确的检索机制是确保AI系统能够精准响应用户查询的基础。当前,FastGPT主要采用三种检索方式:语义检索(向量化检索)、全文检索,以及结合两者的混合检索。每种方式均可搭配重排模型以优化结果排序。

检索方式评估

  • 全文检索:虽适用于关键词检索,但在对话场景下,直接将用户问题作为关键词进行检索,效果欠佳,因对话的复杂性和语境敏感性难以通过简单关键词捕捉。
  • 混合检索:旨在结合语义检索与全文检索的优势,但受限于知识库最大引用tokens,其效果并未如预期般显著提升。实际测试中,混合检索的结果排序往往不如单独使用语义检索时精确,且对检索效率的提升有限。
  • 语义检索:经过反复测试,语义检索因其能够捕捉更丰富的语义信息,被证明在对话应用中表现最佳。其通过向量化技术,将用户查询与知识库中的内容进行深度语义匹配,从而有效提升了召回命中率。

重排模型的考量

重排模型旨在进一步优化检索结果的排序,但其效果依赖于初始检索结果的准确性。当语义检索已经能够提供高度相关的结果时,重排模型可能仅带来边际提升,同时增加计算复杂度和响应时间,影响用户体验。因此,在语义检索效果良好的情况下,引入重排模型需慎重考虑其必要性与成本效益。

优化语义检索的关键

提升语义检索的准确度是优化检索召回命中率的核心。要实现这一目标,需深入理解语义检索的原理,并针对性地优化其实现细节。这可能包括:

  • 优化向量表示:采用更先进的自然语言处理模型(如BERT、GPT系列等)来生成更精确、更具区分度的向量表示。
  • 精细化索引构建:根据知识库的特点和用户查询的习惯,优化索引的构建策略,确保关键信息得到有效索引。
  • 动态调整阈值:根据实际应用场景和反馈,动态调整检索过程中的相似度阈值,以平衡召回率与准确率。

综上所述,提升Rag知识库应用中的检索召回命中率,关键在于优化语义检索的准确度。通过深入理解语义检索原理,并采取有效措施提升其实现效果,可以显著提升AI系统的响应质量和用户体验。同时,在引入重排模型等优化手段时,需充分考虑其必要性与成本效益,避免过度复杂化系统架构。

语义检索原理

字数相似

用户输入问题的字数和知识库存储的知识片段的字数之间有相似度的影响,比如用户输入“你好呀”,知识库里由“你好”、“你好呀”、“你好啊”、“您好”、“你也好呀”,进行检索。
在这里插入图片描述
从检索结果来分析,知识库里和用户问题一模一样的相似度为1,最靠前。其次是意思相同,字数也相同的。最后是意思相同,字数不同的知识段落。

关键词频率

我们还用你好进行召回测试,知识库添加“你好你好”和“你好你好你好”,查询结果如下:
在这里插入图片描述
从检索结果来分析,知识库里和用户问题一模一样的相似度还是1,最靠前。其次是“你好你好”、“您好”、“你好你好你好”、“你好啊”,从查询结果排序不难看出,“你好”这个关键词出现的多的相似会高,但是也不是关键词出现频率越高相似越高。还受到字数相似的影响,在字数相近的情况下,关键词出现的越多,相似度越高。

倒叙索引

我们还用你好进行召回测试,知识库添加“你好兄弟”和“兄弟你好”,查询结果如下:
在这里插入图片描述
从结果来看,“兄弟你好”排在“你好兄弟”前面,可见在意思相同,字数相同的情况下,关键词在段落中出现的越靠后,相似度越高。

语义匹配

我们还用“城市”进行召回测试,知识库添加“你好兄弟”和“兄弟你好”,查询结果如下:
在这里插入图片描述
从结果来看,除了第一个一模一样的以外。其他结果的都没出现城市两个字,只出现了和城市相关的北京和首都。他们虽然字不一样,但是语义是一样的。

总结

要想提升语义检索的准确度,需要从以下几个方面入手

  • 尽量保持知识库的分段字数相近
  • 尽量避免同一段落内出现太多意思相近的词
  • 当用户输入多个问题里包含多个关键词时,如果想让有些关键词的检索时候权重高一点,需要人工在对应段落,增加该关键词的向量索引。

相关文章推荐

《使用 Xinference 部署本地模型》
《Fastgpt接入Whisper本地模型实现语音输入》
《Fastgpt部署和接入使用重排模型bge-reranker》
《Fastgpt部署接入 M3E和chatglm2-m3e文本向量模型》
《Fastgpt 无法启动或启动后无法正常使用的讨论(启动失败、用户未注册等问题这里)》
《vllm推理服务兼容openai服务API》
《vLLM模型推理引擎参数大全》
《解决vllm推理框架内在开启多显卡时报错问题》
《Ollama 在本地快速部署大型语言模型,可进行定制并创建属于您自己的模型》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/50370.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用python中的特殊字典——defaultdict

专栏总目录 一、defaultdict说明 在Python中是一个特殊类型的字典,它是collections模块中的一个类defaultdict的实例。这个字典与普通的字典dict不同之处在于,当你试图访问一个不存在的键时,defaultdict会自动创建一个新条目,其值…

Oracle核心进程详解并kill验证

Oracle核心进程详解并kill验证 文章目录 Oracle核心进程详解并kill验证一、说明二、核心进程详解2.1.PMON-进程监控进程2.2.SMON-系统监控进程2.3.DBWn-数据库块写入进程2.4. LGWR-日志写入器进程2.5. CKPT-检查点进程 三、Kill验证3.1.kill ckpt进程3.2.kill pmon进程3.3.kill…

智慧工地视频汇聚管理平台:打造现代化工程管理的全新视界

一、方案背景 科技高速发展的今天,工地施工已发生翻天覆地的变化,传统工地管理模式很容易造成工地管理混乱、安全事故、数据延迟等问题,人力资源的不足也进一步加剧了监管不到位的局面,严重影响了施工进度质量和安全。 视频监控…

中小企业数字化转型的关键五步,你了解吗?

在信息技术迅猛发展的当下,数字化转型已成为中小企业提升竞争力、实现可持续发展的关键策略。在数字化转型过程中,工业软件作为贯穿生产全流程的智能化引擎,其选择与应用显得尤为关键。那么,中小企业应如何科学合理的规划数字化转…

Vue前端页面嵌入mermaid图表--流程图

一、安装Mermaid 首先,你需要在你的项目中安装Mermaid。可以通过npm或yarn来安装: npm install mermaid --save # 或者 yarn add mermaid结果如图: 二、Vue 方法一:使用pre标签 使用ref属性可以帮助你在Vue组件中访问DOM元素 …

数据结构 | LinkedList与链表

前言 ArrayList底层使用连续的空间,任意位置(尤其是0位置下标)插入或删除元素时,需要将该位置后序元素 整体 往前或往后搬移,故时间复杂度为O(N). 优点(给定一个下标,可以快速查找到对应的元素,时间复杂度为O(1))增容需要申请新空间,拷贝数据,释放旧空间,会有不小的消耗.增容一…

【权威发布】第二届雷达、信号与信息处理国际会议(RSIP 2024)

第二届雷达、信号与信息处理国际会议 2024 International Conference on Radar, Signal and Information Processing 【1】会议简介 第二届雷达、信号与信息处理国际会议是一次聚焦雷达技术、信号处理及信息处理领域最新研究成果和前沿趋势的盛会。会议旨在汇聚国内外雷达与信号…

【Django】anaconda环境变量配置及配置python虚拟环境

文章目录 配置环境变量配置python虚拟环境查看conda源并配置国内源在虚拟环境中安装django 配置环境变量 control sysdm.cpl,,3笔者anaconda安装目录为C:\ProgramData\anaconda3 那么需要加入path中的有如下三个 C:\ProgramData\anaconda3 C:\ProgramData\anaconda3\Scripts C:…

【C++】类和对象(三)完结篇

个人主页 创作不易,感谢大家的关注! 文章目录 ⭐一、再探构造函数1.初始化列表 🎉二、类型转换🏠三、static成员🏝️四、友元⏱️五、内部类🎈六、匿名对象🎡七、在拷贝对象时的编译器优化 ⭐一…

火焰传感器 - 从零开始认识各种传感器【第十六期】

火焰传感器|从零开始认识各种传感器 1、什么是火焰传感器 火焰传感器是一种用于检测火焰或火光的传感器。它可以快速、准确地检测到周围环境中火源的存在,从而在火灾发生之初及时向消防人员或相关机构发送报警信息,以便及时采取措施进行火灾扑救。此外…

C# 贪吃蛇游戏

贪吃蛇游戏可分为手动玩法和自动玩法 冯腾飞/贪吃蛇

【网络安全学习】 SQL注入01:基础知识

💻 1. 什么是SQL注入 SQL注入是一种针对Web程序中数据库层的安全漏洞的攻击方式。它利用了程序对用户输入数据合法性的判断或过滤不严,允许攻击者在设计不良的程序中添加额外的SQL语句,从而执行计划外的命令或访问未授权的数据。攻击者可以通…

Docker搭建私有仓库harbor(docker 镜像仓库搭建)

Harbor介绍 Docker容器应用的开发和运行离不开可靠的镜像管理,虽然Docker官方也提供了公共的镜像仓库,但是从安全和效率等方面考虑,部署我们私有环境内的Registry也是非常必要的。Harbor是由VMware公司开源的企业级的Docker Registry管理项目…

Android statsd 埋点简析

源码基于:Android U 0. 前言 最近在研究 Android 自带的系统数据指标采集功能,框架依旧很严谨、完美,这里做个分享。 1. Android S 之后变化 stats 的代码从 framework 或 system/core 中转移到了 packages/modules/StatsD 目录中。 2. 框架…

IEC104转MQTT网关轻松将IEC104设备数据传输到Zabbix、阿里云、华为云、亚马逊AWS、ThingsBoard、Ignition云平台

随着工业4.0的深入发展和物联网技术的广泛应用,IEC 104(IEC 60870-5-104)作为电力系统中的重要通信协议,正逐步与各种现代监控、管理和云平台实现深度融合。IEC104转MQTT网关BE113作为这一融合过程中的关键设备,其能够…

动手学深度学习V2每日笔记(模型选择+过拟合和欠拟合)

本文主要参考沐神的视频教程 https://www.bilibili.com/video/BV1K64y1Q7wu/?spm_id_from333.788.recommend_more_video.0&vd_sourcec7bfc6ce0ea0cbe43aa288ba2713e56d 文档教程 https://zh-v2.d2l.ai/ 本文的主要内容对沐神提供的代码中个人不太理解的内容进行笔记记录&a…

通过IEC104转MQTT网关轻松接入阿里云平台

随着智能电网和物联网技术的飞速发展,电力系统中的传统IEC 104协议设备正面临向现代化、智能化转型的迫切需求。阿里云作为全球领先的云计算服务提供商,其强大的物联网平台为IEC 104设备的接入与数据处理提供了强大的支持。本文将深入探讨钡铼网关在MQTT…

UML通信图建模技术及应用例

新书速览|《UML 2.5基础、建模与设计实践》 在对系统的动态行为进行建模时,通信图常被用于按组织结构对控制流进行建模。与顺序图一样,一个单独的通信图只能显示一个控制流。 使用通信图建模时可以遵循如下策略: (1&#xff09…

WinDbg用户模式调试基础

WinDbg用户模式调试基础 在前面的文章中,介绍了如何使用WinDbg分析蓝屏原因https://www.cnblogs.com/zhaotianff/p/15150244.html 不过那会都是在网上找的资料,东拼西凑出来,并没有系统的去学习WinDbg。 最近在学习内核开发这一块的内容&…

顺序表的实现和操作

目录 一.前言 二. 顺序表的优缺点 三. 顺序表的定义和初始化 四.顺序表的相关操作 一.前言 首先介绍下线性表的定义,线性表是具有相同特性的数据元素的一个有限序列。而我们的顺序表就是线性表的一种,是线性表的顺序存储结构。所谓顺序存储就是把逻辑…