14-43 剑和诗人17 - ActiveRAG之主动学习

​​​​​

14-43 剑和诗人17 - ActiveRAG之主动学习

大型语言模型 (LLM) 的出现开启了对话式 AI 的新时代。这些模型可以生成非常像人类的文本,并且比以往更好地进行对话。然而,它们在仅依赖预训练知识方面仍然面临限制。为了提高推理能力和准确性,LLM 需要能够整合外部知识。

检索增强生成 (RAG) 已成为一种利用外部来源的知识增强 LLM 的解决方案。RAG 将提取相关知识段落的检索器模块与神经生成器相结合,以根据检索到的上下文生成答案。这允许结合 LLM 固有知识之外的事实、概念和关系。尽管前景光明,但 RAG 面临着影响整体答案质量的挑战。

让我们介绍ActiveRAG,它是 RAG 框架的增强版,旨在应对这些挑战。我们将讨论 ActiveRAG 的动机、方法和结果。通过积极构建知识并将其紧密集成到 LLM 自身的认知中,ActiveRAG 与标准 RAG 相比实现了更高的准确性和解释连贯性。

积极知识建构的必要性

标准 RAG 的一个关键限制是其集成外部知识的被动方法。检索器模块提取可能相关的段落,并将其与输入查询连接起来。然后,这种上下文混合会调节 LLM 以生成答案。

然而,仅仅提供额外的背景并不能确保与 LLM 的内在知识紧密结合。该模型将检索到的段落视为松散的事实参考,而不是需要主动理解和拼凑的知识。这体现在几个方面:

  • 知识噪音:检索到的段落经常包含无关事实或关系,对回答特定查询没有用处。这会增加 LLM 的信噪比,嘈杂的无关知识会损害答案质量。
  • 知识脱节:即使与查询相关的上下文也常常与 LLM 现有的知识和认知缺乏连贯的联系。如果没有明确的联系,整合就会让人感觉脱节,而不是统一的解释流程。
  • 被动保存:由于对检索到的知识理解程度很低,LLM 被动保存上下文,没有进行更全面的评估或与自己的知识储备进行协调。结果是碎片化的理解,而不是混合的理解。

此外,RAG 的被动方法忽略了建构主义的关键原则,建构主义是一种学习理论,认为知识是由学习者主动构建的,而不是被动接收的。人类通过将新信息与现有结构联系起来、建立新的心理模型、通过矛盾进行推理以及调和冲突来构建知识。RAG 放弃了这些对于深度理解至关重要的建构。

ActiveRAG 简介

为了解决这些差距,ActiveRAG 是一种增强功能,可将主动知识构建注入 RAG。关键原则是:

  • 知识是主动积累的,而不是被动掌握的
  • 将外部知识与 LLM 的内在认知紧密结合
  • 通过评估周期协调和完善知识

基于这些原则,ActiveRAG 实现了包括检索、知识构建和答案生成的三阶段流程。

知识检索

与 RAG 类似,第一阶段使用密集向量相似度检索与查询可能相关的段落。关键区别在于检索较小的知识“”(1-3 个句子)而不是较长的段落。这可以过滤噪音并增强检索到的上下文的针对性。

知识建构

第二阶段利用检索到的块主动构建知识。四个子组件发挥独特的建构主义功能:

  • 语义关联——基于语义相关性将检索到的知识块与现有知识结构联系起来。这可以在现有的认知框架内吸收新信息。
  • 认知锚定——如果检索到的信息与现有知识的语义相关性较低,则建立新的知识参考框架。这扩展了认知边界。
  • 逻辑推理——通过从检索到的内容中得出结论来推断新知识。这建立了解决问题的逻辑链。
  • 认知一致性——识别检索到的组块与现有知识之间的冲突。然后执行解决以完善理解。这可以调和不一致之处。

这些组成部分共同模仿了人类的建构主义:将新知识与旧知识联系起来,形成新的心理模型,通过问题进行逻辑推理,并协调相互冲突的信息。

认知纽带

最后阶段将构建的知识重新整合到 LLM 的内在认知中。首先,LLM 根据其现有知识为查询生成初始思维流。接下来,构建的外部知识会动态地注入到这个思维流中以完善理解。

我们称之为“认知纽带”——来自外部来源的构建知识与 LLM 的内在认知的交集。标准 RAG 中的知识脱节,缺乏这种紧密的整合。

结果

与基线 RAG 相比,在一系列问答任务上对 ActiveRAG 进行了评估。一些关键结果:

  • ActiveRAG 通过减少知识噪音和增强推理能力,将答案准确率提高了约 5%。
  • ActiveRAG 的解释连贯性评级更高,表明检索到的知识与内在认知之间的结合更紧密。
  • 由于额外的知识构建,延迟增加了约 15%,但抵消了更高的准确度提升。

在法学硕士的认知过程中积极构建和吸收知识可以获得更精确的答案和统一的解释流程。

局限性和未来工作

ActiveRAG 虽然前景光明,但在未来的工作中仍存在一些需要解决的限制:

  • 多级流水线会增加延迟,因为知识构建比标准 RAG 增加了 2-3 倍的计算量。这可以通过模型提炼和优化来缓解。
  • 构建知识需要多次查询 LLM,这会增加成本。缓存构建的知识有助于最大限度地减少冗余生成。
  • 在模拟人类的知识构建方面仍然存在差距,例如进行类比、从示例中学习以及分层构建知识。

未来的工作可以增强 ActiveRAG 的建构主义功能,以进一步缩小与人类认知的差距。此外,建构组件与核心 LLM 之间的更紧密耦合可以增强流动性。

ActiveRAG 以其主动的方法表明,仅仅检索知识是不够的。在 LLM 的内在认知中构建、协调和积极整合知识可以带来更准确、更连贯的结果。虽然要达到人类水平的理解还有很长的路要走,但 ActiveRAG 为解锁隐藏在外部知识资源中的宝藏迈出了宝贵的一步。

结论

最后,标准 RAG 为利用外部知识增强 LLM 提供了一种有用但不完整的解决方案。其被动方法导致理解支离破碎。ActiveRAG 引入了主动知识构建和集成来解决这些差距。通过将构建的知识与内在认知紧密联系起来,ActiveRAG 实现了卓越的准确性和解释连贯性。

在神经网络中模拟人类建构主义学习方面仍有许多前沿领域需要探索。但ActiveRAG 提供了一个前进的学习蓝图— — 它不将知识视为静态持有的外部资产,而将其视为一种需要构建、塑造和编织成理解系统的活生生的力量。凭借这种积极的精神,人类知识中蕴藏的宝藏不仅更容易获得,而且成为触及认知本身本质的丰富源泉。

14-43 剑和诗人17 - ActiveRAG之主动学习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/42244.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

每日一题~oj(贪心)

对于位置 i来说,如果 不选她,那她的贡献是 vali-1 *2,如果选他 ,那么她的贡献是 ai. 每一个数的贡献 是基于前一个数的贡献 来计算的。只要保证这个数的前一个数的贡献是最优的,那么以此类推下去,整体的val…

AI让大龄程序员重新焕发活力

AI是在帮助开发者还是取代他们? 在软件开发领域,生成式人工智能(AIGC)正在改变开发者的工作方式。无论是代码生成、错误检测还是自动化测试,AI工具正在成为开发者的得力助手。然而,这也引发了对开发者职业…

华为云简介

前言 华为云是华为的云服务品牌,将华为30多年在ICT领域的技术积累和产品解决方案开放给客户,致力于提供稳定可靠、安全可信、可持续创新的云服务,赋能应用、使能数据、做智能世界的“黑土地”,推进实现“用得起、用得好、用得放心…

优化视频编辑体验:精准高效视频分割,降低误差率,显著提升处理精度与效率

在数字创意飞速发展的今天,视频编辑已成为展现创意与才华的重要舞台。然而,面对海量的视频素材和复杂的编辑需求,如何快速、准确地完成视频分割,成为了每一个视频编辑师心中的难题。今天,我们荣幸地向您介绍一款颠覆性…

摸鱼大数据——Spark SQL——DataFrame详解一

1.DataFrame基本介绍 DataFrame表示的是一个二维的表。二维表,必然存在行、列等表结构描述信息​表结构描述信息(元数据Schema): StructType对象字段: StructField对象,可以描述字段名称、字段数据类型、是否可以为空行: Row对象列: Column对象&#xff…

Rejetto HFS 服务器存在严重漏洞受到攻击

AhnLab 报告称 ,黑客正在针对旧版本的 Rejetto HTTP 文件服务器 (HFS) 注入恶意软件和加密货币挖矿程序。 然而,由于存在错误, Rejetto 警告用户不要使用 2.3 至 2.4 版本。 2.3m 版本在个人、小型团队、教育机构和测试网络文件共享的开发…

力扣 第 134 场双周赛 解题报告 | 珂学家

前言 题解 T1/T3是环形的处理技巧,这边可以double数组(更准确地讲,添加一个合适的小尾巴). T4是典题,前不久周赛刚考过,是一道结论题,也可以借助数据结构处理。 T1. 交替组 I 和T3一起讲 T2. 与敌人战斗后的最大分数…

生产调度:flowshop问题数学建模

接上一篇文章,在了解生产调度问题的背景和基本概念之后,我想先从比较基础的 flowshop和 jobshop 数学模型入手,理解实际调度过程中的问题求解思路。这一篇文章主要面向 flowshop 问题进行数学建模,对于这类比较经典的问题&#xf…

2007-2022年 国内各上市公司绿色化转型数据.(Excel文件、dta文件、参考文献、计算方法与说明)

上市公司绿色化转型数据为研究者提供了评估企业在生态文明建设、循环经济和绿色管理方面表现的重要视角。以下是对中国各上市公司绿色化转型数据的介绍: 数据简介 定义:上市公司绿色化转型是指企业在发展模式上向可持续发展转变,实现资源节…

成人高考报名条件及收费标准详解

成人高考报名条件及收费标准详解 您想通过成人高考改变自己的命运,但不知道报名条件和收费标准?本文将为您详细介绍成人高考报名条件和收费标准,并为您提供专业的成人教育服务。 深圳成人高考www.shenzhixun.com 成人高考报名条件 成人高考…

CH11_JS的多重循环

第11章:Javascript的多重循环 本章目标 掌握二重循环的使用 掌握二重循环的控制语句的使用 课程回顾 循环控制有那几种方式 讲解内容 1. 回顾练习 需求说明 某次程序大赛,AI2101班有4名学员参加,学员的成绩由用户输入,计算…

那你真的了解方法调用吗?

方法调用是不是很熟悉?那你真的了解它吗?今天就让我们来盘一下它。 首先大家要明确一个概念,此处的方法调用并不是方法中的代码被执行,而是要确定被调用方法的版本,即最终会调用哪一个方法。 之前我们了解到&#xff…

Android C++系列:Linux Socket编程(三)CS模型示例

1. TCP通信 下图是基于TCP协议的客户端/服务器程序的一般流程: 服务器调用socket()、bind()、listen()完成初始化后,调用accept()阻塞等待,处于 监听端口的状态,客户端调用socket()初始化后,调用connect()发出SYN段并阻塞等待服 务器应答,服务器应答一个SYN-ACK段,客户…

Blazor SPA 的本质是什么以及服务器端渲染如何与 Blazor 的新 Web 应用程序配合使用

Blazor 通常被称为单页应用程序 (SPA) 框架。当我第一次开始使用 Blazor 时,我对 SPA 的含义、组件如何为 SPA 架构做出贡献以及所有这些如何与交互性联系在一起感到困惑。 今天,我将解答大家可能关心的三个问题: 什么是 SPA?了…

【高中数学/基本不等式】当x是正实数时,求函数f(x)=x/(1+x^2)的最大值?

【问题】 当x是正实数时&#xff0c;求函数f(x)x/(1x^2)的最大值&#xff1f; 【解答】 解&#xff1a; f(x)x/(1x^2)1/(x1/x))<1/2倍根号下(x*1/x)1/2 所以函数在[0,∞)的区域最大值为0.5 【函数图像】 f(x)x/(1x^2)是奇函数&#xff0c;没有断点&#xff0c;是可以…

文心一言最常用的20条指令及指令说明,含增强指令

下面是20条文心一言的指令及其说明&#xff0c;每条指令尽量简洁明了&#xff0c;以便在有限的字数内提供尽可能多的信息。以下是这些指令及其说明&#xff1a; 1. 查询天气 指令&#xff1a;今天北京的天气怎么样&#xff1f;说明&#xff1a;此指令用于查询特定城市&#xf…

HarmonyOS Next系列之Echarts图表组件(折线图、柱状图、饼图等)实现(八)

系列文章目录 HarmonyOS Next 系列之省市区弹窗选择器实现&#xff08;一&#xff09; HarmonyOS Next 系列之验证码输入组件实现&#xff08;二&#xff09; HarmonyOS Next 系列之底部标签栏TabBar实现&#xff08;三&#xff09; HarmonyOS Next 系列之HTTP请求封装和Token…

Redis高级篇之最佳实践

Redis高级篇之最佳实践 今日内容 Redis键值设计批处理优化服务端优化集群最佳实践 1、Redis键值设计 1.1、优雅的key结构 Redis的Key虽然可以自定义&#xff0c;但最好遵循下面的几个最佳实践约定&#xff1a; 遵循基本格式&#xff1a;[业务名称]:[数据名]:[id]长度不超过…

PCIe 规范核心知识线介绍

0&#xff0c;总体Topology x86 处理器系统中 PCIe的拓扑结构&#xff1a; PCIe Switch的总体结构 1&#xff0c;PCIe 枚举 BIOS 负责枚举与分派配置设备的 BusID[7:0] : DeviceID[4:0] : FunctionID[2:0]; cpu先识别 Host-PCI-Bridge&#xff0c;其下是Bus0&#xff1b; 在…

树莓派学习笔记18:IIC驱动_PCA9685(16路舵机驱动模块)误发

今日继续学习树莓派4B 4G:(Raspberry Pi,简称RPi或RasPi) 本人所用树莓派4B 装载的系统与版本如下: 版本可用命令 (lsb_release -a) 查询: ​ Python 版本3.7.3: ​ IIC驱动_PCA9685(16路舵机驱动模块) 文章提供测试代码讲解,整体代码贴出、测试效果图 目录 开启树莓…