基于网络搜索的长篇问答能力优化：FoRAG

基于网络搜索的长篇问答能力优化：FoRAG

web/2025/4/26 22:02:58/文章来源:https://blog.csdn.net/weixin_43145427/article/details/139890739

检索增强生成（RAG，Retrieval Augmented Generation）可以利用搜索引擎检索技术来提升长篇问答质量，因而在 QA 任务中广受欢迎。尽管有多种开源方法和网络增强的商业系统如 Bing Chat 出现，但生成长篇答案的事实性和逻辑清晰度两大难题仍未解决。FoRAG试图通过下面两个关键点来解决这些挑战。

首先提出了一种提纲增强的生成器，确保多方面答案生成逻辑清晰。

接着，开发了一种基于双重细粒度 RLHF 框架的事实性优化方法，该框架在不同粒度级别上进行自动评估和奖励建模，提高答案在事实性方面的表现。
在这里插入图片描述

1 提纲增强生成器

通过网络搜索引擎检索到相关的信息，在利用这些信息生成长答案之前，提纲增强生成器首先草拟一个组织模式和纲要，以生成逻辑更加清晰的回复。这样可以确保生成的答案能够涵盖问题的多个方面，并且逻辑结构清晰。

2 双重细粒度RLHF框架

引入了细粒度设计的自动评估和奖励建模两个核心步骤，自动评估的粒度包括全局级(Holistic)、句子级(Sentence-level)和子声明级(Subclaim-level)，奖励建模的粒度包括句子级(Sentence-level)和Token级(Token-level)。这种方法不仅减少了人工评估的高成本，允许在不同粒度层次上灵活优化事实性，进而在细粒度上提供了更密集的训练信号，提高了RLHF的可靠性。

3 结语

应用FoRAG方法优调 Llama2-7B-chat 后，得到的 FoRAG-L-7B 模型在连贯性、有用性和事实性三个指标上超越了 WebGPT-175B，且参数数量仅为后者的 1/24。轮廓增强生成器显著提高了答案的连贯性和有用性，而双重细粒度RLHF框架则显著提高了答案在事实性方面的表现。

PS: 欢迎大家扫码关注公众号^_，我们一起在AI的世界中探索前行，期待共同进步！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/web/32856.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

ruoyi添加自己的菜单

ruoyi添加自己的菜单

先把自己自定义的view填写好在菜单管理模块因为我已经新增过，所以就看看我填的啥就行了我发现一个问题，路由地址可以填index2或者scooldemo/index2都可以（这个包含了文件夹路径），反正组件路径一定要填对就可以了。 …

阅读更多...

【UML用户指南】-21-对基本行为建模-活动图

【UML用户指南】-21-对基本行为建模-活动图

目录 1、概念 2、组成结构 2.1、动作 2.2、活动节点 2.3、控制流 2.4、分支 2.5、分岔和汇合 2.6、泳道 2.7、对象流 2.8、扩展区域 3、一般用法 3.1、对工作流建模 3.2、对操作建模一个活动图从本质上说是一个流程图，展现从活动到活动的控制流活动图…

阅读更多...

六套Matlab人脸识别源码可运行 (含PCA Adaboost DLDA算法等）

六套Matlab人脸识别源码可运行 (含PCA Adaboost DLDA算法等）

以PCA人脸识别为例：随着社会发展与科技进步，人们对生活和工作环境有了更高的要求。大家对外界的需求不再局限于刚性的满足，追求目标逐渐上升到对家居和办公智能化、自动化的台阶上。与此同时，人脸识别技术越来越广泛的应用于某些重要场所的身份检测和确认环节[1]。在公共…

阅读更多...

MySQL命名规范(自用)

MySQL命名规范(自用)

MtySQL命名规范基本通用规范 1.【推荐】关键字必须大写所有关键字必须大写，如：INSERT、UPDATE、DELETE、SELECT及其子句，IF……ELSE、CASE、DECLARE等 2.【强制】字段和建表必须写备注 COMMENT写备注 3.【强制】字母数字下划线采用26个英…

阅读更多...

国产MCU芯片（2）：东软MCU概览及触控MCU

国产MCU芯片（2）：东软MCU概览及触控MCU

前言：国产芯片替代的一个主战场之一就是mcu，可以说很多国内芯片设计公司都打算或者已经在设计甚至有了一款或多款的量产产品了，这也是国际大背景决定的。过去的家电市场、过去的汽车电子市场，的确国产芯片的身影不是很常见，如今不同了，很多fabless投身这个行业，一种是…

阅读更多...

OpenGL3.3_C++_Windows(18)

OpenGL3.3_C++_Windows(18)

接口块： glsl彼此传输数据，通过in / out，当更多的变量，涉及数组和结构体接口块(Interface Block)类似struct，in / out 块名{……}实例名 Uniform缓冲对象： 首先理解uniform Object：负责向gl…

阅读更多...

程序人生：关于RHCE红帽认证这件事

程序人生：关于RHCE红帽认证这件事

花了两个月备考红帽，最终终于双满分通过。关于考试 RHCE红帽认证总共需要考两门：RHCSA、RHCE。 RHCSA主要是考察基本的Linux操作：用户、权限、空间扩容、yum、容器等内容。 RHCE主要是考察ansible playbook 代码的开发。通过考试没有别…

阅读更多...

【内存管理】页面分配机制

【内存管理】页面分配机制

前言 Linux内核中是如何分配出页面的，如果我们站在CPU的角度去看这个问题，CPU能分配出来的页面是以物理页面为单位的。也就是我们计算机中常讲的分页机制。本文就看下Linux内核是如何管理，释放和分配这些物理页面的。伙伴算法伙伴系统的…

阅读更多...

代码随想录训练营Day32

代码随想录训练营Day32

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、买卖股票的最佳时机2二、跳跃游戏三、跳跃游戏2四、K次取反后最大化的数组和前言今天是跟着代码随想录刷题的第32天，主要是学了买卖股票的最…

阅读更多...

设计模式4-模版方法

设计模式4-模版方法

设计模式重构获得模式重构的关键技法1. 静态转动态2. 早绑定转晚绑定3. 继承转组合4. 编译时依赖转运行时依赖5. 紧耦合转松耦合组件协助动机模式定义结构要点总结。例子示例解释： 重构获得模式设计模式的目的是应对变化，提高复用设计模式的要点…

阅读更多...

[SAP ABAP] 排序内表数据

[SAP ABAP] 排序内表数据

语法格式整表排序 SORT <itab> [ASCENDING|DESCENDING]. 按指定字段排序 SORT <itab> BY f1 [ASCENDING|DESCENDING] f2 [ASCENDING|DESCENDING] ... fn [ASCENDING|DESCENDING].<itab>：代表内表不指定排序方式则默认升序排序示例1 结果显…

阅读更多...

.hmallox勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复

.hmallox勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复

导言： 在当今数字化时代，勒索病毒已经成为网络安全的一大威胁，其中包括了最近出现的.hmallox勒索病毒。这类恶意软件不仅能够对计算机系统进行加密，还会要求用户支付赎金以换取解密密钥，给个人用户和企业带来了严重的…

阅读更多...

Android SurfaceFlinger——HWC Adapter初始化（五）

Android SurfaceFlinger——HWC Adapter初始化（五）

上一篇文章对 HWC 硬件加载流程进行了分析，在加载完成后开始创建 HAL 实例时，首先需要对 hwc2_device_t 的适配器进行初始化，这里我们主要分析 HWC Adapter 的创建流程。一、创建HWC Adapter 在创建 HAL 实例之前，我们先来看一下 HWC Adapter 的创建。 1、createHalWith…

阅读更多...

C++的特殊类设计饥饿汉模式

C++的特殊类设计饥饿汉模式

目录特殊类设计设计一个不能被拷贝的类设计一个只能在堆上创建对象的类设计一个只能在栈上创建对象的类设计一个不能继承的类设计模式单例模式饿汉模式饥汉模式特殊类设计设计一个不能被拷贝的类 C98的设计方式：将该类的拷贝构造和赋值运算符…

阅读更多...

一小时搞定Git（含盖IDEA使用）

一小时搞定Git（含盖IDEA使用）

文章目录 1. git基本概念1.1版本控制1.1.1 版本控制软件 2. 命令的使用2.1 Linux命令2.2 git基础指令2.2.1 设置用户2.2.2 初始化本地仓库2.2.3 查看本地仓库状态2.2.4 添加暂存区域2.2.5 提交本地库2.2.6 切换版本 2.3 分支操作2.3.1 分支基本操作2.3.2 合并操作2.3.4 分支开发…

阅读更多...

基于STM32的智能家居安防系统

基于STM32的智能家居安防系统

目录引言环境准备智能家居安防系统基础代码实现：实现智能家居安防系统 4.1 数据采集模块4.2 数据处理与分析4.3 控制系统实现4.4 用户界面与数据可视化应用场景：智能家居安防管理与优化问题解决方案与优化收尾与总结 1. 引言智能家居安防系统通过使…

阅读更多...

195.回溯算法：分割回文串（力扣）

195.回溯算法：分割回文串（力扣）

代码解决 class Solution { public:vector<string> res; // 当前路径，用于存储一个可能的回文分割结果vector<vector<string>> result; // 存储所有可能的回文分割结果// 判断子串 s[left:right] 是否是回文bool isPalindrome(const string& …

阅读更多...

Linux应用系统快速部署：docker快速部署linux应用程序

Linux应用系统快速部署：docker快速部署linux应用程序

目录一、背景 （一）引入docker的起因 （二）docker介绍 （三）Docker部署的优势 1、轻量级和可移植性 2、快速部署和扩展 3、一致性 4、版本控制 5、安全性 6、资源隔离 7、简化团队协作 8、多容器…

阅读更多...

VMware虚拟机三种网络模式设置 - Bridged（桥接模式）

VMware虚拟机三种网络模式设置 - Bridged（桥接模式）

一、前言由于linux目前很热门，越来越多的人在学习linux，但是买一台服务放家里来学习，实在是很浪费。那么如何解决这个问题？虚拟机软件是很好的选择，常用的虚拟机软件有vmware workstations和virtual box等。在使用虚…

阅读更多...

Seaborn：数据可视化的强大工具

Seaborn：数据可视化的强大工具

文章目录引言Seaborn的原理1. 底层结构2. 数据集成3. 图形类型 Seaborn的使用1. 安装与导入2. 数据加载与探索3. 绘制图形分布图关系图分类图 4. 图形定制5. 导出图形结论引言在数据分析和科学计算领域，数据可视化是一个至关重要的步骤。它能够帮助我们更直观地…

阅读更多...

最新文章