什么是检索增强生成(Retrieval Augmented Generation)?RAG 架构如何实现?

检索增强生成(Retrieval Augmented Generation)时代

在不断发展的生成人工智能世界中,检索增强生成 (RAG) 标志着一项重大进步,它将检索模型的准确性与生成模型的创造性相结合,达到了准确&创新的更高层级。

这种创新架构可以同时达到:精确信息检索,上下文理解,以及响应式回应,三重效果。 RAG 利用广泛的数据库和大型语言模型 (LLM) 的动态功能来生成富有洞察力和准确性的结果。

RAG 架构由两个主要组件组成:数据准备(蓝色)和 RAG 系统本身(绿色)。数据准备涉及连接到原始数据源、使用上下文信息标注数据、将文档分块为更小的单元,以及将这些模块转换为向量嵌入。分块可以提高一致性,而嵌入可以为 RAG 生成器提供更好的语义匹配和相关知识检索。

RAG 系统接受用户提示,在嵌入中搜索相关段落,并将其发送到 LLM(大型语言模型)以生成响应。人类的参与在数据准备和 RAG 系统中都至关重要,在数据准备中,领域专业知识和上下文被添加到原始数据中,而在 RAG 系统中,人类增强了矢量检索的相关性并提供提示/响应质量保证。

RAG 的亮点:最佳用例

RAG 架构的多功能性极强,可满足从对话式 AI 和内容创建到搜索引擎中复杂查询解析的一系列应用。其独特的能力将生成响应基于实际的检索数据,使其特别适合:

  • 客服系统:为客户询问提供准确、上下文相关的答案。
  • 教育平台:基于广泛的知识库提供详细的解释或答案。
  • 研究和分析工具:将复杂的信息提炼成全面的摘要。
  • 内容生成:在各个领域制作丰富、信息丰富且相关的内容。

如何创建高质量的RAG模型

RAG 的功效取决于其架构中的细致决策:

  • 数据准备:选择数据并将其分成连贯的单元,而不丢失上下文本质。澳鹏在数据注释和分块(图中的步骤 B 和 C)方面的专业知识可确保数据在上下文中保持完整并准确标记。
  • 嵌入技术:选择正确的方法将文本块转换为嵌入,以实现高效检索。
  • 相关性和排名:用于确定检索到的数据与用户提示及其后续排名的相关性的算法。澳鹏的人机交互方法增强了检索数据的相关性和排名(图中的步骤 3)。

质量第一

确保 RAG 输出的最高质量和准确性需要考虑以下几个因素:

  • 全面的数据注释:让人类准确地标记和分类数据。澳鹏的数据注释服务(图中的步骤 B)确保精确且与上下文相关的数据注释。
  • 减少偏差:积极寻找并消除数据集和模型响应中的偏差。
  • 持续评估:根据各种提示定期测试模型,以确保一致性和可靠性。澳鹏的质量保证流程有助于长期保持模型的性能。

RAG评估

让我们深入研究 RAG 不同阶段使用的核心自动评估指标,涵盖检索和生成阶段。

检索指标

  • 上下文召回:该指标衡量检索组件成功返回的相关块的百分比。  
  • 上下文精度:上下文精度评估将检索到的块分类为相关的准确性。

生成指标

生成阶段指标侧重于输出的忠实度和与提示的相关性,确保生成的文本遵循事实的正确性和相关性。

  • 忠实度:测量生成的与检索到的相关块的事实正确性背离的句子/短语的数量。
  • 相关性:该指标评估生成的与用户查询不相关的句子/短语的数量,确保系统的响应保持重点和主题。

自动评估指标:监控 RAG 的精度和相关性

虽然人为参与对于提高 RAG 系统的质量和完整性是不可或缺的,但自动评估指标在持续监控这些架构的性能方面发挥着至关重要的作用。这些指标使 AI 团队能够快速识别需要改进的领域,确保 RAG 在实时应用中保持有效和高效。

人工评估

这些自动评估指标是人工智能开发工具包中的重要工具,可以定量衡量 RAG 系统的性能。然而,当辅以细致入微的人类评估时,它们的功能最佳,可以捕捉自动化系统可能错过的语言和上下文的微妙之处。在整个 RAG 架构中,人为因素至关重要:

  • 数据注释和分块:确保数据块上下文完整且注释精确。澳鹏的数据注释服务(图中的步骤 B 和 C)在这方面表现出色。
  • 模型训练和调整:根据细致入微的理解和反馈来完善模型。澳鹏在模型训练和调优方面的专业知识可确保最佳性能和模型漂移监控。
  • 质量控制:监督模型输出的准确性、有用性和安全性。澳鹏的质量保证流程(图中的提示/响应质量保证 – 步骤 1 和 5)保持最高标准。
  • 确保上下文完整性:解释目前人工智能无法掌握的细微差别和上下文。澳鹏的人机交互方法(提示/响应图中的步骤 1、3 和 5)可确保上下文完整性。
  • 防止错误:持续的人工监督有助于实时识别和纠正错误或不准确之处。

通过集成自动评估指标和人类判断,RAG 系统可以实现高度的准确性、相关性和可靠性,这对于实际应用至关重要。

与澳鹏合作,获得高质量RAG辅助

利用澳鹏在数据标注、模型训练和质量评估方面的丰富经验,组织可以释放 RAG 架构的全部潜力。澳鹏的定制服务涵盖 RAG 旅程的每一步,从数据准备,和模块改进,到优化模型响应。与澳鹏合作,确保您的人工智能计划不仅具有创新性,并且同时保证准确性和相关性。

结论

有效的人工智能系统需要在整个人工智能生命周期中进行人机交互。部署 AI 模型的一种有效方法是通过 RAG 架构。 RAG 系统允许 AI 团队通过更深入的领域专业知识来增强基础模型的语言能力。为 RAG 准备的文档和数据有助于通用基础模型更多地了解其从未接受过训练的领域。 澳鹏将以上述所有方式提供定制服务,在 RAG 流程的每个阶段(从数据准备到模型评估和完善)提供关键的人类专业知识和专家监督。如有需要,请联系我们,我们的专家会为您的RAG计划提供全面支持。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/13448.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Nginx 7层负载均衡的搭建

目录 负载均衡的理解 修改配置文件 测试 1. 选择在 DMZ 区测试,使用 db 服务器进行测试 2.选择在外网测试负载均衡效果 负载均衡的理解 负载均衡:load balancer,简称LB Nginx 既是一个 web 服务器软件,也是一个负载均衡软件&a…

【NLP】文本分类

n-gram 的局限性 n-gram 只能对于填空这样的通顺性问题做出推测,但是没有办法完全解决句子的语义问题,从而无法实现文本的分类 文本的分类,就是将文本在语义的理解下划分到特定的主题下 手工规则 如一些垃圾过滤系统,需要人工制…

企业或者个体户为什么会经营异常?

在复杂多变的市场经济环境中,无论是企业还是个体工商户,都可能遭遇经营异常的情况。及时识别这些预警信号并采取有效措施,对于避免潜在风险、保持健康发展至关重要。本文将深入探讨企业与个体户常见的经营异常类型、识别方法以及应对策略&…

有趣的css - 文字隐身术效果

大家好,我是 Just,这里是「设计师工作日常」,今天分享的是利用动画属性来模拟文字隐身消失的效果。 《有趣的css》系列最新实例通过公众号「设计师工作日常」发布。 目录 整体效果核心代码html 代码css 部分代码 完整代码如下html 页面css 样…

php解密工具

在线编辑器 复制如下代码到空白地区: <?php namespace FatSmallTools; class NavicatPassword {protected $version 0;protected $aesKey libcckeylibcckey;protected $aesIv libcciv libcciv ;protected $blowString 3DC5CA39;protected $blowKey null;protected $b…

MCULCD屏驱动方法

MCULCD屏驱动方式 一、LCD简介二、直接采用8080时序驱动LCD三、采用FSMC&#xff08;模拟8080时序&#xff09;驱动LCD1&#xff0c;FSMC简介2&#xff0c;结构框图3&#xff0c;FMC 驱动 LCD 显示配置步骤 一、LCD简介 Liquid Crystal Display&#xff0c;即液晶显示器&#…

GPT-4o 的商业化落地使用场景

今天我想和大家聊一聊 OpenAI 的 GPT-4o。这款令人惊叹的语言模型不仅在技术层面上令人钦佩&#xff0c;也在多种实际应用中展现了巨大的商业潜力。 GPT-4o 是什么&#xff1f; 首先&#xff0c;简单介绍一下 GPT-4o。它是由 OpenAI 开发的一种高级自然语言处理模型&#xff0…

【全开源】keep健身小程序FastAdmin+ThinkPHP+UniApp

基于FastAdminUniApp&#xff08;目前仅支持微信小程序&#xff09;开发的健身相关行业小程序&#xff0c;程序适用于健身房、瑜伽馆、游泳馆、篮球馆等健身培训场所。平台拥有课程售卖、课*程*预*约、多门店管理、私教预约、教练端、会*员*卡办理、在线*商*城、分*销*模块、页…

每日一练 2024.5.16(补2024.5.12)

题目&#xff1a; 给你 n 个项目&#xff0c;编号从 0 到 n - 1 。同时给你一个整数数组 milestones &#xff0c;其中每个 milestones[i] 表示第 i 个项目中的阶段任务数量。 你可以按下面两个规则参与项目中的工作&#xff1a; 每周&#xff0c;你将会完成 某一个 项目中的…

堆的概念及结构

目录 堆的性质&#xff1a; 堆的实现 堆向下调整算法 堆的创建 堆的插入 堆的删除 堆的应用 堆排序 对比冒泡的优势&#xff1a; 代码 头文件 源文件 如果有一个关键码的集合K { &#xff0c; &#xff0c; &#xff0c;…&#xff0c; }&#xff0c;把它的所有元…

JUnit5测试用例

1.用Test注解表示为测试方法 2.使用DisplayName定义别名 3.使用Assertions类的断言方法 使用断言&#xff0c;可以判断方法的实际执行结果和预期结果是否一致 assertEqualsassertTureassertNotNullassertAllassertThrows 下图是预期与实际不同时报错图 4.使用BeforeEach注解&…

SQL操作面试题

1、NULL和 的区别 || MySQL中为什么不用NULL作为默认值 聚合函数&#xff0c;比如SUM、AVG等会忽略NULL&#xff0c;会造成数据的一个分析误差。只能通过COUNT&#xff08;*&#xff09; NULL的话只能通过ISNULL和ISNotNULL去进行判断&#xff0c;而 可以用<,>,等等…

怎么转换视频格式到mp4?格式转换,4种简单方法

转换视频格式到MP4可以使视频在各种设备上播放更加方便&#xff0c;而MP4格式的优势在于其高质量的视频和相对较小的文件大小。怎么转换视频格式到mp4&#xff1f;在本文中&#xff0c;我们将介绍四种简单有效的方法&#xff0c;帮助您快速将视频格式转换为MP4。 无论您是初学…

花花省V6淘宝客APP社交电商自营商城聚合优惠券系统功能介绍

花花省V6淘宝客APP的社交电商自营商城聚合优惠券系统具有多种功能&#xff0c;以满足用户的不同需求。以下是其主要功能的介绍&#xff1a; 首页功能&#xff1a;首页设计包含广告位、淘口令识别、微信登录、淘宝登录等。此外&#xff0c;还有淘宝返佣、拼多多返佣、京东返佣、…

软考:数据流图案例

阅读下列说明和图&#xff0c;回答问题1至问题4。 一、说明 某医院欲开发病人监控系统。该系统通过各种设备监控病人的生命体征&#xff0c;并在生命体征异常时向医生和护理人员报警。该系统的主要功能如下&#xff1a; &#xff08;1&#xff09;本地监控&#xff1a;定期获…

剑指Offer打卡day34——AcWing 66. 两个链表的第一个公共结点

AcWing 66. 两个链表的第一个公共结点 暴力做法&#xff0c;两层for循环 /*** Definition for singly-linked list.* public class ListNode {* int val;* ListNode next;* ListNode(int x) {* val x;* next null;* }* }*/ class Solutio…

Linux ps命令详细参数

一、简介 在Linux系统中&#xff0c;ps(Process Status的缩写)命令常常用来用来列出系统中当前运行的进程。ps命令列出的是当前那些进程的快照&#xff0c;就是执行ps命令的那个时刻的那些进程&#xff0c;如果想要动态的显示进程信息&#xff0c;就可以使用top命令。要对进程…

Synchronize 底层实现原理

1 、加锁实现原理 public class SynchronizedTest {public void get(){synchronized (this){ // 这个是同步代码块System.out.println("你好呀");}}public synchronized void f(){ //这个是同步方法System.out.println("Hello world");}public s…

DC-DC直流升压线性可调电源模块电压控制输出0-50V/0-80V/0-100V/0-200V/0-250V/0-300V/0-500V/0-1000V

特点 效率高达 75%以上1*2英寸标准封装单电压输出可直接焊在PCB 上工作温度: -40℃~75℃阻燃封装&#xff0c;满足UL94-V0 要求温度特性好电压控制输出,输出电压随控制电压线性变化 应用 GRB 系列模块电源是一种DC-DC升压变换器。该模块电源的输入电压分为&#xff1a;4.5~9V、…