RAG检索增强生成(1)-大语言模型的外挂数据库

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
Lewis P, Perez E, Piktus A, et al. Retrieval-augmented generation for knowledge-intensive nlp tasks[J]. Advances in Neural Information Processing Systems, 2020, 33: 9459-9474.

RAG结合了信息检索和文本生成两种方法,旨在突破传统问答系统的局限。通过将外部数据检索的相关信息输入大语言模型,大语言模型能够基于这些信息生成回答,进而增强答案生成的能力。RAG能够处理更广泛、更复杂的问题。使用RAG后可以有效解决大语言模型细分领域的幻觉和知识过期问题。

1、RAG的和核心组件

(1)信息检索
(2)文本生成

2、RAG工作流程

(1)最基础的RAG
在这里插入图片描述

(2)增加预处理查询的RAG
在这里插入图片描述

(3)带有聊天历史的RAG
在这里插入图片描述

(4)增加自动排序的RAG
在这里插入图片描述

3、RAG在Chatbot中的应用

(1)提高回应的相关性和准确性
(2)处理复杂查询
(3)增强个性化和上下文理解能力

4、RAG面临的挑战

(1)检索与生成的协同工作:检索到的内容与生成的内容能否紧密结合是一个关键问题。
(2)计算效率:执行检索和生成着两个步骤可能导致系统响应延迟,使整个系统的运行速度变慢,因此对时间敏感的应用而言,RAG可能不太适用。
(3)数据噪声:外部检索的数据可能带有噪声,这会影响生成内容的准确性。

5、RAG与Fine-tuning

RAG和Fine-tuning都是强大的工具,可以增强大语言模型应用的性能,但它们针对的是优化过程的不同方面。两者是截然不同的两种技术,不是替代关系,而是关联关系,在不同场景下应该选择不同的方案。

对比项RAGFine-tuning
需要获取外部数据吗yesno
需要改变模型行为模式吗noyes
幻觉有最小化吗yesno
训练数据充足吗noyes
数据动态性高吗yesno
数据可解释度如何yesno

参考

  • Chatbot从0到1(第2版):对话式交互实践指南
  • 浅谈RAG的十大挑战

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/23654.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python中B.py调用A.py中所有方法,该怎么导入呢

函数调用 python中B.py调用A.py中所有方法,该怎么导入呢1. 确保A.py和B.py在同一目录2. 在A.py中定义一些方法3. 在B.py中导入A.py并调用其方法4. 运行B.py详细解释额外提示 2 采用from A.py import *是否可行1. 确保A.py和B.py在同一目录2. 在A.py中定义一些方法3.…

Java数据结构与算法(最长回文子串动态规划)

前言 动态规划主要用于解决具有重叠子问题和最优子结构性质的问题。它通过将问题分解为子问题来解决复杂问题,每个子问题仅解决一次,并将其结果存储,以供后续使用,从而避免了重复计算。 动态规划的基本思想 分解问题&#xff1…

C++入门 ros服务通信

一、 开发环境 ubuntu20.04 ros版本noetic 参考视频 https://www.bilibili.com/video/BV1Ci4y1L7ZZ/?p52&spm_id_from333.1007.top_right_bar_window_history.content.click&vd_source4cd1b6f268e2a29a11bea5d2568836ee 二、 编写srv文件 在功能包下面创建srv文件夹…

【SpringBoot + Vue 尚庭公寓实战】项目初始化准备(二)

尚庭公寓SpringBoot Vue 项目实战】项目初始化准备(二) 文章目录 尚庭公寓SpringBoot Vue 项目实战】项目初始化准备(二)1、导入数据库2、创建工程3、项目初始配置3.1、SpringBoot依赖配置3.2、创建application.yml文件3.3、创建…

【Linux取经路】网络套接字编程——TCP篇

文章目录 前言十、Tcp Server 端代码10.1 socket、bind10.1 listen——监听一个套接字10.2 accept——获取一个新连接10.3 read——从套接字中读取数据10.4 write——向套接字中进行写入10.5 Tcp Service 端完整代码(单进程版)10.6 Tcp Server 端代码&am…

MySQL 8.0中查询缓存的废弃与原因分析

MySQL 8.0中查询缓存(Query Cache)的废弃与原因分析 引言 尽管MySQL的查询缓存(Query Cache)最初设计目的是为了提升性能,但因其存在严重的可扩展性问题和易成为系统瓶颈,MySQL在8.0版本中正式移除了这一…

这个世界,对于心态好的人,就是个大游乐场,越刺激越好玩。对于胆小鬼,那就是地狱,随时随地都会受伤

心态决定你的世界:游乐场还是地狱 在这个充满变数的世界里,我们的心态决定了我们看待世界的方式。对于心态积极的人来说,世界就像一个巨大的游乐场,每一个挑战都是一个新的游戏,每一个刺激都是乐趣的一部分。而对于那…

解决跨域的几种方法

解决跨域的方法主要有以下几种: 1.CORS(跨域资源共享) CORS是一种W3C规范,它定义了一种浏览器和服务器交互的方式来确定是否允许跨源请求。 服务器通过设置响应头Access-Control-Allow-Origin来允许或拒绝跨域请求。例如&#xf…

python-数据分析-缺失值-函数-数据类型

1 常用排序和统计函数 1 排序 sort_values() # by 指定排序的字段 可以传入列表,做多字段排序, 比如下面的例子, 当价格相同的时候, 价格相同的数据再按面积排序 # ascending 也可以传入列表,长度更by 的列表相同&…

[笔试训练](三十四)100:[NOIP2008]ISBN号码101:kotori和迷宫102:矩阵最长递增路径

目录 100:[NOIP2008]ISBN号码 101:kotori和迷宫 102:矩阵最长递增路径 100:[NOIP2008]ISBN号码 题目链接:[NOIP2008]ISBN号码_牛客题霸_牛客网 (nowcoder.com) 题目&#xff1a; 题解: 简单模拟 #include <iostream> #include<string> using namespace std; str…

大数据技术Hbase列数据库——topic2

目录 启动Hadoop启动HbaseHbase常用Shell命令基本命令关于表的操作增删改查询 启动Hadoop 1.到Hadoop安装目录下输入命令 sbin/start-all.sh[rootlocalhost hadoop-2.7.1]# sbin/start-all.sh This script is Deprecated. Instead use start-dfs.sh and start-yarn.sh Starti…

Maven导入jar包到本地仓库

导入本地jar包 <dependency><groupId>com.xxl</groupId>-----------------(参数二)<artifactId>xxl-sso-client</artifactId>-----------(参数三)<version>1.1.2</version>-----------------------(参数四) </dependency>用m…

5-Django项目--分页与搜索(资产页面)

目录 views/asset_data.py asset_data/asset_data.html 搜索与分页笔记: 搜索 整数搜索 字符串搜索 分页 views/asset_data.py # -*- coding:utf-8 -*- from django.shortcuts import render, redirect, HttpResponse from django.utils.safestring import mark_safe f…

MySQL查询数据库响应时长的方法

要查询MySQL数据库的响应时长&#xff0c;通常我们需要测量查询执行的时间。MySQL本身并不直接提供一个查询来显示每个查询的响应时长历史记录&#xff0c;但我们可以使用MySQL的内置函数和工具来测量和记录查询的执行时间。 以下是一些方法&#xff0c;我们可以用来测量MySQL…

电子元器件采购商城的售后服务保障

电子元器件采购商城的售后服务保障是用户在采购电子元器件时的重要考量因素之一。以下是常见的售后服务保障内容&#xff1a; 退换货政策&#xff1a; 质量问题退换货&#xff1a;如果用户收到的元器件存在质量问题&#xff0c;通常可以在一定时间内申请退换货。无理由退换货&a…

Laravel PHP 给富文本内容的图片设置最大宽度(自适应)

Laravel & PHP $data->富文本字段 preg_replace(/<img\s([^>])>/i, <img $1 style"max-width: 100%;">, $data->富文本字段); Js解决 小程序富文本图片宽度自适应-CSDN博客

数据分析第一天(pandas简单的对快餐店数据进行操作获得想要的信息,使用apply,groupby)

前言 数据保存在 https://github.com/harkbox/DataAnalyseStudy 数据名称&#xff1a;快餐数据.tsv &#xff08;tsv是用\t作为字符分隔符的文件格式&#xff1b;csv是逗号&#xff09; 因此可以用pandas的read_csv函数读取数据 1.读取数据 import pandas as pd import matp…

Kotlin 内联值类(@JvmInline value class)

文章目录 定义相等判定 我并不知道它的名字是不是这样翻译&#xff0c;以前是叫内联类&#xff08;inline class&#xff09;&#xff0c;我感觉现在这样叫有点拗口&#xff0c;或者是“值内联类”&#xff1f;如果有错误&#xff0c;麻烦您花点时间告诉我一声&#xff0c;十分…

Hutool工具网络文件下载与文件压缩

1.下载文件 HttpUtil.downloadFile(url,dest) url 为网络文件路径 dest 为下载后文件 2.文件压缩 ZipUtil.zip(srcPath,zip path)

PCA算法

PCA算法 原创 小王搬运工 时序课堂 2024-06-06 19:16 四川 1. PCA算法 PCA算法称为主成分分析&#xff0c;是一种无监督学习算法&#xff0c;主要用于数据降维和特征提取。 PCA是一种数据降维模型&#xff0c;它的基本模型是通过线性变换将数据转换到新的空间&#xff0c;这…