Retrieval-Augmented Generation，检索增强生成流程

Retrieval-Augmented Generation，检索增强生成流程

bicheng/2025/2/8 14:53:56/文章来源:https://blog.csdn.net/weixin_41544125/article/details/145503517

RAG流程

用户输入接收
- 系统接收用户输入的查询问题或文本内容，例如“李白有哪些著名的作品？”用户输入可以通过自然语言处理（NLP）模型的输入端口或用户交互界面（如聊天应用、搜索引擎输入框等）接收。
查询向量库
- 将用户输入转换成向量，并在向量库中进行相似性搜索。向量库中存储了大量文本的向量表示，这些文本可以是书籍、文章、知识库条目等。例如，向量库中有某个文档表示李白的著名作品，其向量与用户输入的向量相似度很高，系统就会返回这个文档。
调用大模型处理结果
- 将向量库返回的相关文档信息与用户原始查询一起输入到大语言模型中。大模型会将检索结果与用户问题结合，生成连贯的回答。例如，对于用户查询“李白有哪些著名的作品？”大模型会融合检索到的李白作品的文档内容，生成类似“李白的著名作品有《将进酒》《静夜思》等”的回答。
输出应答给用户
- 大模型生成的回答通过输出端口返回给用户。在聊天应用的界面中，用户会在屏幕上看到答案，例如李白著名作品的列表。

RAG的优势

结合检索系统和生成模型：能利用最新信息，提高答案质量，具有更好的可解释性和适应性。
无需重新训练模型：通过检索外部知识库，无需对大语言模型进行重新训练，即可提供准确、相关且实用的输出。

RAG的挑战

检索质量问题：检索结果的准确性会直接影响最终生成的回答质量。
额外计算资源需求：检索和生成过程需要额外的计算资源支持。

RAG的进一步发展

高级RAG：在数据索引、检索前和检索后都进行了额外处理，通过更精细的数据清洗、设计文档结构和添加元数据等方法提升文本的一致性、准确性和检索效率。
模块化RAG：结构更加自由灵活，引入了更多具体功能模块，例如查询搜索引擎、融合多个回答等，并将检索与微调、强化学习等技术融合。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/bicheng/70387.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【大模型】DeepSeek与chatGPT的区别以及自身的优势

【大模型】DeepSeek与chatGPT的区别以及自身的优势

目录一、前言二、核心技术对比2.1 模型架构设计2.1.1 ChatGPT的Transformer架构2.1.2 DeepSeek的混合架构 2.2 训练数据体系2.2.1 ChatGPT的数据特征2.2.2 DeepSeek的数据策略三、应用场景对比3.1 通用场景表现3.1.1 ChatGPT的强项领域3.2.2 DeepSeek的专项突破 3.3 响应效率…

阅读更多...

RabbitMQ 从入门到精通：从工作模式到集群部署实战（二）

RabbitMQ 从入门到精通：从工作模式到集群部署实战（二）

接上篇：《RabbitMQ 从入门到精通：从工作模式到集群部署实战（一）》链接文章目录 4.安装RabbitMQ Messaging Topology Operator 裸金属环境部署RabbitMQ部署单实例部署集群 4.安装RabbitMQ Messaging Topology Operator 使用 cer…

阅读更多...

低至3折，百度智能云千帆宣布全面支持DeepSeek-R1/V3调用

低至3折，百度智能云千帆宣布全面支持DeepSeek-R1/V3调用

DeepSeek-R1和 DeepSeek-V3模型已在百度智能云千帆平台上架。出品|产业家新年伊始，百度智能云又传来新动作。 2月3日百度智能云宣布， DeepSeek-R1和 DeepSeek-V3模型已在百度智能云千帆平台上架，同步推出超低价格方案，并…

阅读更多...

STM32G0B1 ADC DMA normal

STM32G0B1 ADC DMA normal

目标 ADC 5个通道，希望每1秒采集一遍； CUBEMX 配置添加代码 #define ADC1_CHANNEL_CNT 5 //采样通道数 #define ADC1_CHANNEL_FRE 3 //单个通道采样次数，用来取平均值 uint16_t adc1_val_buf[ADC1_CHANNEL_CNT*ADC1_CHANNEL_FRE]; //传递…

阅读更多...

【翻译+论文阅读】DeepSeek-R1评测：粉碎GPT-4和Claude 3.5的开源AI革命

【翻译+论文阅读】DeepSeek-R1评测：粉碎GPT-4和Claude 3.5的开源AI革命

目录一、DeepSeek-R1 势不可挡二、DeepSeek-R1 卓越之处三、DeepSeek-R1 创新设计四、DeepSeek-R1 进化之路1. 强化学习RL代替监督微调学习SFL2. Aha Moment “啊哈”时刻3. 蒸馏版本仅采用SFT4. 未来研究计划部分内容有拓展，部分内容有删除，与原文会有…

阅读更多...

OpenEuler学习笔记（二十一）：搭建企业AI客户服务例子

OpenEuler学习笔记（二十一）：搭建企业AI客户服务例子

在 OpenEuler 上搭建企业 AI 客服可以按照以下步骤进行，以下将以使用开源的 Rasa 框架作为 AI 客服核心，搭配前端界面展示为例： 1. 系统准备 1.1 安装 OpenEuler 确保你已经安装好了 OpenEuler 操作系统，可以从官方网站下载镜像…

阅读更多...

【大模型】Ubuntu下安装ollama，DeepSseek-R1:32b的本地部署和运行

【大模型】Ubuntu下安装ollama，DeepSseek-R1:32b的本地部署和运行

1 ollama 的安装与设置 ollama官网链接：https://ollama.com/ 在左上角的【Models】中展示了ollama支持的模型在正中间的【Download】中课可以下载支持平台中的安装包。其安装和模型路径配置操作流程如下： ollama的安装这里选择命令安装curl -fsSL …

阅读更多...

Idea 2024.3 使用CodeGPT插件整合Deepseek

Idea 2024.3 使用CodeGPT插件整合Deepseek

哈喽，大家好，我是浮云，最近国产大模型Deepseek异常火爆，作为程序员我也试着玩了一下，首先作为简单的使用，大家进入官网，点击开始对话即可进行简单的聊天使用，点击获取手机app即可安装…

阅读更多...

SOME/IP报文格式及发现协议详解

SOME/IP报文格式及发现协议详解

在之前的文章中，我们介绍了SOME/IP协议的几种服务接口。在本篇博客中，主要介绍some/ip协议传输的header报文格式以及SOME/IP-SD发现协议。目录流程报文格式 Message ID Length Request ID protocal version/Interface Version Message Type…

阅读更多...

【AIGC魔童】DeepSeek核心创新技术（二）：MLA

【AIGC魔童】DeepSeek核心创新技术（二）：MLA

【AIGC魔童】DeepSeek核心创新技术（二）：MLA 1. MLA框架的定义与背景2. MLA框架的技术原理（1）低秩联合压缩（2）查询的低秩压缩（3）旋转位置嵌入（RoPE&#xff09…

阅读更多...

idea——IDEA2024版本创建Sping项目无法选择Java 8

idea——IDEA2024版本创建Sping项目无法选择Java 8

目录一、背景二、解决方式（替换创建项目的源地址） 一、背景 IDEA2024创建一个springboot的项目，本地安装的是1.8，但是在使用Spring Initializr创建项目时，发现版本只有17、21、23。二、解决方式（替换创…

阅读更多...

【自然语言处理】TextRank 算法提取关键词（Python实现）

【自然语言处理】TextRank 算法提取关键词（Python实现）

文章目录前言PageRank 实现TextRank 简单版源码实现jieba工具包实现TextRank 前言 TextRank 算法是一种基于图的排序算法，主要用于文本处理中的关键词提取和文本摘要。它基于图中节点之间的关系来评估节点的重要性，类似于 Google 的 PageRank 算法。Tex…

阅读更多...

Docker Desktop安装到其他盘

Docker Desktop安装到其他盘

Docker Desktop 默认安装到c盘，占用空间太大了，想给安装到其他盘，网上找了半天的都不对正确安装命令： start /w "" "Docker Desktop Installer.exe" install --installation-dirF:\docker命令执行成功&am…

阅读更多...

feign 远程调用详解

feign 远程调用详解

在平常的开发工作中，我们经常需要跟其他系统交互，比如调用用户系统的用户信息接口、调用支付系统的支付接口等。那么，我们应该通过什么方式进行系统之间的交互呢？今天，简单来总结下 feign 的用法。 1：引入依…

阅读更多...

Rust语言进阶之标准输入: stdin用法实例(一百零五)

Rust语言进阶之标准输入: stdin用法实例(一百零五)

简介： CSDN博客专家、《Android系统多媒体进阶实战》一书作者新书发布：《Android系统多媒体进阶实战》🚀 优质专栏： Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏： 多媒体系统工程师系列【…

阅读更多...

modbus协议处理

modbus协议处理

//------------------------0x01-------------------------------- //MDA_usart_send: aa 55 01 00 06 00 02 00 05 //转modbusTCP——Master——send：地址00002，寄存器数量：00005 00 00 00 00 00 06 01 01 00 02 00 05 //ModbusTCP——Slave…

阅读更多...

保姆级教程Docker部署KRaft模式的Kafka官方镜像

保姆级教程Docker部署KRaft模式的Kafka官方镜像

目录一、安装Docker及可视化工具二、单节点部署 1、创建挂载目录 2、运行Kafka容器 3、Compose运行Kafka容器 4、查看Kafka运行状态三、集群部署四、部署可视化工具 1、创建挂载目录 2、运行Kafka-ui容器 3、Compose运行Kafka-ui容器 4、查看Kafka-ui运行状态 …

阅读更多...

CPU的基本结构

CPU的基本结构

基本结构控制器（Control Unit）：负责控制，如指令计数器，指令跳转。算术逻辑控制器（Arithmetic/Logic Unit）：负责计算，如算术运算加减，逻辑比较大小等。南北…

阅读更多...

集合类不安全问题

集合类不安全问题

ArrayList不是线程安全类，在多线程同时写的情况下，会抛出java.util.ConcurrentModificationException异常解决办法： 1.使用Vector（ArrayList所有方法加synchronized，太重） 2.使用Collections.synchronized…

阅读更多...

【自开发工具介绍】SQLSERVER的ImpDp和ExpDp工具04

【自开发工具介绍】SQLSERVER的ImpDp和ExpDp工具04

SQLSERVER的ImpDp和ExpDp工具演示 1、指定某些表作为导出对象外 (-exclude_table) 验证用：导出的表，导入到新的数据库 2、指定某些表作为导出对象外 (-exclude_table) 支持模糊检索，可以使用星号以s开头的表作为导出对象外，…

阅读更多...

推荐文章

最新文章