书生·浦语大模型第二期实战营第三节-茴香豆:搭建你的 RAG 智能助理 笔记和作业

来源:

视频教程:茴香豆:搭建你的 RAG 智能助理

文字教程:茴香豆:搭建你的 RAG 智能助理

作业来源:第三课作业

茴香豆web链接:茴香豆web-零编程接入飞书微信(更新了高精度 LLM!)

1. 笔记

1.1 RAG技术概述

RAG(Retrieval Augmented Generation)是一种结合了检索(Retrieval)和生成(Generation)的技术,旨 在通过利用外部知识库来增强大型语言模型(LLMs)的性能。它通过检索与用户输入相关的信息片段,并结合这些 信息来生成更准确、更丰富的回答。解决LLMs在处理知识密集型任 务时可能遇到的挑战。提供更 准确的回答、降低成本、实现 外部记忆。
不足:生成幻觉;过时知识;缺乏透明和可追溯的推理过程

1.2 RAG工作原理 

数据存储:将文本及其他数据通过其他预训 练的模型转换为固定长度的向量 表示,这些向量能够捕捉文本的 语义信息。
相似性检索:根据用户的查询向量,使用向量数 据库快速找出最相关的向量的过程。 通常通过计算余弦相似度或其他相 似性度量来完成。检索结果根据相似度得分进行排序, 最相关的文档将被用于后续的文本生成。
向量表示的优化:包括使用更高级的文本编码技术 如句子嵌入或段落嵌入,以及对 数据库进行优化以支持大规模向 量搜索。

1.3 RAG流程示例

 1.4 RAG常见优化方法

嵌入优化 索引优化 查询优化 上下文管理 迭代检索 递归检索 自适应检索 LLM微调

自适应检索:Flare , Self-RAG;使用LLMs主动决定检索的最佳时机

递归检索:迭代细化搜索查询 ;链式推理(Chain-of-Thought)指导检索过程和内容。

LLM微调:LLM Fine-tuning:检索微调;生成微调;双重微调

选代检索:根据初始查询和迄今为止生成的文本进行重复搜索

上下文管理:Context Curation 重排(rerank) 上下文选择/压缩

嵌入优化:结合稀疏和密集检索 多任务

素引优化:细粒度分割  元数据

查询优化:查询扩展、转换 多查询

1.5 评估框架和基准测试 

经典评估指标:准确率 召回率 F1分数 BLEU分数 RouGE分数

RAG评测框架:基准测试-RGB,RECALL,CRUD

评测工具

2. 茴香豆作业

茴香豆是一个基于LLMs的领域知识助手,由书生浦语团队开发的开源大模型应用。专为即时通讯(IM)工具中的群聊场景优化的工作流,提供及时准确的技术支持和 自动化问答服务。通过应用检素增强生成(RAG)技术,茴香豆能够理解和高效准确的回应与特定知识领域相关的复杂查询。

应用场景:

智能客服:技术支持、领域知识对话 。

IM工具中创建用户群组,讨论、解答 相关的问题。

随着用户数量的增加,答复内容高度 重复,充斥大量无意义和闲聊,人工 回复,成本高,影响工作效率。通过提供自动化的问答支持, 帮助维护者减轻负担,同时确保用户 问题得到有效解答。
 

场景难点:

群聊中的信息量巨大,且内容多样,从技术讨 论到闲聊应有尽有。
用户问题通常与个人紧密相关,需要准确的实 时的专业知识解答。
传统的NLP解决方案无法准确解析用户意图, 且往往无法提供满意的答案。
需要一个能够在群聊中准确识别与回答相关问 题的智能助手,同时避免造成消息过载。

 2.1.实践一:在 InternLM Studio 上部署茴香豆技术助手

 对话截图

 2.2 茴香豆Web版演示

第1-2轮对话

第3-4轮对话

 第5-6轮对话

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/2286.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用R语言生成频数分布表

概要 使用R语言生成频数分布表 在R语言中,可以使用freq()函数来生成频数分布表。首先,将需要分组的数据存储在一个向量中。然后,使用freq()函数将这个向量作为参数输入,即可生成频数分布表。以下是一个示例: 示例 …

代码随想录算法训练营day7 | 454.四数相加II、383. 赎金信、15. 三数之和、18. 四数之和

454.四数相加II 有下面几种思路: 暴力解法,四重循环一个哈希表三重循环两重循环生成一个哈希表两重循环 使用两重循环: class Solution:def fourSumCount(self, nums1: List[int], nums2: List[int], nums3: List[int], nums4: List[int]…

内插和抽取

抽取: 频域表达式的关系: 1、角频率扩大M倍 2、移动2pi、22pi…(n-1) 2pi 3、相加 4、幅度变为1/M 内插: 加入低通滤波,减小混叠,但是由于截短,也会造成误差,但是…

setTimeout运行机制

当调用 setTimeout 函数时,它用于安排在一定延迟后执行的代码块。它的运行机制如下: 调度任务: 当调用 setTimeout 时,JavaScript 引擎会创建一个定时器,并将指定的代码块(回调函数)添加到一个称…

贪吃蛇完整代码

贪吃蛇代码 Snake.h //Snake.h #include<windows.h> #include<stdbool.h> #include<stdlib.h> #include<stdio.h> #include<time.h>#define POS_X 24 #define POS_Y 5#define WALL L□ #define BODY L● #define FOOD L★ //类型的声明 // //…

linux复习提纲

后台运行 &&#xff1a;命令行尾输入&#xff0c;命令执行后台运行fg % 作业号&#xff1a;作业前台执行bg % 作业号&#xff1a;作业后台执行 用户权限 主user&#xff08;u&#xff09;-同一组的&#xff08;g&#xff09;-其他&#xff08;o&#xff09; rwx&#xf…

【YOLOv8改进[检测头Head]】YOLOv8的“新头”之动态头(DynamicHead)

目录 一 DynamicHead 二 YOLOv8的“新头”之动态头 1 总体修改 2 配置文件 3 训练 其他 一 DynamicHead 官方论文地址&#xff1a;https://arxiv.org/pdf/2106.08322.pdf 官方代码地址&#xff1a;GitCode - 开发者的代码家园 在计算机视觉应用中&#xff0c;目标检测…

软件著作权登记材料

1、计算机软件著作权登记申请表 2、申请者身份证明 (1)著作权人为企业法人的&#xff1a; 提交有效的企业法人营业执照或事业单位法人证书副本复印件&#xff0c;并需加盖单位公章; (2)著作权人为自然人的&#xff1a; ?提交有效的自然人身份证复印件(正反面复印)。提交《非职…

第四百七十五回

文章目录 1. 概念介绍2. 功能与用法2.1 主要功能2.2 使用方法 3. 示例代码4. 内容总结 我们在上一章回中介绍了"四个bublue包对比与总结"相关的内容&#xff0c;本章回中将介绍Get包.闲话休提&#xff0c;让我们一起Talk Flutter吧。 1. 概念介绍 我们在本章回中将介…

zustand关于状态变化,是写在内部,还是外部

在使用Zustand时&#xff0c;通常建议将逻辑写在Zustand内部。Zustand是一个状态管理库&#xff0c;它提供了一种简单且强大的方式来管理状态&#xff0c;并且它的设计初衷就是为了让状态管理更加简洁和直观。 在Zustand内部定义状态和操作函数&#xff0c;并通过useStore hoo…

文件、文件夹被占用无法删除

一、针对文件夹无法删除 1、我们打开这个无法删除的文件夹&#xff0c;复制这个文件夹的地址。 2、打开windows任务管理器&#xff0c;选择“性能”选项卡&#xff0c;点击“打开资源监视器”。 3、在“资源监视器”中&#xff0c;cpu中找到“关联的句柄”&#xff0c;在文本框…

4.12 SpringBoot整合AOP ❤❤❤

1. AOP简介 要介绍面向切面编程(Aspect-Oriented Programming,AOP),需要读者 首先考虑这样一个场景&#xff1a; 公司有一个人力资源管理系统目前已经上线&#xff0c;但是系统运行不稳定&#xff0c;有时运行得很慢&#xff0c;为了检测出到底是哪个环节出问题了&#xff0c;…

错了,全部错了

感觉还是挺有难度的吧。。 其实最小割在这种最大/最小化代价的问题上的拓展性是比最大流要好的&#xff0c;甚至有些问题用最大流建模后不好求而要转化为求最小割&#xff08;例如 CF1368H Breadboard Capacity&#xff0c;但是也不绝对&#xff0c;有极少数题是用最小割建模…

力扣HOT100 - 2. 两数相加

解题思路&#xff1a; 缺位的节点进行补零处理&#xff0c;如97323补充为973023 注意相加的进位问题 class Solution {public ListNode addTwoNumbers(ListNode l1, ListNode l2) {ListNode head null, tail null;int carry 0;while (l1 ! null || l2 ! null) {int n1 l…

2013-2021年各省经济韧性相关测度指标面板数据

2013-2021年各省经济韧性相关测度指标面板数据 1、时间&#xff1a;2013-2021年 2、指标&#xff1a;城镇化率 %、财政科学技术支出&#xff08;亿元&#xff09;、万人高等教育在校人数&#xff08;万人&#xff09;、财政教育支出&#xff08;亿元&#xff09;、第三产业占…

semaphore信号量使用+原理分析

1.概述 Semaphore 信号量&#xff0c;相当于一个计数器&#xff0c;通常用来限制线程的数量。 每个线程操作前会先获取一个许可证&#xff0c;逻辑处理完成之后就归还这个许可证。 通俗的解释&#xff1a;相当于一个停车场&#xff0c;有10个停车位&#xff0c;进来一个车&am…

QtCharts 组件

Qtcharts 组件基于GraphicsView模式实现&#xff0c;其核心是QChartView和QChart的二次封装版。 在pro文件中包含QT charts来引入绘图类库。 头文件中定义QT_CHARTS_USE_NAMESPACE宏&#xff0c;这样才可以正常的使用绘图功能。 一般情况下我们会在mainwindows.h头文件中增…

本地部署Docker容器可视化图形管理工具DockerUI并实现无公网IP远程访问——“cpolar内网穿透”

文章目录 前言1. 安装部署DockerUI2. 安装cpolar内网穿透3. 配置DockerUI公网访问地址4. 公网远程访问DockerUI5. 固定DockerUI公网地址 前言 DockerUI是一个docker容器镜像的可视化图形化管理工具。DockerUI可以用来轻松构建、管理和维护docker环境。它是完全开源且免费的。基…

stack、queue(priority_queue)的模拟实现和deque的简单介绍

stack和queue(priority_queue) 1. 容器适配器 适配器(Adapter)&#xff1a;一种用来修饰容器(Containers)或仿函数(Functors)或迭代器(Iterator)接口的东西。 适配器是一种设计模式&#xff0c;该模式将一个类的接口转换成客户希望的另外一个接口。 现实中拿插座来说&#xf…

LeetCode 每日一题 Day 137-143

928. 尽量减少恶意软件的传播 II(Hard) 给定一个由 n 个节点组成的网络&#xff0c;用 n x n 个邻接矩阵 graph 表示。在节点网络中&#xff0c;只有当 graph[i][j] 1 时&#xff0c;节点 i 能够直接连接到另一个节点 j。 一些节点 initial 最初被恶意软件感染。只要两个节点…