【书生·浦语大模型实战营03】《基于 InternLM 和 LangChain 搭建你的知识库》学习笔记

【书生·浦语大模型实战营03】《基于 InternLM 和 LangChain 搭建你的知识库》学习笔记

news/2025/4/27 3:44:29/文章来源:https://blog.csdn.net/songyuc/article/details/135466277

《基于 InternLM 和 LangChain 搭建你的知识库》

常见术语

RAG: Retrieval Augmented Generation，检索增强生成

1. 大模型开发范式

1.1 RAG VS Finetune

在这里插入图片描述

RAG	Finetune
低成本	可个性化微调
可实时更新	知识覆盖面广
受基座模型影响大	成本高昂
单次回答知识有限	无法实时更新

1.1.2 Finetune

（2）成本高昂：需要GPU算力以及模型训练知识

3. 构建向量数据库

3.1 加载源文件 $\rightarrow$ 文档分块 $\rightarrow$ 文档向量化

在这里插入图片描述

确定源文件类型，针对不同类型源文件选用不同的加载器
- 核心在于将带格式文本转化为无格式字符串
由于单个文档往往超过模型上下文上限，我们需要对加载的文档进行切分
- 一般按字符串长度进行分割
- 可以手动控制分割块的长度和重叠区间长度
使用向量数据库来支持语义检索，需要将文档向量化存入向量数据库
- 可以使用任意一种Embedding模型来进行向量化
- 可以使用多种支持语义检索的向量数据库，一般使用轻量级的Chroma

4. 搭建知识库助手

4.1 RAG方案优化建议

在这里插入图片描述

基于RAG的问答系统性能核心受限于：
- 检索精度
- Prompt性能
一些可能的优化点：
- 检索方面：
  - 基于语义进行分割，保证每一个chunk的语义完整
  - 给每一个chunk生成概括性索引，检索时匹配索引
- Prompt方面：
  - 迭代优化Prompt策略

南溪：感觉“概括性索引”就有点像论文的摘要。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/606292.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Elasticsearch：Search tutorial - 使用 Python 进行搜索（二）

Elasticsearch：Search tutorial - 使用 Python 进行搜索（二）

这个是继上一篇文章 “Elasticsearch：Serarch tutorial - 使用 Python 进行搜索 （一）” 的续篇。在今天的文章中，我们接着来完成如何进行分页及过滤。分页 - pagination 应用程序处理大量结果通常是不切实际的。因此&#xff0…

阅读更多...

代码随想录二刷｜二叉树｜验证二叉搜索树

代码随想录二刷｜二叉树｜验证二叉搜索树

代码随想录二刷 ｜二叉树 ｜ 验证二叉搜索树题目描述解题思路递归法迭代法代码实现递归法迭代法题目描述 98.验证二叉搜索树给定一个二叉树，判断其是否是一个有效的二叉搜索树。假设一个二叉搜索树具有如下特征： 节点的左子…

阅读更多...

Eureka的自我保护机制

Eureka的自我保护机制

一：Eureka的自我保护机制是什么？ 保护模式主要用于一组客户端和Eureka Server之间存在网络分区场景下的保护。一旦进入保护模式，Eureka Server将会尝试保护其服务注册表中的信息，不再删除服务注册表中的数据，也就是不…

阅读更多...

关于电脑屏幕亮度的调整，看这篇文章就够了

关于电脑屏幕亮度的调整，看这篇文章就够了

你可能需要定期更改屏幕亮度。当外面很亮的时候，你想把它调大，这样你就能看到。当你在黑暗的房间里时，你会希望它变暗，这样就不会伤害你的眼睛。降低屏幕亮度也有助于节省电力并延长笔记本电脑的电池寿命。除了手动更改屏幕亮度外，Windows还可以通过多种方式自动更改屏幕…

阅读更多...

ROS-Ubuntu20.04安装noetic

ROS-Ubuntu20.04安装noetic

ROS-Ubuntu20.04环境安装 1.系统和ROS版本操作系统：Ubuntu20.04 ROS版本：ROS noetic 2.安装步骤 1.配置ROS软件源 sudo sh -c echo "deb http://packages.ros.org/ros/ubuntu $(lsb_release -sc) main" > /etc/apt/sources.list.d/r…

阅读更多...

Pytorch常用的函数(六)常见的归一化总结(BatchNorm/LayerNorm/InsNorm/GroupNorm)

Pytorch常用的函数(六)常见的归一化总结(BatchNorm/LayerNorm/InsNorm/GroupNorm)

Pytorch常用的函数(六)常见的归一化总结(BatchNorm/LayerNorm/InsNorm/GroupNorm) 常见的归一化操作有：批量归一化（Batch Normalization）、层归一化（Layer Normalization）、实例归一化（Instance Normaliza…

阅读更多...

【React系列】React生命周期、setState深入理解、 shouldComponentUpdate和PureComponent性能优化、脚手架

【React系列】React生命周期、setState深入理解、 shouldComponentUpdate和PureComponent性能优化、脚手架

本文来自#React系列教程：https://mp.weixin.qq.com/mp/appmsgalbum?__bizMzg5MDAzNzkwNA&actiongetalbum&album_id1566025152667107329) 一. 生命周期 1.1. 认识生命周期很多的事物都有从创建到销毁的整个过程，这个过程称之为是生命周期&…

阅读更多...

【华为OD机试真题 JavaScript】项目排期|解题思路、代码解析

【华为OD机试真题 JavaScript】项目排期|解题思路、代码解析

文章目录题目描述输入输出示例1输入输出说明解题思路实现代码题目描述项目组共有N个开发人员，项目经理接到了M个独立的需求，每个需求的工作量不同，且每个需求只能由一个开发人员独立完成，不能多人合作。假定各个需求直接无任何先后依赖关系，请设计算法帮助项目经理进行…

阅读更多...

案例分析——如何优化跨境直播网络

案例分析——如何优化跨境直播网络

跨境直播风口已至这些年越来越多商家加入直播带货行列，各种玩法日渐成熟。而TikTok作为当前国外最火爆的直播平台，不少卖家都会定期做TikTok直播引流，但时常会面临着远程访问导致直播画面模糊、卡顿掉线、延迟高，甚至可能限流黑…

阅读更多...

Django 4.2.7 ORM 连接MySQLServer 完成单表CRUD

Django 4.2.7 ORM 连接MySQLServer 完成单表CRUD

文章目录 Django ORM介绍1.使用pycharm新建一个Django项目2.修改settings.py文件中 DATABASES3.创建APP4.创建模型5.操作数据库 Django ORM介绍 Django 模型使用自带的 ORM。对象关系映射（Object Relational Mapping，简称 ORM ）用于实现面向…

阅读更多...

C++ Trie树模版及模版题 || Trie字符串统计

C++ Trie树模版及模版题 || Trie字符串统计

Trie树：用来高效的存储和查找字符串集合的数据结构。维护一个字符串集合，支持两种操作： I x 向集合中插入一个字符串 x ； Q x 询问一个字符串在集合中出现了多少次。共有 N 个操作，所有输入的字符串总长度不超过 1…

阅读更多...

vue2打包后，接口地址可在打包文件中配置

vue2打包后，接口地址可在打包文件中配置

项目中遇到一个需要，打包后的项目需要部署到多个服务器，所以每次打包都需要修改环境变量的api的接口，先需要直接在打包文件中修改，不用每次都重新打包： 1.在public下创建config文件： window.apiConfig{&q…

阅读更多...

OpenHarmony内存泄漏指南 - 解决问题（综合）

OpenHarmony内存泄漏指南 - 解决问题（综合）

本系列文章旨在提供定位与解决OpenHarmony应用与子系统内存泄露的常见手段与思路，将会分成几个部分来讲解。首先我们需要掌握发现内存泄漏问题的工具与方法，以及判断是否可能存在泄漏。接着需要掌握定位泄漏问题的工具，以及抓取trace、分析tr…

阅读更多...

$Golang : Bson\Json互转$

Golang : Bson\Json互转

代码 package bson_jsonimport ("encoding/json""errors""fmt""gopkg.in/mgo.v2/bson""os""testing" )type User struct {Name string json:"name,omitempty" bson:"name,omitempty"CSD…

阅读更多...

解密威胁：应对.faust勒索攻击的实用解决方案

解密威胁：应对.faust勒索攻击的实用解决方案

引言： 在数字犯罪的舞台上，.faust勒索病毒以其狡猾的特征而备受瞩目，其中最为引人注目的之一是其对文件扩展名的变革。这种诡异的舞蹈不仅是攻击者的标志，更是对受害者数据的无情捉弄。本节将深入研究.faust勒索病毒对文件扩展名…

阅读更多...

GDB调试技巧实战--chatGPT辅助考察strace原理

GDB调试技巧实战--chatGPT辅助考察strace原理

想法本想写一篇strace代码解读的帖子，但是市面上已经有很多介绍strace原理的文章。就不重复造轮子了。还是授人以鱼不如授人以渔，讲讲如何利用GDB+ChatGPT辅助通过实践理解strace主要程序流吧。既然strace的主要原理是利用ptrace系统函数控制tracee(被调试者) 及 wait4等…

阅读更多...

回溯算法part03 算法

回溯算法part03 算法

回溯算法part03 算法今日任务 ● 39. 组合总和 ● 40.组合总和II ● 131.分割回文串 1.leetcode 39. 组合总和 https://leetcode.cn/problems/combination-sum/ class Solution {List<List<Integer>> resultnew ArrayList<>();List<Integer> pat…

阅读更多...

JS函数调用的this指向与apply,call,bind调用模式

JS函数调用的this指向与apply,call,bind调用模式

1、函数调用的四种模式与this指向普通函数调用：this指向全局对象对象方法调用：this指向该调用的对象构造函数调用：this指向构造函数new的对象call,apply和bind间接调用：显式绑定this，传入的第一个参数绑定的对象 2、…

阅读更多...

静态网页设计——天行九歌（HTML+CSS+JavaScript）(dw、sublime Text、webstorm、HBuilder X)

静态网页设计——天行九歌（HTML+CSS+JavaScript）(dw、sublime Text、webstorm、HBuilder X)

前言声明：该文章只是做技术分享，若侵权请联系我删除。！！ 感谢大佬的视频：https://www.bilibili.com/video/BV1de411m7y4/?vd_source5f425e0074a7f92921f53ab87712357b 源码：https://space.bilibili.com…

阅读更多...

java回溯算法、最短路径算法、最小生成树算法

java回溯算法、最短路径算法、最小生成树算法

回溯算法回溯算法实际上一个类似枚举的搜索尝试过程，主要是在搜索尝试过程中寻找问题的解，当发现已不满足求解条件时，就“回溯”返回，尝试别的路径。最短路径算法从某顶点出发，沿图的边到达另一顶点所经过的路径中…

阅读更多...

最新文章