大模型系列17-RAGFlow搭建本地知识库

安装ollama
安装open-wehui
安装并运行ragflow
RAG（检索、增强、生成）
- RAG是什么
- RAG三过程
- RAG问答系统构建步骤
- - 向量库构建
  - 检索模块
  - 生成模块
- RAG解决LLM的痛点
使用ragflow
- 访问ragflow
- 配置ollama模型
- - 添加Embedding模型
  - 添加chat模型
  - 系统模式设置
- 创建知识库
- - 数据集配置
  - 上传论文
  - 论文解析
  - 创建论文助理

安装ollama

参考写的ollama的文档

安装open-wehui

参考写的安装open-webui的文章

安装并运行ragflow

下载ragflow
git clone https://github.com/infiniflow/ragflow.git
下载依赖镜像并运行

 docker compose -f docker-compose.yml up -ddocker logs -f ragflow-server

运行成功后，使用 docker logs -f ragflow-server 查看运行状态
在这里插入图片描述

ragflow使用的各种环境变量在ragflow/docker/.env文件中，可以修改端口号、ragflow的镜像版本等

RAG（检索、增强、生成）

RAG是什么

在这里插入图片描述
RAG（Retrieval Augmented Generation 检索增强生成）模型由Facebook AI Research（FAIR）团队于2020年首次提出，并迅速成为大模型应用中的热门方案。它结合了信息检索技术（例如传统向量数据库）和大语言模型（如LLMs）的技术，从外部知识库中检索相关信息，并将其作为prompt输入到大模型中获取输出。

在这里插入图片描述

RAG三过程

RAG 包含三个主要过程：检索、增强和生成。

检索：根据用户的查询内容，从外部知识库获取相关信息。具体而言，将用户的查询通过嵌入模型转换为向量，以便与向量数据库中存储的相关知识进行比对。通过相似性搜索，找出与查询最匹配的前 K 个数据。这个目的是为了给后续生成提供上下文信息知识。
增强：将用户的查询内容和检索到的相关知识一起嵌入到一个预设的提示词模板中。对LLMs的提示词（prompt）
生成：将经过检索增强的提示词内容输入到大型语言模型中，以生成所需的输出。

RAG问答系统构建步骤

在这里插入图片描述

向量库构建

收集数据：首先，需要收集与问答系统相关的各种数据，这些数据可以来自文档、网页、数据库等多种来源。
数据清洗：对收集到的数据进行清洗，去除噪声、重复项和无关信息，确保数据的质量和准确性。
知识库构建：将清洗后的数据构建成知识库。这通常包括将文本分割成较小的片段（chunks），使用文本嵌入模型（如GLM）将这些片段转换成向量，并将这些向量存储在向量数据库（如FAISS、Milvus等）中。