LangChain-Chatchat 实践

目录

1. 说明

相关路径:

安装环境:

2. 安装

2.1 工具准备

2.2 资料准备

2.3 执行

3. 测试

3.1 LLM对话

3.2 知识库

3.3 API 接口

参考


1. 说明

比较了几个AI LLM的集成应用工具(比如Quivr, Dify, one-api), 还是LangChain-Chatchat更符合我的需要:

  • 支持私有化部署不同的LLM
  • 知识库支持
  • Api支持
  • 开源免费, 容易二开
相关路径:
条项路径
LangChain-Chatchat 项目/data0/Projects/Langchain-Chatchat
LLM 语言模型保存路径/data0/Projects/LLMs
安装环境:

软件: ubuntu22.04 / python 3.10 /  pip22 

硬件: 虚拟机 i9cpu, 分配16核, 52G内存, 500G硬盘

2. 安装

说明:  没选择docker方案是因为想更了解实现原理及二开需要

2.1 工具准备

pip 为避免安装时出现 "python setup.py egg_info did not run successfully." 问题

pip install setuptools-scm
pip install seqeval

 git

git lfs install
2.2 资料准备

LangChain-Chatchat: : 用科学方法下载到路径 /data0/Projects/Langchain-Chatchat

LLM语言模型: 用科学方法下载到路径 /data0/Projects/LLMs

名称备注
LangChain-Chatchathttps://github.com/chatchat-space/Langchain-Chatchat.git使用
bge-large-zhhttps://huggingface.co/BAAI/bge-large-zh备用
bge-large-zh-v1.5https://huggingface.co/BAAI/bge-large-zh-v1.5使用, Embedding 模型
chatglm3-6bhttps://huggingface.co/THUDM/chatglm3-6b使用, LLM
2.3 执行

安装依赖库

# 进入目录
$ cd /data0/Projects/Langchain-Chatchat# 安装全部依赖
$ pip install -r requirements.txt 
$ pip install -r requirements_api.txt
$ pip install -r requirements_webui.txt  

生成配置文件

python copy_config_example.py

修改配置文件, 仅列出修改之处 (因CPU比GPU便宜,选用CPU方式 : 0):

configs/model_config.py

...
MODEL_ROOT_PATH = "/data0/Projects/LLMs"# 选用的 Embedding 名称
EMBEDDING_MODEL = "bge-large-zh-v1.5"# Embedding 模型运行设备。设为 "auto" 会自动检测(会有警告),也可手动设定为 "cuda","mps","cpu","xpu" 其中之一。
# EMBEDDING_DEVICE = "auto"
EMBEDDING_DEVICE = "cpu"...
# 要运行的 LLM 名称,可以包括本地模型和在线模型。列表中本地模型将在启动项目时全部加载。
# 列表中第一个模型将作为 API 和 WEBUI 的默认模型。
# 在这里,我们使用目前主流的两个离线模型,其中,chatglm3-6b 为默认加载模型。
# 如果你的显存不足,可使用 Qwen-1_8B-Chat, 该模型 FP16 仅需 3.8G显存。LLM_MODELS = ["chatglm3-6b", "zhipu-api", "openai-api"]
...MODEL_PATH = {"embed_model": {"bge-large-zh": "/data0/Projects/LLMs/bge-large-zh","bge-large-zh-v1.5": "/data0/Projects/LLMs/bge-large-zh-v1.5",},"llm_model": {"chatglm3-6b": "/data0/Projects/LLMs/chatglm3-6b",},
}

初始化知识库, 如果模型路径不对,会初始化失败,也导不进知识库文件

python init_database.py --recreate-vs

启动

$ python startup.py -a

3. 测试

3.1 LLM对话

几乎拉满性能

3.2 知识库

 

3.3 API 接口

http://ai001.dev.ia:7861/docs

参考

- https://github.com/chatchat-space/Langchain-Chatchat.git

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/12512.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RS485和RS232区别

RS485和RS232接口在物理外观上的区别主要在于连接器的类型和接线方式上。这两种串行通讯接口虽然在功能上有所不同,但外观上也有一些显著的特点。 连接器类型: RS232 接口通常使用DB9或DB25类型的连接器。DB9是较为常见的,拥有9个针脚&#x…

Adaboost集成学习 | Matlab实现基于CNN-BiLSTM-Adaboost集成学习时间序列预测(股票价格预测)

目录 效果一览基本介绍模型设计程序设计参考资料效果一览 基本介绍 Adaboost集成学习 | Matlab实现基于CNN-BiLSTM-Adaboost集成学习时间序列预测(股票价格预测) 模型设计 融合Adaboost的CNN-BiLSTM模型的时间序列预测,下面是一个基本的框架。 数据准备: 收集并整理用于时…

卷积神经网络CNN的运行过程、常见术语与问题

目录 一、CNN运行过程 1、卷积(Convolution) 2、激活函数(activation function) 3、池化(pooling) 3.1 池化操作 3.2 池化过程 3.3 池化后结果 4、Flatten 5、全连接层 Flatten层的操作 全连接层…

语义分割——高分卫星土地覆盖数据集

引言 亲爱的读者们,您是否在寻找某个特定的数据集,用于研究或项目实践?欢迎您在评论区留言,或者通过公众号私信告诉我,您想要的数据集的类型主题。小编会竭尽全力为您寻找,并在找到后第一时间与您分享。 …

2.3 应用集成技术

第2章 信息技术知识 2.3 应用集成技术 2.3.1 数据库与数据仓库技术 数据库 以单一的数据源即数据库为中心进行事务处理、批处理、决策分析等各种数据处理工作操作型处理也称事务处理,指的是对联机数据库的日常操作,通常是对数据库中记录的查询和修改…

Vitis HLS 学习笔记--资源绑定-使用URAM

目录 1. 简介 2. 代码解析 2.1 代码总览 2.2 优化指令 2.3 综合报告 3. 总结 1. 简介 Vivado IP 流程中的 AP_Memory,它用于与存储器资源(如 BRAM 和URAM)进行通信。不同于全局存储器(DDR),对此专用…

聊一聊Spring为什么需要三级缓存

写在文章开头 笔者在很早整理过一篇关于AOP的源码的文章,阅读起来晦涩难懂,在复盘时就有了想重构的想法,所以就借着这一话题重新聊一聊Spring中的三级缓存。 Hi,我是 sharkChili ,是个不断在硬核技术上作死的 java coder ,是 CSDN的博客专家 ,也是开源项目 Java Guide …

Sketch总结

sketch禁用了lineGap https://www.sketch.com/docs/designing/text/ http://www.sketchcn.com/sketch-chinese-user-manual.html https://github.com/sketch-hq/sketch-document https://developer.sketch.com/file-format/ https://animaapp.github.io/sketch-web-viewer/ htt…

IP代理中的SOCKS5代理是什么?安全吗?

在互联网世界中,网络安全和个人隐私保护变得日益重要。SOCKS5代理作为一种安全高效的网络工具,不仅可以保护个人隐私安全,还可以提供更稳定、更快度的网络连接。本文将带大家深入了解SOCKS5代理在网络安全领域中的应用。 什么是SOCKS5代理 …

k8s的整体架构及其内部工作原理,以及创建一个pod的原理

一、k8s整体架构 二、k8s的作用,为什么要用k8s,以及服务器的发展历程 1、服务器:缺点容易浪费资源,且每个服务器都要装系统,且扩展迁移成本高 2、虚拟机很好地解决了服务器浪费资源的缺点,且部署快&#x…

TDesign:腾讯企业级设计体系的UI组件库详解

随着时代的快速发展,产品规模不断扩大,传统的研发模式已不能满足市场需求。如何在设计和研发工作中实现高效的协调已成为一个大问题。腾讯企业级设计系统TDesign大量开源,为产品体验设计提供了新的解决方案! TDesign是一套完整的…

JVM运行时内存整体结构一览

文章目录 Java 虚拟机 (JVM) 运行时内存由程序计时器, 堆, 方法区, 本地方法栈, 虚拟机栈,构成 Java 虚拟机 (JVM) 运行时内存布局主要包括以下几个部分: 程序计数器 (Program Counter Register): 每个线程都有一个程序计数器,它是当前线程执行的字节码…

voceChat - 支持独立部署的个人云社交媒体聊天服务(使用场景及体验分享)

序言 在工作室的发展中,我们急需一个更加简单便捷,高效,适用于团队内部交流的组织平台。起因是我们团队一直是直接使用QQ进行活动,发现QQ很多功能不是很方便并且过于臃肿,越来越不契合工作室的生产环境,于…

风电功率预测 | 基于RBF径向基神经网络的风电功率预测(附matlab完整源码)

风电功率预测 风电功率预测完整代码风电功率预测 基于RBF(径向基函数)神经网络的风电功率预测是一种常见的方法。RBF神经网络是一种前馈神经网络,其隐藏层使用径向基函数作为激活函数。 下面是一个基于RBF神经网络的风电功率预测的一般步骤: 数据收集:收集包括风速、风向…

如何在 Windows 11/10 中恢复已删除的分区

在将重要数据存储在计算机上之前,许多用户会创建分区以更好地组织和管理他们的文件。此分区可以在内部硬盘驱动器或外部存储设备上创建。但是,有时可能会意外删除分区。如果发生这种情况,您可能想知道是否可以在不丢失任何信息的情况下恢复已…

[Python图像处理] 换脸(face swapping)操作实践

换脸操作实践 换脸 (face swapping)换脸操作实现相关链接 换脸 (face swapping) 换脸是指照片中的人脸自动替换:将一个人脸的某些部分与另一个人脸的其他部分相结合以形成新的面部图像。它可以被视为另一种类型的面部融合技术。在本节中,我们将使用面部…

【计网】TCP中的滑动窗口

🍎个人博客:个人主页 🏆个人专栏:日常聊聊 ⛳️ 功不唐捐,玉汝于成 目录 正文 工作原理如下: 结语 我的其他博客 正文 TCP(传输控制协议)中的滑动窗口是一种用于流量控制和拥…

数学建模——线性回归模型

目录 1.线性回归模型的具体步骤和要点: 1.收集数据: 2.探索性数据分析: 3.选择模型: 4.拟合模型: 5.评估模型: 1.R平方(R-squared): 2.调整R平方(Ad…

【教程向】从零开始创建浏览器插件(四)探索Chrome扩展的更多常用API

探索Chrome扩展的更多常用API 在Chrome扩展开发中,除了最基础的API外,Chrome还提供了一系列强大的API,允许开发者与浏览器的各种功能进行交互。本文将介绍其中几个常用的API,并提供详细的示例代码帮助您开始利用这些API。 书签…

JavaScript进阶——05-迭代器和生成器【万字长文,感谢支持】

迭代器 概念 迭代器(Iterator)是 JavaScript 中一种特殊的对象,它提供了一种统一的、通用的方式遍历个各种不同类型的数据结构。可以遍历的数据结构包括:数组、字符串、Set、Map 等可迭代对象。我们也可以自定义实现迭代器&…