第十一篇-Tesla P40+Text-Generation-Webui

部署环境

系统:CentOS-7
CPU: 14C28T
显卡:Tesla P40 24G
驱动: 515
CUDA: 11.7
cuDNN: 8.9.2.26

介绍

简单好用(当然速度不是最快的),
支持多种方式加载模型,transformers, llama.cpp, ExLlama, AutoGPTQ, GPTQ-for-LLaMa, ctransformers
支持多类模型, Llama-2-chat, Alpaca, Vicuna, WizardLM, StableLM等
图形化界面聊天,微调

下载模型

https://huggingface.co/lmsys/vicuna-7b-v1.5
一个一个下载,文件下载比较耗时,可以使用浏览器下载,我用的是QQ浏览器,多点多试几次

创建虚拟环境

conda create -n textgen python=3.10conda activate textgen
git clone https://github.com/oobabooga/text-generation-webui
cd text-generation-webui
pip install -r requirements.txt  -i https://pypi.tuna.tsinghua.edu.cn/simple

这里的安装需要访问github,注意自己网络可以访问github,
如果不能或者超时请重试
或者改用相应国内github镜像

移动模型

把下载好的模型文件夹放到models目录下
通过不同文件夹区别模型

[root@ai-server ~]# cd /opt/ai-server/text-generation-webui/models/
[root@ai-server models]# ll -h
total 8.0K
-rw-r--r--. 1 root root 7.3K Aug 15 10:47 config.yaml
-rw-r--r--. 1 root root    0 Aug 15 10:47 place-your-models-here.txt
lrwxrwxrwx. 1 root root   30 Aug 16 09:43 Vicuna-13b-v1.3.0-GPTQ -> /models/Vicuna-13b-v1.3.0-GPTQ
lrwxrwxrwx. 1 root root   28 Aug 16 09:43 Vicuna-13b-v1.5-GGML -> /models/Vicuna-13b-v1.5-GGML
lrwxrwxrwx. 1 root root   23 Aug 16 09:43 Vicuna-33B-GPTQ -> /models/Vicuna-33B-GPTQ
lrwxrwxrwx. 1 root root   27 Aug 17 10:43 Vicuna-7B-v1.5-GPTQ -> /models/Vicuna-7B-v1.5-GPTQ
lrwxrwxrwx. 1 root root   32 Aug 17 10:00 WizardCoder-15B-1.0-GPTQ -> /models/WizardCoder-15B-1.0-GPTQ
lrwxrwxrwx. 1 root root   30 Aug 17 10:00 WizardLM-13B-V1.2-GPTQ -> /models/WizardLM-13B-V1.2-GPTQ

可以创建软连接

ln -s /models/Vicuna-7B-v1.5-GPTQ /opt/ai-server/text-generation-webui/models/Vicuna-7B-v1.5-GPTQ
ln -s 已存在的文件夹	新链接文件夹

启动

python server.py --listen --listen-host 192.168.31.232 --listen-port 7860

访问配置

http://192.168.31.232:7860
配置模型,点击Model
1、选择第一个下拉框,选择你要加载的模型
2、可以选择Model loader使用想要的加载器加载,有多种可以选择,根据你下载的模型格式选择相应的
3、点击Load加载模型Loading Vicuna-7B-v1.5-GPTQ…Successfully loaded Vicuna-7B-v1.5-GPTQ说明加载成功
配置参数,点击Parameters可以配置许多参数,比如max_new_tokens
可是体验,点击Chat在input输入你的内容点击Generate等待回答

速度性能

在启动服务控制台会打印回答速度
例如:Output generated in 19.92 seconds (1.10 tokens/s, 22 tokens, context 43, seed 1673505503)
Tesla P40速度还是非常慢的,建议使用其他性能更好的显卡

参考

  1. https://github.com/oobabooga/text-generation-webui

问题解决

  1. 在安装text-generation-webui时如果出现cmake,gcc,g++等问题,考虑升级gcc,g++版本
    升级
wget --no-check-certificate https://copr.fedorainfracloud.org/coprs/mayeut/devtoolset-8/repo/epel-6/mayeut-devtoolset-8-epel-6.repo -O /etc/yum.repos.d/devtoolset-8.repoyum makecacheyum -y install devtoolset-8-gcc devtoolset-8-gcc-c++ devtoolset-8-binutilsscl enable devtoolset-8 bashgcc -vg++ -v 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/58147.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

火山引擎发布自研视频编解码芯片

2023年8月22日,火山引擎视频云宣布其自研的视频编解码芯片已成功出片。经验证,该芯片的视频压缩效率相比行业主流硬件编码器可提升30%以上,未来将服务于抖音、西瓜视频等视频业务,并将通过火山引擎视频云开放给企业客户。 火山引…

【网络】多路转接——五种IO模型 | select

🐱作者:一只大喵咪1201 🐱专栏:《网络》 🔥格言:你只管努力,剩下的交给时间! 五种IO模型 | select 🍧五种IO模型🍧select🧁认识接口&#x1f9c1…

视频中的声音怎么提取出来?这样做提取出来很简单

提取视频中的声音可以有多种用途。例如,我们可能希望从视频中提取音乐或音效,以在其他项目中使用。或者,可能需要将视频中的对话转录为文本,以便更轻松地编辑和共享内容。无论目的是什么,提取视频中的声音都可以帮助我…

调用自实现MyGetProcAddress获得CreateFileA函数并调用创建写入文件

写文件如下 #include <iostream> #include <Windows.h>typedef HANDLE(WINAPI* CreateFileAFunc)(LPCSTR, DWORD, DWORD, LPSECURITY_ATTRIBUTES, DWORD, DWORD, HANDLE);DWORD MyGetProcAddress(_In_ HMODULE hModule,_In_ LPCSTR lpProcName ){PIMAGE_DOS_HEADE…

Mycat教程+面试+linux搭建

目录 一 MyCAT介绍 二 常见的面试题总结 三 linux下搭建Mycat 一 MyCAT介绍 1.1. 什么是MyCAT&#xff1f; 简单的说&#xff0c;MyCAT就是&#xff1a; 一个彻底开源的&#xff0c;面向企业应用开发的“大数据库集群” 支持事务、ACID、可以替代Mysql的加强版数据库 一个可…

关于Vue.set()

简介 Vue.set() 是 Vue 中的一个全局方法&#xff0c;其主要作用是向响应式对象添加新的属性&#xff0c;并确保新属性同样具有响应式。在 Vue.js 中&#xff0c;当数据对象的属性被直接修改时&#xff0c;Vue 可以监测到数据变化并响应变化。但若添加新的响应式对象属性时&am…

uni-app里使用webscoket

实现思路和vue中是一样的。如果想看思路可以看这篇文章&#xff1a;websocket 直接上可以运行的代码&#xff1a; 一、后端nodeJS代码&#xff1a; 1、新建项目文件夹 2、初始化项目&#xff1a; npm init -y 3、项目里安装ws npm i ws --save 4、nodeJS代码&#xff1…

SmartInspect Professional .Net Delphi Crack

SmartInspect Professional .Net & Delphi Crack SmartInspect Professional是一个用于调试和跟踪.NET、Java和Delphi软件的高级日志记录工具。它使您能够识别错误&#xff0c;找到客户问题的解决方案&#xff0c;并让您清楚地了解软件在不同环境和条件下的工作方式。可以轻…

Redis 7 第三讲 数据类型 进阶篇

⑥ *位图 bitmap 1. 理论 由0和1 状态表现的二进制位的bit 数组。 说明:用String 类型作为底层数据结构实现的一种统计二值状态的数据类型 位图本质是数组,它是基于String 数据类型的按位操作。该数组由多个二进制位组成,每个二进制位都对应一个偏…

3、监测数据采集物联网应用开发步骤(3)

监测数据采集物联网应用开发步骤(2) 系统整体结构搭建 新建项目 输入项目名称&#xff1a;MonitorData 所谓兵马未动粮草先行&#xff0c;按下图创建好对应的模块备用&#xff1a; com.plugins 业务插件模块 com.zxy.adminlog 日志或文本文…

YOLOv7源码解析

YOLOv7源码解析 YAML文件YAML文件 以yolov7 cfg/yolov7-w6-pose.yaml为例: # parametersnc: 1 # number of classes nkpt: 4 # number of key points depth_multiple: 1.0 # model depth multiple width_multiple: 1.0 # layer channel multiple dw_conv_kpt: Trueanchor…

road to master

零、学习计划 数据库相关 索引 我以为我对数据库索引很了解&#xff0c;直到我遇到了阿里面试官 - 知乎 (zhihu.com)给我一分钟&#xff0c;让你彻底明白MySQL聚簇索引和非聚簇索引 - 知乎 (zhihu.com)聚集索引&#xff08;聚类索引&#xff09;与非聚集索引&#xff08;非聚类…

Json路径表达式

原json路径 {"timeStamp": "20220801110008","transIDO": "6ba9088c981b407fb38feasdf09","version": "1.0.0","signMethod": "md5","content": "{\"companyName\&quo…

基于python+pyqt的opencv汽车分割系统

目录 一、实现和完整UI视频效果展示 主界面&#xff1a; 识别结果界面&#xff1a; 查看分割处理过程图片界面&#xff1a; 二、原理介绍&#xff1a; 加权灰度化 ​编辑 二值化 滤波降噪处理 锐化处理 边缘特征提取 图像分割 完整演示视频&#xff1a; 完整代码链…

C# 课后练习题

17. XAF框架下的导航按钮 using System; using System.Collections.Generic; using System.Line; using System.Text; using System.Threading.Tasks;namespace Tutorial_XAF.Module.BussinessObjects {[XAFDisplayName("测试")][NavigationItem("这是导航&quo…

计算机竞赛 基于YOLO实现的口罩佩戴检测 - python opemcv 深度学习

文章目录 0 前言1 课题介绍2 算法原理2.1 算法简介2.2 网络架构 3 关键代码4 数据集4.1 安装4.2 打开4.3 选择yolo标注格式4.4 打标签4.5 保存 5 训练6 实现效果6.1 pyqt实现简单GUI6.3 视频识别效果6.4 摄像头实时识别 7 最后 0 前言 &#x1f525; 优质竞赛项目系列&#xf…

【推荐】Spring与Mybatis集成整合

目录 1.概述 2.集成 2.1代码演示&#xff1a; 3.整合 3.1概述 3.2 进行整合分页 接着上两篇&#xff0c;我已经写了Mybatis动态之灵活使用&#xff0c;mybatis的分页和特殊字符的使用方式接下来把它们集成起来&#xff0c;是如何的呢&#x1f447;&#x1f447;&#x1…

vscode 无法跳转第三方安装包

vscode 无法跳转第三方安装包 场景&#xff1a;使用vscode写代码时&#xff0c; 第三方的安装包无法使用ctrl 左键&#xff0c;点击进入查看&#xff0c; 不方便源码查看 解决办法&#xff1a; 使用快捷键 Ctrl Shift P&#xff0c; 进入命令搜索框搜索 setting.json 编辑…

linux下查看库符号注意使用c++filt解析

个人随笔 (Owed by: 春夜喜雨 http://blog.csdn.net/chunyexiyu) 这篇文档&#xff0c;主要内容就如标题所言&#xff1a; linux下查看库符号时&#xff0c;注意使用cfilt解析后&#xff0c;再来做grep查找 经验教训 这个问题来源于一个经验教训&#xff1b; 我想查一下libj…

react解决死循环方法?

使用useeffect&#xff08;副作用&#xff09;方法结束这个操作 1、导入useeffect、useState 2、把下方代码写入&#xff1a;里面填写的是你要终止某个东西的代码 注意&#xff1a;不可不写&#xff0c;也可以写依赖或不写