Linux搭建text-generation-webui框架,安装通义千问大模型,开放对外api,voxta测试对话图文教程

目录

text-generation-webui部分

开放对外API

通义千问部分

远程API对话测试部分


text-generation-webui部分

本来不想发这个文章的,但是自己部署的时候看了挺多人的帖子,很多发的不全面,要么就是跟着他们流程走有些小问题啥的,这回我自己在网上和代码里研究了一下。

首先下载项目包:https://github.com/oobabooga/text-generation-webui

你自己用git克隆还是直接下zip随意

 解压之后,你的文件结构是这样的,这里我为了方便给看清文件结构,用windows截得图

 windows也能安,而且我认为windows更容易安

我用红框标注了我们要使用的文件

如果你是win系统,那么就启动start_windows.bat,如果你是linux,就切换到目标目录下,执行./start_linux.sh

这里截图依旧先用windows举例,因为他前两个询问是一样的 

他会问你你的显卡是什么型号的,你CUDA版本需不需要安装12.1,我推荐,服务器最好是N卡,也最好是N卡

如果N卡,第一个问题答A选项,第二个问题必点N

接下来会执行安装CUDA等环境,不过你90%概率是会报错的。

报错不要慌,你再启动start命令是启动不来的了,接下来要执框里那个cmd命令

这个命令是让你进入到text-generation-webui自动给你配好的虚拟环境执行命令用的,你要下载什么包,需要进入env里来执行命令,之前我们用start命令首次启动自动安装环境的时候,他非常大的概率会报错,无非就是环境没下全,依赖没下全,那么要修复他,需要手动安装依赖。

执行命令pip install -r requirements.txt(注意一定要用cmd进入到env虚拟环境里执行

我下面截图是因为我环境安装过了,所以没有那么多下载了,正常你pip install,是会进行很多下载的

这里面还有个坑,而且是很大的坑,如果在pip安装依赖的时候,你报红字了,别担心,基本上99%概率网络问题,他这个text-generation-webui只要你下的是官方最新的包,你执行start命令的时候无论虚拟环境还是python3.11和cuda,他都是给你对应好的,或者说你要是担心就自己下个python3.11,所以不存在他的requirements.txt文件有问题啥的,那么报红字,基本上不是timeout,就是HTTP啥啥啥的,就是网速问题,这玩意纯看脸,一次不行就多次,迟早能下载下来,windows好解决是windows可以魔法上网,能解决网的问题

关于他项目里有好多requirements你分不清,可以查看官方文档里有说明,一般用requirements.txt那个就行

pip安装依赖全下下来完全没红字后,基本上就不会有问题了,你整套已经搭建起来了

接下来测试启动,依旧还是用start命令

出现URL说明已经启动成功了,如果报错,那么继续进入env里pip安装requirements文件内容

开放对外API

如果已经看到启动成功后,那么我们进行下一部,对外api

我们看到他的url地址是127.0.0.1地址,但是这个地址是不对外开放的,在我们已解决防火墙的问题之后我们要让他以0.0.0.0来启动,其他好多文章都说什么用其他方式做转发,其实没那么麻烦,我们要设置一个配置文件就可以解决

打开文件,开始只有三行注释,意思让你自己配置监听ip、端口和对外api,这里我们端口没必要改,当然你要想设置其他端口,添加listen-port就行,这里我默认7860端口webui页面,5000端口对外api

改完保存,再重新启动 

OK我们的web页面和api都启动了,用telnet测试一下。这里我直接用我本地电脑连接服务器的web页面进行测试,可以看到我们的页面已经进来了,完全没问题

通义千问部分

那么下一步,安装文本大模型,这里我选择通义千问,如果你有其他想部署的随便挑

我们先去huggingface网站去挑选我们想要安装的模型

地址:https://huggingface.co/models

这里我搜索的千问2.5,由于我只是调试测试用,所以不用安72B那么大的,建议了解大模型72B,32B等区别,显存不高的不是给你那么玩的

我挑选的7B

 记住这个地址结构,因为我们要在web页面下载用

来到web页面,选择model,按照他提示的格式写,点下载

我们看报错了,网连不上,这也就是我说的windows安装比linux省事多了

 那么我们自己直接把model文件下载到本地然后上传到服务器

我这里已经上传完解压完了

那么我们回到web页面,可以看到model中有显示了

选择模型,点右侧按钮加载,看控制台加载过程

 

 如果加载成功他会显示success load

接下来测试chat对话,测试成功

远程API对话测试部分

那么下一步,我们要用VOXTA测试下远程连接API可不可以对话,这里先简单说下VOXTA,VOXTA是简单的把文本转换成语音式的一个服务,特色是他的AI有角色卡,可以设定AI的身份,年龄,性格特征,看起来像活生生的一个人,具体VOXTA是给哪个方面服务的,这里不方便说,大家懂的都懂。😁😁😁😁😁

启动VOXTA,点右上角插件配置

在TEXT生成那个插件,设置,因为我们用的是text-generation-webui框架,所以配置也是加这个,如果没有下面Add服务然后添加就好了

设置我们的远程API

这里测试对话成功,而且是语音输出,由于文案看不到语音结果,所以截图看不出了大家知道可以完全语音交互了就行

 到这里我们整套流程就结束了😁😁😁😁😁😁😁😁😁😁😁😁

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/64074.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

QT程序发布后,mysql在其它电脑设备无法连接数据库

QT程序发布后,mysql在其它电脑设备无法连接数据库 D:\mysql-5.7.24-winx64\lib, mysql-5.7.24-winx64是一个压缩包,用于启动mysql服务,创建数据库 压缩包 解决方法: 拷贝库到exe的相同目录,libmysql.dll,libmysql.li…

ElasticSearch 的核心功能

要深入理解 ElasticSearch 的核心功能,需要全面掌握其 全文搜索、分析、聚合 和 索引生命周期管理(ILM) 的设计原理和实际应用。 1. 全文搜索 ElasticSearch 的全文搜索是其核心功能之一,依赖于倒排索引和强大的分词、相关性评分…

在Nginx部署Web应用,如何保障后端API的安全

1. 使用HTTPS和http2.0 参考:Nginx配置HTTP2.0_nginx 支持 2.0-CSDN博客 2. 设置严格的CORS策略 通过add_header指令设置CORS头。 只允许来自https://frontend.yourdomain.com的请求访问API location /api/ {if ($http_origin ~* (https://frontend\.yourdomai…

Nginx单向链表 ngx_list_t

目录 基本概述 数据结构 接口描述 具体实现 ngx_list_create ngx_list_init ngx_list_push 使用案例 整理自 nginx 1.9.2 源码 和 《深入理解 Nginx:模块开发与架构解析》 基本概述 Nginx 中的 ngx_list_t 是一个单向链表容器,链表中的每一个节…

es快速扫描

介绍 Elasticsearch简称es,一款开源的分布式全文检索引擎 可组建一套上百台的服务器集群,处理PB级别数据 可满足近实时的存储和检索 倒排索引 跟正排索引相对,正排索引是根据id进行索引,所以查询效率非常高,但是模糊…

软件需求建模方法

软件需求建模是一个涉及多个学科的领域,其研究方向广泛且多样。以下是一些主要的研究方向: 1. 需求工程方法:研究如何更有效地收集、分析、规格化和验证软件需求。这包括新的需求工程方法论和工具的开发。 2. 需求管理:关注需求…

软件项目需求分析的实践探索(1)

一、项目启动与规划 组建团队 包括项目经理、系统分析师、业务分析师以及可能涉及的最终用户代表和领域专家等。例如,开发一个医疗管理软件,就需要有医疗行业的专家参与,确保对医疗业务流程有深入理解。明确各成员的职责,如系统分…

wordpres当前分类调用父分类的名称和链接

在WordPress中&#xff0c;如果你想在当前分类页面调用并显示父分类的名称和链接&#xff0c;你可以使用以下代码片段&#xff1a; <?php // 获取当前分类的ID $cat_id get_queried_object_id();// 获取当前分类的父分类ID $parent_id get_term($cat_id, category)->…

前端Python应用指南(三)Django vs Flask:哪种框架适合构建你的下一个Web应用?

《写给前端的python应用指南》系列&#xff1a; &#xff08;一&#xff09;快速构建 Web 服务器 - Flask vs Node.js 对比&#xff08;二&#xff09;深入Flask&#xff1a;理解Flask的应用结构与模块化设计 在上一篇博文中&#xff0c;我们深入探讨了Flask框架&#xff0c;…

网络管理-期末项目(附源码)

环境&#xff1a;网络管理 主机资源监控系统项目搭建 &#xff08;保姆级教程 建议点赞 收藏&#xff09;_搭建网络版信息管理系统-CSDN博客 效果图 下面3个文件的项目目录(python3.8.8的虚拟环境) D:\py_siqintu\myproject5\Scripts\mytest.py D:\py_siqintu\myproject5\Sc…

MySQL 常用程序介绍

以下是一些常用的MySQL程序&#xff1a; 程序名作⽤mysqldMySQL的守护进程即 MySQL 服务器&#xff0c;要使⽤MySQL 服务器 mysqld必须正在运⾏状态mysql MySQL客⼾端程序&#xff0c;⽤于交互式输⼊ SQL 语句或以批处理模式从⽂件执⾏SQL的命令⾏⼯具 mysqlcheck⽤于检查、修…

Redis篇--常见问题篇4--大Key(Big Key,什么是大Key,影响及使用建议)

1、概述 大Key&#xff1a;通常是指值&#xff08;Value&#xff09;的长度非常大&#xff0c;实际上键&#xff08;Key&#xff09;长度很大也算。通常来说&#xff0c;键本身不会很长&#xff0c;占用的内存较少&#xff0c;因此判断一个键是否为bigKey主要看它对应的值的大…

云手机+YouTube:改变通信世界的划时代技术

随着科技的不断进步&#xff0c;手机作为人们生活中不可或缺的工具&#xff0c;也在不断地更新换代。近年来&#xff0c;一个名为“油管云手机”的全新产品正在引起广泛的关注和讨论。作为一个运用最新科技实现的新型手机&#xff0c;它在通信领域带来了全新的体验和革命性的变…

ModbusTCP从站转Profinet主站案例

一. 案例背景 在复杂的工业自动化场景中&#xff0c;企业常常会采用不同品牌的设备来构建生产系统。西门子SINAMICS G120变频器以其高性能、高精度的速度和转矩控制功能&#xff0c;在电机驱动领域应用广泛。施耐德M580可编程逻辑控制器则以强大的逻辑控制和数据处理能力著称&…

JS 函数的定义与调用

文章目录 1. 普通函数-无形参2. 普通函数-有形参3. 普通函数-参数默认值4. 普通函数-返回值5. 立即执行函数6. 匿名函数7. 箭头函数8. 函数提升 1. 普通函数-无形参 函数定义时没有指定形参, 调用时仍然可以向其传递参数, 通过默认参数 arguments 获取, arguments 是一个伪数组…

MySQL的索引失效的原因有那些

1. 数据类型不匹配 详细说明&#xff1a;MySQL在比较不同数据类型的值时&#xff0c;可能会尝试进行隐式转换。如果这种转换导致了复杂度增加或无法直接利用索引&#xff0c;则会导致索引失效。 实例与解决方案&#xff1a; -- 错误示例&#xff1a;数据类型不匹配 select *…

迈向未来:.NET技术的持续创新与发展前景

随着信息技术的飞速发展&#xff0c;编程语言和开发框架不断涌现&#xff0c;许多技术平台以其独特的优势赢得了开发者的青睐。在这场技术的竞争中&#xff0c;.NET平台凭借其卓越的性能、广泛的生态系统以及持续创新的精神&#xff0c;成为了全球开发者的重要选择。本文将探讨…

微信小程序-基于Vant Weapp UI 组件库的Area 省市区选择

Area 省市区选择&#xff0c;省市区选择组件通常与 弹出层 组件配合使用。 areaList 格式 areaList 为对象结构&#xff0c;包含 province_list、city_list、county_list 三个 key。 每项以地区码作为 key&#xff0c;省市区名字作为 value。地区码为 6 位数字&#xff0c;前两…

Canvas指定三角形内部生成随机点

使用重心坐标&#xff08;barycentric coordinates&#xff09;或者通过面积比例的方法来确定点是否在三角形内。不过&#xff0c;对于简单的应用&#xff0c;一种常见的方法是使用随机点并检查它们是否在三角形内部。如果不在&#xff0c;就重新生成&#xff0c;直到得到足够数…

智驾感知「大破局」!新一轮混战开启

随着智能驾驶搭载率的攀升&#xff0c;舱外传感器赛道迎来新变局。 一方面&#xff0c;从近几年智驾传感器的配置变化来看&#xff0c;摄像头的主导地位显而易见。 12月10-12日&#xff0c;由德赛西威总冠名的2024&#xff08;第八届&#xff09;高工智能汽车年会暨年度金球奖…