本地部署 Qwen-Audio-Chat

Qwen-Audio-Chat 介绍
Qwen-Audio Github 地址
部署 Qwen-Audio-Chat
- 安装 ffmpeg
- 克隆代码库
- 创建虚拟环境
- 使用 pip 安装 pytorch
- 使用 pip 安装依赖
- 使用 ModelScope
- 运行 Web UI

Qwen-Audio-Chat 介绍

Qwen-Audio-Chat是通用语音多模态大规模语言模型，因此它可以完成多种音频理解任务。在本教程之中，我们会给出一些简明的例子，用以展示Qwen-Audio-Chat在语音识别，语音翻译，环境音理解，多音频理解和语音定位(根据指令截取语音中指定文本的片段)等多方面的能力。

Qwen-Audio Github 地址

https://github.com/QwenLM/Qwen-Audio

部署 Qwen-Audio-Chat

安装 ffmpeg

sudo apt install ffmpeg

克隆代码库

git clone https://github.com/QwenLM/Qwen-Audio.git
cd Qwen-Audio

创建虚拟环境

conda create -n qwenaudio python=3.10 -y
conda activate qwenaudio

使用 pip 安装 pytorch

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

验证 cuda 可用，

python -c "import torch;print(torch.cuda.is_available());"

使用 pip 安装依赖

pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/

安装 flash-attn，

git clone https://github.com/Dao-AILab/flash-attention; cd flash-attention
# 20231209 时点最新是 flash-attn-2.3.6 版本
pip install flash-attn --no-build-isolation
# 下方安装可选，安装可能比较缓慢。
pip install csrc/layer_norm
pip install csrc/rotary

使用 ModelScope

安装 modelscope，

pip install modelscope -i https://mirrors.aliyun.com/pypi/simple/

修改 web_demo_audio.py 使用 ModelScope，

cp web_demo_audio.py webui.py

vi webui.py --- add
from modelscope import (snapshot_download, AutoModelForCausalLM, AutoTokenizer, GenerationConfig
)
import torch
model_id = 'qwen/Qwen-Audio-Chat'
revision = 'master'model_dir = snapshot_download(model_id, revision=revision)
torch.manual_seed(1234)
------ modify# tokenizer = AutoTokenizer.from_pretrained(#     args.checkpoint_path, trust_remote_code=True, resume_download=True,# )tokenizer = AutoTokenizer.from_pretrained(model_dir, trust_remote_code=True)if not hasattr(tokenizer, 'model_dir'):tokenizer.model_dir = model_dir
------ modify# model = AutoModelForCausalLM.from_pretrained(#     args.checkpoint_path,#     device_map=device_map,#     trust_remote_code=True,#     resume_download=True,# ).eval()# model.generation_config = GenerationConfig.from_pretrained(#     args.checkpoint_path, trust_remote_code=True, resume_download=True,# )model = AutoModelForCausalLM.from_pretrained(model_dir, device_map="auto", trust_remote_code=True).eval()
---

运行 Web UI

pip install -r requirements_web_demo.txt -i https://mirrors.aliyun.com/pypi/simple/

创建 webui.sh，

eval "$(conda shell.bash hook)"
conda activate qwenaudio
CUDA_VISIBLE_DEVICES=0
python webui.py  --server-name 0.0.0.0 --server-port 8001

随后运行如下命令，并点击生成链接：

./webui.sh

完结！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/217973.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

本地部署 Qwen-Audio-Chat

本地部署 Qwen-Audio-Chat

Qwen-Audio-Chat 介绍

Qwen-Audio Github 地址

部署 Qwen-Audio-Chat

安装 ffmpeg

克隆代码库

创建虚拟环境

使用 pip 安装 pytorch

使用 pip 安装依赖

使用 ModelScope

运行 Web UI

相关文章

Spring Boot 3 整合 Mybatis-Plus 动态数据源实现多数据源切换

什么是循环依赖，如何解决

广东省工业和信息化厅工业互联网处一行莅临科东软件考察调研

学习笔记——GDB调试器

Redis缓存异常问题，常用解决方案总结

华为OD试题一(磁盘容量排序、数大雁、计算疫情扩散时间)

TUP实现一对一聊天

道可云元宇宙每日资讯｜上海市区块链关键技术攻关专项项目立项清单公布

Appium 自动化测试 —— Appium的环境搭建与设置流程！

Python键鼠控制之PyAutoGUI方法

如何通过3D人脸扫描设备制作一个3D超写实虚拟人？

Django 模型操作（六）

FPGA UltraScale GTY 全网最细讲解，aurora 8b/10b编解码，HDMI视频传输，提供vivado工程源码和技术支持

Datawhale聪明办法学Python（task2Getting Started）

微积分-三角函数

羊大师解答，羊奶的中医奇妙之处

Linux --绘制地图投影出现报错：无法成功下载地图背景数据

华清远见嵌入式学习——QT——作业4

Github仓库远程操作——简单版

解决pytorch训练的过程中内存一直增加的问题