我看到社区有人需要,刚好我自己也要安装个ubuntu的用在自己的4090服务器上玩一玩。
于是就写一篇这样的教程。但是我只需要他的api推理,用于测试4090合成速度。所以这里只执行Python api.py
环境
1.首先下载整合包,里面有个nltk_data,拿出来打成压缩包等会要用
因为你没有的话,他会自动下载,下载速度很慢,估计是他给的默认资源地址网速不行。
2.克隆项目
https://github.com/RVC-Boss/GPT-SoVITS
3.修改requestments.txt
删除里面的
modelscope==1.10.0Faster_Whisper
新增
einops
4.默认你已经安装好了coda,不会安装的看这个
ubuntu安装python以及conda-CSDN博客
安装
1.首先创建一个虚拟环境
conda create --name gptsovits_conda3 python==3.9.13
2.安装包
进入conda环境
conda activate gptsovits_conda3
pip install -r requirement.txt -i https://pypi.tuna.tsinghua.edu.cn/simple(不要开什么科学上网的东西)
3.将nltk_data压缩包解压到ubuntu的自己用户的目录下
我解压后是在这个目录/root/nltk_data
4.安装ffmpeg
sudo apt install ffmpeg
测试
启动
python3 api.py
启动成功
post请求测试,成功。
ubuntu,4090合成速度大概4秒生成12秒的音频。