0x00 前言
ChatTTS是专门为对话场景设计的文本转语音模型,例如大语言助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。目前在huggingface中的开源版本为4万小时训练且未SFT的版本。
0x01 准备环境
版本 | |
---|---|
操作系统 | Win10 |
conda | 3.x |
python | 3.8 |
0x02 安装依赖库
- 确认cuda版本
C:\Users\【楼主】>nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2019 NVIDIA Corporation
Built on Sun_Jul_28_19:12:52_Pacific_Daylight_Time_2019
Cuda compilation tools, release 10.1, V10.1.243
- 找到cuda对应的torch可用版本
访问pytorch官网,因为cuda版本较低,就高只能对应到torch的1.8.1版本
https://pytorch.org/get-started/previous-versions/
安装
3. 在requirements.txt中删除torch相关库,进行安装。
修改后文件内容如下:
numpy<2.0.0
numba
tqdm
vector_quantize_pytorch
transformers>=4.41.1
vocos
IPython
gradio
pybase16384
pynini==2.1.5; sys_platform == 'linux'
WeTextProcessing; sys_platform == 'linux'
nemo_text_processing; sys_platform == 'linux'
av
pydub
执行安装:
pip install -r requirements.txt
安装结束
0x03 运行webui
执行代码
python examples/web/webui.py
0x04 参考文献
https://blog.csdn.net/imok1234567/article/details/140134761
https://www.itfaba.com/jishufenxian/166789.html
https://zhuanlan.zhihu.com/p/700915759
https://blog.csdn.net/weixin_43863487/article/details/139582305