最近有时间继续研究一下各种有趣的开源项目,一个叫ChatTTS的项目吸引了我的注意,这个项目可以把文本转换成语音,配合gpt生成文本,可以直接用于生产有声书作品了,这可以说是直接的生产力项目了。
项目对显存的要求不高,只需要4G显存即可使用,可以说非常的经济适用了。
项目支持中文和英文
项目地址:https://github.com/2noise/ChatTTS
社区维护的Awesome项目:https://github.com/libukai/Awesome-ChatTTS
简单上手的webui项目:https://github.com/jianchang512/ChatTTS-ui
我们就以webui项目来进行测试
1.环境搭建
为了方便使用,我使用Windows环境进行搭建项目,首先根据项目要求,需要创建pytorch2.2.0 cuda118,python大于3.9,小于3.11的环境,还是使用Anaconda创建虚拟环境
conda create -n chattts python=3.10
conda activate chattts
激活环境后,最重要的是先安装pytorch和pytorchaudio模块,建议下载whl文件进行安装,下载地址:https://download.pytorch.org/whl/cu118
选择需要下载的pytorch文件:torch-2.2.0+cu118-cp310-cp310-win_amd64.whl
和torchaudio-2.2.0+cu118-cp310-cp310-win_amd64.whl
安装之前最好先手动卸载一下当前环境预装的torch和torchaudio,如果没有,可以先忽略
# pip uninstall torch
# pip uninstall torchaudio
# 在conda的终端中切换到下载文件所在目录
pip install torch-2.2.0+cu118-cp310-cp310-win_amd64.whl
pip install torchaudio-2.2.0+cu118-cp310-cp310-win_amd64.whl
2.下载项目安装依赖
切换到你的工作目录
git clone https://github.com/jianchang512/ChatTTS-ui.git
conda终端切换到项目中,然后安装项目依赖
pip install -r requirements.txt
3.运行项目
之前在运行项目之前我们通常会去下载模型文件,由于该项目默认从魔搭社区获取模型文件,所以不需要去下载模型文件了。
python app.py
等待项目启动,启动后浏览器自动打开UI界面
这里我在网上找了个段子,在使用默认设置的情况下直接生成语音,效果还算可以。