超强的文本转语音模型ChatTTS,一键打包,免费使用
- 项目简介
- 项目亮点
- 安装使用
- python 代码直接引入
- 一键启动包
- 安装部署 ChatTTS webUI
- 小结一下
文本转语音(TTS)在生活中的应用非常的广泛,比如有声小说、语音导航,视频配音和智能家居控制等。
今天给大家推荐一个超强的TTS文本转语音应用,适用于自然、对话式文本转语音,特别适用于大型语言模型助手的对话任务,以及诸如对话式音频和视频配音等,并且可以免费使用。
项目简介
ChatTTS是专门为对话场景设计的文本转语音模型,支持多人同时对话,适用的场景非常丰富,比如LLM助手对话任务,视频配音等。同时支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练,功能非常的强大。
项目亮点
ChatTTS不仅提升了文本转语音技术的实用性,也为对话式交互带来了更加真实和生动的体验,其具备的以下的亮点:
- 对话式优化:它通过优化语音合成过程,实现了更加自然和流畅的语音输出。这项技术特别适用于需要模拟真实对话场景的应用,如聊天机器人和虚拟助手。
- 多说话人支持:ChatTTS不仅能够提供单一声音的语音输出,还支持多种不同的声音选项,使得对话体验更加丰富和个性化。
韵律特征预测:该技术能够精准预测并控制语音中的韵律特征,包括但不限于笑声、停顿和插入词等细微的语音元素。 - 个性化调整:通过细粒度控制,ChatTTS允许用户根据对话的上下文和情感需求,对语音的韵律进行个性化调整,从而使得语音输出更加贴近真实人类的交流方式。
- 超越性韵律:在韵律的表现上,ChatTTS超越了大多数现有的开源文本转语音模型,提供了更加自然和富有表现力的语音。
- 预训练模型:为了促进研究和进一步的开发,ChatTTS还提供了预训练模型,这为研究人员和开发者提供了一个强大的起点,以便他们可以在此基础上进行定制和优化。
安装使用
python 代码直接引入
chaTTS有多种使用方式,支持在python代码中以库的形式引入使用:
import ChatTTS
from IPython.display import Audiochat = ChatTTS.Chat()
chat.load_models(compile=False) # 设置为True以获得更快速度texts = ["在这里输入你的文本",]wavs = chat.infer(texts, use_decoder=True)torchaudio.save("output1.wav", torch.from_numpy(wavs[0]), 24000)
一键启动包
ChatTTS webUI 是github上的开源版项目,为 ChatTTS 提供了一个简单的本地网页界面,就可以直接在网页使用 ChatTTS 将文字合成为语音,支持中英文、数字混杂,并提供API接口。网页界面如下:
安装部署 ChatTTS webUI
- 从项目仓库下载zip压缩包,解压后双击
app.exe
即可使用:
- 从网盘下载
支持从百度网盘、123网盘和huggingface下载安装包,相关下载地址如下:- 百度网盘下载: https://pan.baidu.com/s/1GKa9pBq_MYtOPVJxCnZLJw?pwd=p8d5
- 123网盘下载:https://www.123pan.com/s/03Sxjv-GoyB3.html
- huggingface link: https://huggingface.co/spaces/mortimerme/s4/resolve/main/ChatTTS-UI-0.89.7z?download=true
小结一下
ChatTTS是专门为对话场景设计的文本转语音模型,支持多人同时对话,适用的场景非常丰富,不仅提升了文本转语音技术的实用性,也为对话式交互带来了更加真实和生动的体验。
ChatTTS webUI 为 ChatTTS 提供了一个简单的本地网页界面,可以直接在网页使用 ChatTTS 将文字合成为语音,让我们可以更加方便地使用 ChatTTS 。
更多详细内容,可以到项目仓库查看:
- ChatTTS 项目地址:https://github.com/2noise/ChatTTS
- ChatTTS webUI 项目地址:https://github.com/jianchang512/ChatTTS-ui