项目介绍
ChatTTS是一款专为优化对话场景而生的语音生成模型,尤其匹配大型语言模型(LLM)的交互需求,以及生成对话式音频、视频旁白等应用场景,无缝覆盖中英文双语。
通过汲取约100,000小时的高质量中英语音数据进行深度训练,ChatTTS在语音合成领域彰显出卓越的自然度与逼真效果。
该模型的亮点集中体现在多语言能力、超大规模数据驱动的高保真输出、对LLM对话任务的卓越适配性,以及对未来开源计划的展望。
它不仅跨越语言界限,服务于多元化用户群体,还凭借其百万小时级数据训练的深厚底蕴,确保语音合成既流畅又自然,特别适合融入复杂的对话交互系统。
github
地址:https://github.com/2noise/ChatTTS
项目使用
这里并没有直接使用官方的包,而采用社区开发者制作的一键部署整合包。
此项目基于 ChatTTS
,支持流式输出、音色抽卡、长音频生成和分角色朗读。
github
地址:https://github.com/6drf21e/ChatTTS_colab
独有功能
音色抽卡
根据自己的需求选择合适的音色。
长音频生成
分段处理,最终输出的音频是将这些音频段合成后的结果,且支持流式生成音频,一边播放一遍推理。
角色扮演
脚本格式 角色::文本 一行为一句”。
项目安装
1、安装 Conda
(如果尚未安装)。
2、打开终端,创建一个新的 conda
环境:
conda create -n "ChatTTS_colab" python=3.11
3、激活刚创建的环境:
conda activate ChatTTS_colab
4、克隆项目仓库到本地:
git clone git@github.com:6drf21e/ChatTTS_colab.git
5、手动安装 ChatTTS
依赖到项目目录:
cd ChatTTS_colab
git clone https://github.com/2noise/ChatTTS
cd ChatTTS
git checkout -q f4c8329
cd ..
mv ChatTTS temp
mv temp/ChatTTS ./ChatTTS
rm -rf temp
6、在项目目录安装 ChatTTS_colab
所需的依赖:
pip install -r requirements-macos.txt
7、运行项目,等待自动下载模型:
python webui_mix.py
# Loading ChatTTS model...
一切正常的话会自动打开浏览器,显示项目介绍中的界面。
– 欢迎点赞、关注、转发、收藏【我码玄黄】,gonghao同名