近日,一个名为 ChatTTS 文本转语音模型的项目在github上横空出世,一经推出便引发极大关注,短短四天时间,已经狂揽了14.2k的Start量。
ChatTTS是一款专为对话场景设计的支持中英文的文本转语音(TTS)模型,基于约10万小时的中英文数据进行训练,能够生成高质量、自然流畅的对话语音。ChatTTS针对对话式任务进行了优化,实现了更自然、流畅的语音合成,同时支持多说话人,还具备细粒度控制能力,能够预测和控制韵律特征,如笑声、停顿等,超越了大部分开源TTS模型。
ChatTTS-国产开源文本转语音模型
ChatTTS的功能特色
多语言支持:ChatTTS的一个关键特性是支持多种语言,包括英语和中文。这使其能够为广泛用户群提供服务,并克服语言障碍。
大规模数据训练:ChatTTS 使用了大量数据进行训练,大约有1000万小时的中文和英文数据。这样的大规模训练使其声音合成质量高,听起来自然。
对话任务兼容性:ChatTTS 很适合处理通常分配给大型语言模型LLMs的对话任务。它可以为对话生成响应,并在集成到各种应用和服务时提供更自然流畅的互动体验。
开源计划:项目团队计划开源一个经过训练的基础模型。这将使学术研究人员和社区开发人员能够进一步研究和发展这项技术。
控制和安全性:团队致力于提高模型的可控性,添加水印,并将其与LLMs集成。这些努力确保了模型的安全性和可靠性。
易用性:ChatTTS 为用户提供了易于使用的体验。它只需要文本信息作为输入,就可以生成相应的语音文件。这样的简单性使其方便有语音合成需求的用户。
就在今天,ChatTTS官网已上线,文本转语音功能可以在官网上在线免费使用,调整后生成的语音情感、语气效果十分惊艳,感兴趣的朋友可以官网测试体验。
ChatTTS官方入口如下:
ChatTTS中文官网:https://chattts.com/zh
GitHub项目地址:https://github.com/2noise/ChatTTS
Hugging Face模型地址:https://huggingface.co/2Noise/ChatTTS
注:部分内容来源于ChatTTS官网
结语
本文首发于同名宫棕号,欢迎关注获取最新前沿快讯。