近日TTS语音模型在AI圈内热度不小,今天小编就来给大家做了个TTS模型汇总!
GPT-SoVITS(AI 卖货主播大模型Streamer-Sales销冠用的TTS模型)
模型简介:支持英语、日语和中文,零样本文本到语音(TTS),集成工具包。
项目地址:https://github.com/RVC-Boss/GPT-SoVITS
Fish Speech v1.2
模型简介:效果稳定非常好,支持克隆语音。经过 30 万小时的英语、中文和日语音频数据的训练。
项目地址:https://huggingface.co/fishaudio/fish-speech-1.2
字节的Seed-TTS
模型简介:支持多种语言包括英语、中文,能够进行同语言生成和跨语言生成,能处理各种文本,叙述性文本、情感表达、描述性文本等,能根据不同的情感和语境生成相应的语音。
项目地址:https://bytedancespeech.github.io/seedtts_tech_report/
ChatTTS
模型简介:对话式 TTS(可多人),支持中英文,韵律细腻
项目地址:https://huggingface.co/2Noise/ChatTTS/tree/main
HuggingFace的Parler-TTS
模型简介:可以控制音调、速度、性别、噪音水平、情绪特征等等
项目地址:https://huggingface.co/parler-tts
MetaVoice-1B
模型简介:MARS5可以为体育解说、动漫等韵律复杂和多样化的场景生成语音
项目地址:https://github.com/metavoiceio/metavoice-src
MARS5-TTS
模型简介:MARS5可以为体育解说、动漫等韵律复杂和多样化的场景生成语音
项目地址:https://github.com/Camb-ai/MARS5-TTS
OpenVoice
模型简介:原生支持英语、西班牙语、法语、中文、日语和韩语,具有灵活的语音风格控制和零样本跨语言语音克隆能力。
项目地址:https://github.com/myshell-ai/OpenVoice
EmotiVoice
模型简介:支持中英文双语,包含2000多种不同的音色
项目地址:https://github.com/netease-youdao/EmotiVoice/blob/main/README.zh.md
以上就是小编给大家整理汇总的主流的TTS模型以及对应传送门,如果大家有云部署的需求,可以点击下方链接,查看GPU特惠活动:https://www.ucloud.cn/site/active/gpu.html?ytag=gpu_wenzhang_tongyong_toutiao