生成多人播客:
Comfyui-ChatTTS是一个开源的GitHub项目,致力于为ComfyUI添加语音合成功能。该项目提供了一系列功能强大的节点和模型,支持用户创建和复用音色,支持多人对话模式的生成,并提供了导出音频字幕文件的功能。
项目包含多个关键节点,如ChatTTS、Multi Person Podcast、CreateSpeakers,以及SaveSpeaker和LoadSpeaker,后者使得音色的保存和加载变得非常方便。用户可以通过这些节点生成多角色的对话音频,并在需要时复用先前创建的音色。此外,项目还提供了Load Whisper Model和Whisper Transcribe节点,这些节点可以方便地将音频文件转录为字幕文本文件。
一个显著的特点是项目支持OpenVoiceClone节点,这使得音色迁移更加容易,从而更好地控制角色的声音。用户可以通过加载不同的模型和音色文件,实现对角色声音的精细控制。
模型文件可以从Hugging Face平台下载并放置在指定的文件夹中,如models/chat_tts、models/chat_tts_speaker、models/open_voice和models/whisper/large-v3。
项目还包含一个课程示例代码,以ChatTTS为例,展示了如何为ComfyUI增加语音合成功能。这个示例代码详细介绍了自定义节点的实现方法,包括后端Python代码的编写和节点界面的修改。
通过该项目,用户可以在ComfyUI中实现复杂的语音合成任务,创建个性化的音色和对话模式,并且能够方便地导出音频和字幕文件。项目的开放性和强大的功能使其成为语音合成领域的一个重要工具。
https://github.com/shadowcz007/Comfyui-ChatTTS
备注:comfyui