文章目录
- An Open Dataset of Synthetic Speech
- key points
- ODSS数据集
- 局限性
An Open Dataset of Synthetic Speech
会议/期刊:WIFS 2023
作者:
key points
一个由合成语音和自然语音组成的多语言、多说话人数据集ODSS,旨在促进合成语音检测的研究和基准测试。
是由156个声音生成的合成语音,跨越三种语言,即英语、德语和西班牙语,具有平衡的性别代表性。
为研究人员提供来自不同说话者、语言和说话风格的全面多样的语音样本,包括真实语音样本和使用文献中可用的最新文本到语音(TTS)语音合成模型生成的合成语音样本。
数据集是从开源TTS数据集聚合的语音数据生成的。
该数据集的主要缺点是生成的数据没有