音频数据集大全(2)-语音合成

1、Speechocean762

简介:一个开源语音语料库,专为发音评估设计。该语料库包含来自250名非母语人士的5000个英语发音,其中一半的人是儿童。五位专家对每个发音进行了句子级、词级和音素级的注释 该语料库允许用于商业和非商业目的

下载链接:openslr.org

2、Hi-Fi Multi-Speaker English TTS Dataset

简介:一个专为训练文本到语音模型而设计的多说话者英语数据集。该数据集基于LibriVox有声读物和Project Gutenberg的文本,均为公共领域。数据集包含大约291.6小时的语音,由10位说话者提供,其中每位说话者至少提供了17小时的语音,以44.1kHz的采样频率

下载链接:http://www.openslr.org/109/

3、RyanSpeech

简介:RyanSpeech是一个用于研究自动文本到语音(TTS)系统的语音语料库。公开可用的TTS语料库通常有噪声,由多个说话者录制,或者没有高质量的男性语音数据。为了满足语音识别领域对高质量、公开可用的男性语音语料库的需求。这个数据集包含了真实对话场景中的文本材料,这些材料包含超过10小时由专业男声演员在44.1kHz下录制的声音。

下载链接:http://mohammadmahoor.com/ryanspeech/

4、AISHELL-3 语⾳合成数据库

简介:AISHELL-3 语音合成数据库是一个大规模的多说话人普通话语料库,用于训练多说话人文本到语音(TTS)系统。该数据库包含大约85小时的情感中性记录,由218名普通话母语者提供。这些母语者的辅助属性,如性别、年龄组和母语口音,都在数据库中明确标记。此外,还提供了汉字级别和拼音级别的转录,以及一些数据处理策略和技术,这些策略和技术与所呈现的数据库特征相匹配,并对多个语音合成系统进行了实验,以评估生成的语音样本的质量,显示出令人满意的结果。

下载链接:https://openslr.magicdatatech.com/resources/93/data_aishell3.tgz

5、RUSLAN

简介:RUSLAN语音合成数据集是一个专门用于俄语口语合成的数据集。我们可以看到,RUSLAN语音合成数据集主要关注于俄语口语的合成和识别,而不是其他语言或多语言环境下的语音合成。这个数据集可能包含了大量的俄语口语材料,这些材料被用来训练和评估语音合成系统。

下载链接:RUSLAN: Russian Spoken Language Corpus For Speech Synthesis

  1. 6、VocBench

简介:VocBench语音合成数据集是一个专门用于评估神经声码器(neural vocoders)的框架,它通过系统性研究来比较不同的神经声码器在一个共享环境中的表现。该数据集的目的是为了公平地比较这些神经声码器之间的性能,并且展示了每个声码器合成样本的竞争效率和质量

下载链接:GitHub - facebookresearch/vocoder-benchmark: A repository for benchmarking neural vocoders by their quality and speed.

7、Silent Speech EMG

简介:Silent Speech EMG语音合成数据集主要涉及通过肌肉活动(EMG)信号来实现无声语音的技术。这种技术允许用户在不发出任何声音的情况下,通过肌肉活动来表达自己的意图或情感。

下载链接:GitHub - dgaddy/silent_speech: Code for voicing silent speech from EMG. Official repository for the papers "Digital Voicing of Silent Speech" at EMNLP 2020 and "An Improved Model for Voicing Silent Speech" at ACL 2021. Also includes code for converting silent speech to text.

8、Arabic Speech Corpus

简介:阿拉伯语语音语料库(1.5 GB)是用于语音合成的现代标准阿拉伯语(MSA)语音语料库。该语料库包含超过3.7小时的MSA语音的语音和拼写转录,与音素级别上的记录语音一致。注释包括单个音素上的单词重音标记。语音语料库是南安普顿大学的纳瓦·哈拉比博士学位工作的一部分。该语料库是使用专业工作室用南黎凡特阿拉伯语(大马士革口音)录制的。使用该语料库作为输出的合成语音产生了高质量、自然的声音。

下载链接:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/13735.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

adb 汇总

常用命令 adb devices 查看链接设备列表 adb kill-server 关闭并清楚所有链接 adb connect 设置链接 adb tcpip 该条命令是设置网络adb监听的端口,5555是默认,也可以设置其他的,在安卓设备重启后会失效,不需要root权限&#x…

vue 拷贝

在 Vue.js 中,拷贝对象或数组是常见的操作,尤其是在处理状态管理或数据变更时。Vue 2 和 Vue 3 都提供了多种方法来实现对象和数组的拷贝。以下是详细的说明和示例: Vue 2 中的拷贝 1. 浅拷贝 浅拷贝只复制对象或数组的第一层属性,深层属性仍然引用原对象或数组。 使用 …

【C++】多态(多态的原理)

在本篇博客中,作者将会带领你深入理解C中的多态。 声明!!!本代码以及讲解都是在32位机器下进行完成的,64位机器下会有所不同,但大同小异。 一.多态的概念 什么是多态? 多态就是不同的对象去做…

Linux如何通过md5校验远程传输的内容的完整性(随手记)

对需要校验的文件生成md5值,并保存 find /etc/ -type f | xargs md5sum > etc.md5校验 md5sum --check etc.md5Linux 中的 md5sum 命令 md5sum 是一个在 Linux 和 Unix 系统中广泛使用的命令行工具,用于计算和检查文件的 MD5(Message D…

cudnn是什么

NVIDIA cuDNN(CUDA Deep Neural Network)是用于深度神经网络的GPU加速库。 它强调性能、易用性和低内存开销。 NVIDIA cuDNN可以集成到更高级别的机器学习框架中,如加州大学伯克利分校的流行caffe软件。简单的,插入式设计可以让…

bash: nvidia-smi: command not found

服务器突然输入: nvidia-smi 出现: bash: nvidia-smi: command not found 确认nvidia-smi的安装路径,通常其位于/usr/bin/目录下,用如下的命令来检查: ls /usr/bin/nvidia-smi如果文件不存在,则 cd /…

简易CAD程序:Qt多文档程序的一种实现

注&#xff1a;文中所列代码质量不高&#xff0c;但不影响演示我的思路 实现思路说明 实现DemoApplication 相当于MFC中CWinAppEx的派生类&#xff0c;暂时没加什么功能。 DemoApplication.h #pragma once#include <QtWidgets/QApplication>//相当于MFC中CWinAppEx的派生…

以太坊(3)——智能合约

智能合约 首先明确一下几个说法&#xff08;说法不严谨&#xff0c;为了介绍清晰才说的&#xff09;&#xff1a; 全节点矿工 节点账户 智能合约是基于Solidity语言编写的 学习Solidity语言可以到WFT学院官网&#xff08;Hello from WTF Academy | WTF Academy&#xff09;…

以x为界,分隔链表为两个分区,各分区内元素相对位置不变

题目描述&#xff1a; 题目思路&#xff1a; 1.设置两个头指针表示两个分区&#xff0c;并对每个分区设置相对于的遍历指针&#xff0c;指向分区链表链尾 2.设置原链表的遍历指针&#xff0c;判断指针所指元素是否小于目标值x&#xff0c;小于的话将结点添加到第一个分区末尾…

C# 中combobox 控件初始化

怎么获取绑定数据的combobox的选中值及选中text 1、绑定combobox的代码如下&#xff1a; DataTable LDT_CodeType Models.MoCodefile.GetCodeType(); if (LDT_CodeType ! null) { cboxCtype.DataSource LDT_CodeType; cboxCtype.DisplayMember codetypename; cboxCtype.Val…

搭建电商电子商务平台有哪些好用的电商API数据采集接口?

电商API接口主要用于帮助开发者将电商功能集成到自己的应用程序中&#xff0c;实现诸如商品检索、商品价格数据获取、订单处理、支付、物流跟踪等功能。以下是一些常用的电商API接口提供商&#xff1a; 主流电商平台API&#xff1a; 淘宝开放平台&#xff1a;提供淘宝、天猫、…

探索Ollama——入门:如何在本地环境中搭建和自定义大型语言模型

探索Ollama——入门&#xff1a;如何在本地环境中搭建和自定义大型语言模型 介绍Ollama 在当今快速发展的人工智能时代&#xff0c;大型语言模型&#xff08;LLMs&#xff09;已经成为技术前沿的热点话题。Ollama&#xff0c;作为一个开创性的工具&#xff0c;使得开发者能够…

ngnix 入门 二,docker启动nginx, 安装ssl 证书,使用配置文件,映射后端服务 ,提供给前端项目访问

搭建生产环境真不是人做的事&#xff0c;特别是对于一知半解的人。仅以此文献给各位技术人 说一下背景&#xff1a;项目前后端分离&#xff0c;前端 vue3 、小程序端 &#xff0c;后端 go 提供服务。 微信小程序需要使用 https 请求。 这就必须让我们想到nginx 了 想要达到的…

MySQL学习之DQL语句(数据查询语言)

准备SQL CREATE TABLE student ( id int, -- 编号 name varchar(20), -- 姓名 age int, -- 年龄 sex varchar(5), -- 性别 address varchar(100), -- 地址 math int, -- 数学 english int -- 英语 );INSERT INTO student(id,NAME,age,sex,address,math,english) VALUES (1,…

LeetCode88.合并两个有序数组

题目链接&#xff1a; 88. 合并两个有序数组 - 力扣&#xff08;LeetCode&#xff09; 分析&#xff1a;普通的数组合并&#xff0c;这里还可以提供两个其它思路。可以用最笨的办法&#xff0c;把nums2的每个元素都移动到nums1里面&#xff0c;然后做排序&#xff0c;直接用s…

【UE5.1 角色练习】02-添加慢走、快速跑、蹲伏功能

目录 前言 步骤 一、慢走 二、快速跑 三、蹲伏 前言 在上一篇文章基础上&#xff08;【UE5.1 角色练习】01-使用小白人蓝图控制商城角色移动&#xff09;继续实现角色的慢走、快速跑以及蹲伏功能 步骤 一、慢走 1. 打开项目设置&#xff0c;添加一个操作映射&#x…

思维导图-VPN

浏览器集成了受信任的机构的证书

linux---信号的捕捉和处理

提示&#xff1a;以下是本篇文章正文内容&#xff0c;下面案例可供参考 一、信号 可以简单理解为信号是一个进程给另一个信号发消息&#xff0c;进程收到对应的信号就执行对应的方法&#xff0c;linux信号可以分为实时信号和非实时信号 1-31为非实时信号&#xff0c;34-64为…

猫狗分类识别④滤波去噪

一、依赖库 pip install opencv-python 二、滤波去噪说明 中值滤波和高斯滤波各有优缺点&#xff0c;哪种滤波方法更好取决于具体的应用场景和图像中的噪声类型。中值滤波对于去除椒盐噪声&#xff08;即黑白点噪声&#xff09;特别有效&#xff0c;因为它通过取邻域像素的中…

php抖音详情和关键词搜索api

抖音详情和关键词搜索的 API 可以通过抖音提供的开放平台来获取。以下是使用 PHP 实现的示例代码&#xff1a; 获取抖音视频详情 API&#xff1a; 获取Key和secret请移步 <?php$accessToken YOUR_ACCESS_TOKEN; // 替换为自己的 access_token $itemId YOUR_ITEM_ID; /…