原文不能收藏,转发,就写这里了:语音行业有什么好用的开源噪声库吗?
- Audio research group - Tampere University - Datasets 这里面很多,下载比较麻烦点,需要找需要的
2. http://www.cs.tut.fi/sgn/arg/dcase2017/challenge/task-acoustic-scene-classification
3. 语音和噪声相关数据集(持续更新) - 凌逆战 - 博客园 :
目录
语音数据集
TIMIT
VCTK
AISHELL-ASR0009-OS1 开源中文语音数据库
Mozilla Common Voice
Tatoeba
日语数据集
气导骨导数据集
噪声数据集
noise-92
NOIZEUS数据集
DEMAND
PNL 100 Nonspeech Sounds
rnnoise_ontributions
COUGHVID 众包数据集
ESC-50:环境声音分类数据集
ESC环境噪音分类数据集
DESED dataset
DISCO
婴儿啼哭数据集
风噪数据集
YouTube--ASMR noise
FSD50K
MS-SNSD
QUT-NOISE
freesound-datasets
STARSS22:Sony-TAu Realistic Spatial Soundscapes 2022
VOICe Dataset
In-Vehicle Noise Dataset
Vehicle Interior Sound Dataset
MAVD交通数据集
Dataset-AOB:城市声音事件分类
CHiME-Home
UrbanSound
UrbanSound8K
SONYC Urban Sound Tagging
Isolated urban sound database
Acoustic Event Dataset
BBC音效
NAR 数据集
asr-noises
音乐数据集
DCASE
综合数据集
MUSAN
FSDnoisy18k
DS_10283_2791
CSTR NAM TIMIT Plus
参考
4. 希尔贝壳-专注于人工智能大数据和技术的创新
语音行业有什么好用的开源噪声库吗?
像是asr asv等等领域,我们经常要用噪声来做数据增强提升模型鲁棒性,那么有什么好用的开源噪声库吗?
我最喜欢用的就是openslr里面录制的混响和加性噪声~
混响的:http://www.openslr.org/resources/28/rirs_noises.zip
这个混响包含了real和simulated,用的比较多是simulated中的小房间中房间,对应房间大小分别是1~10m和10~30m
加性的:http://www.openslr.org/resources/17/musan.tar.gz
这个加性包含人声babble,音乐背景声和真实噪声。这两个噪声库强烈推荐Mark上~
另外就是用sox改改音速和音量,这些dither也可以纳入考虑
发布于 2019-03-25 12:29
赞同 3715 条评论分享
收藏喜欢
传统的开源噪声库有:
NOISEX-92
DEMAND
CHIME CHELLENGE里的噪声源
以上都是专门针对噪声鲁棒性训练和评价设计的噪声库。缺点是都比较小。
还有其他两个option:
~ 可以试试训练声音事件分类器用的数据集,比如AudioSet,数据很大。
~ 或者花钱买电影音效库,比如bbc什么的。数据很多,质量高。就是不便宜。
————————————————————
我用的不算专用的噪音库,是一个声学场景分类的噪音,场景比较多,但是不是非常符合噪音这个范畴,可以用来做aec。
TUT dataset:
Acoustic scenes for the task (15):
- Bus - traveling by bus in the city (vehicle)
- Cafe / Restaurant - small cafe/restaurant (indoor)
- Car - driving or traveling as a passenger, in the city (vehicle)
- City center (outdoor)
- Forest path (outdoor)
- Grocery store - medium size grocery store (indoor)
- Home (indoor)
- Lakeside beach (outdoor)
- Library (indoor)
- Metro station (indoor)
- Office - multiple persons, typical work day (indoor)
- Residential area (outdoor)
- Train (traveling, vehicle)
- Tram (traveling, vehicle)
- Urban park (outdoor)
Acoustic scene classificationwww.cs.tut.fi/sgn/arg/dcase2017/challenge/task-acoustic-scene-classification编辑
有个可推荐的,不仅仅是噪声。
sox。SOund eXchange lib。
是个音频特效库。包括回声,变调,变速,带通等等。
但噪声方面比较弱,只自带了各种波形的发生器,自然环境噪声需要自己搜集一些音频文件。
最大的缺点是只能用文件到文件的模式处理音频,使用tmpfs可以有效缓解这个问题。