音频降噪之人声分离

音频降噪

Ultimate Vocal Remover GUI v5.5.1工具使用

1:是什么

集成目前最先进的从音频文件中分离人声的源分离模型。
本工程,将Ultimate Vocal Remover GUI v5.5.1界面工具,改写成可以在服务器端批量推理的工具。
界面仓库地址:https://github.com/Anjok07/ultimatevocalremovergui

2: 有哪些功能

暂不支持两种模型联合处理。

(1)VR Architecture:

具有9种模式的模型,这些模型使用幅度谱图进行信源分离(VR是索尼的AI算法)
1)1_HP-UVR.pth:针对乐器伴奏的模型,1,效果比2_HP-UVR还差一点
2)2_HP-UVR.pth:上个模型微调版本,1,人声分离效果没有3_HP-Vocal-UVR好
3)3_HP-Vocal-UVR.pth:强化人声提取,1,还可以,但是重点噪音的地方,存在把主要人声也去掉的现象

4)4_HP-Vocal-UVR.pth:上一个模型微调版,比上一个版本更激进,1,跟3_HP-Vocal-UVR差不太多

5)5_HP-Karaoke-UVR.pth:分离主要人声,能够去掉背景人声 ,1,效果一般
6)6_HP-Karaoke-UVR.pth: 分离主要人声,能够去掉背景人声
7)7_HP2-UVR.pth: 使用更多数据集和新参数训练出的更强大的乐器模型
8)8_HP2-UVR.pth:上一个模型微调版
9)9_HP2-UVR.pth:上一个模型微调版

(2)MDX-Net:

具有5种模式的模型,这些模型使用混合频谱/波形进行源分离(处理高音质音频的AI算法,对人声的识别提取能力强大,就是慢一些)
1)UVR_MDXNET_1_9703.onnx:在SDR上得分9.703 ,1,效果没有VR Architecture或者Demucsv4好
2)UVR_MDXNET_2_9682.onnx:在SDR上得分9.682
3)UVR_MDXNET_3_9662.onnx:在SDR上得分9.662
4)UVR_MDXNET_KARA.onnx:分离主要人声,保留背景人声,1,不知是否参数设置有问题,效果很差
5)UVR_MDXNET_main.onnx:MDX-Net最强也是最耗资源的模型

(3)Demucs:

支持v1-v4:这些模型使用混合频谱/波形进行源分离(Demucs是Facebook开源的声音分离模型,可以分离人声和乐器)
1) v4 | hdemucs_mmi :1,混合 Demucs v3模型重新训练
2)v4 | htdemucs ;1,v4第一个默认版本
3) v4 | htdemucs_ft :1, htdemucs微调版本,分离将花费4倍的时间 但可能会好一点。与第一个版本相同的训练集。
4) v4 | htdemucs_6s : 1 ,6 个轨道版本,对人声剥离的比较干净,感觉人声分离的最清晰
5) v4 | UVR_Model_ht
6) v3 | UVR_Model_Bag
7) v3 | UVR_Model_2
8) v3 | UVR_Model_1
9) v3 | repro_mdx_a_time
10) v3 | repro_mdx_a_hybrid
11) v3 | repro_mdx_a
12) v3 | mdx_q
13) v3 | mdx_extra_q
14) v3 | mdx_extra:1
15) v3 | mdx :1 ,之前比赛里的第1名,最高质量的模型
官网仓库地址:https://github.com/facebookresearch/demucs
网络结构:
double U-Net encoder/decoder structure。
在这里插入图片描述
一个轨道一个模型,除了htdemucs_6s,其他,比如htdemucs与htdemucs_ft等,均4个音轨道,分别[“drums”,“bass”,“other”,“vocals”],每个模型结构一样,输入一段音频频谱,输出一段对应音轨的音频频谱。htdemucs_6s包含6个音轨道模型,分别为[“drums”,“bass”,“other”,“vocals”,“guitar”,“piano”]
滑窗:

segment = int(model.samplerate * model.segment) #一般是固定的
stride = int((1 - overlap) * segment) #滑窗步长,跟overlap有关,overlap默认0.25,此时stride=257985
offsets = range(0, length, stride) #length为音频长度

3:怎么用

0,
下载源界面仓库工程,地址:https://github.com/Anjok07/ultimatevocalremovergui
脚本仓库地址:https://download.csdn.net/download/jiafeier_555/88085675?spm=1001.2014.3001.5501
将脚本仓库地址脚本添加到源界面仓库工程,按源界面仓库工程要求配置环境,即可跑通。
1,配置参数

inputPaths: "./wav" #音频文件夹
export_path: "./wav_result" #人声分离后的结果保存
chosen_process_method_var: "MDX-Net"    # MDX-Net,Demucs,VR Architecture,Ensemble Mode
demucs_model_var: htdemucs_6s  #v4 | UVR_Model_ht,v4 | htdemucs_6s,v4 | htdemucs_ft,v4 | htdemucs,v4 | hdemucs_mmi
mdx_net_model_var: UVR_MDXNET_KARA  #UVR_MDXNET_1_9703,UVR_MDXNET_KARA
vr_model_var: 3_HP-Vocal-UVR  #5_HP-Karaoke-UVR,4_HP-Vocal-UVR ,3_HP-Vocal-UVR,2_HP-UVR,1_HP-UVR
is_primary_stem_only_var: True  #True:表示只输出人声音频
aggression_setting:  4 #VR Architecture算法模式下,除燥的强度

2,运行脚本

python infer.py

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/8499.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

APISIX 安全评估

背景 有大佬已经对 [apisix攻击面](https://ricterz.me/posts/2021-07-05-apache-apisix-attack- surface-research.txt)做过总结。 本文记录一下自己之前的评估过程。 分析过程 评估哪些模块? 首先我需要知道要评估啥,就像搞渗透时,我得…

Springboot项目打包war配置详解

Springboot项目打包war配置详解 1. 排除内置tomcat依赖2. 添加servlet依赖3. 修改打包方式4. 修改主启动类5. 完整pom.xml6. 效果图 1. 排除内置tomcat依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter…

xmind latex【记录备忘】

xmind latex 换行 换行必须要有\begin{align}和\end{align}&#xff0c;此时再在里面用\才能换行&#xff0c;如果只写112\224是不能换行的

七、Kafka源码分析之网络通信

1、生产者网络设计 架构设计图 2、生产者消息缓存机制 1、RecordAccumulator 将消息缓存到RecordAccumulator收集器中, 最后判断是否要发送。这个加入消息收集器&#xff0c;首先得从 Deque 里找到自己的目标分区&#xff0c;如果没有就新建一个批量消息 Deque 加进入 2、消…

【Windows】不要让你的win键落灰!掌握常用的组合快捷键,使用电脑更高效了

Windows 操作系统提供了丰富的键盘快捷键&#xff0c;能够大幅提高工作效率和操作便利性。在此介绍一些与 Win 键相关的常用快捷键&#xff0c;帮助你更好地利用 Windows 系统。想要在使用电脑时更高效吗&#xff1f;掌握常用的组合快捷键&#xff0c;让你的 Win 键从此不再落灰…

Security+备考我想分想这几点

考试初衷 本人是一名信息安全从业者&#xff0c;听过很多信息安全方面的认证&#xff0c;如CISP、CISSP、CISA&#xff0c;但是没听过Security认证&#xff0c;偶然的机会&#xff0c;我的同事给我介绍了谷安&#xff0c;从这里我才了解到还有Security认证这么一个信息安全认证…

微服务——http客户端Feign

目录 Restemplate方式调用存在的问题 Feign的介绍 基于Feign远程调用 Feign自定义配置 修改日志方式一(基于配置文件) 修改日志方式二(基于java代码) Feign的性能优化 连接池使用方法 Feign_最佳实践分析 方式一: 方式二 实现Feign最佳实践(方式二) 两种解决方案 Re…

通过v-for生成的input无法连续输入

部分代码&#xff1a;通过v-for循环生成el-form-item&#xff0c;生成多个描述输入框 更改之前的代码&#xff08;key绑定的是item&#xff09;&#xff1a; <el-form-item class"forminput" v-for"(item,index) in formdata.description" :key"…

【C语言】文件操作

&#x1f466;个人主页&#xff1a;Weraphael ✍&#x1f3fb;作者简介&#xff1a;目前正在回炉重造C语言&#xff08;2023暑假&#xff09; ✈️专栏&#xff1a;【C语言航路】 &#x1f40b; 希望大家多多支持&#xff0c;咱一起进步&#xff01;&#x1f601; 如果文章对你…

建立TCP连接的各个系统调用

TCP 连接的过程图 服务器 socket() 函数 socket() 返回的 sockfd 是一个描述符。socket()对应于普通文件的打开操作。普通文件的打开操作返回一个文件描述字&#xff0c;而socket()用于创建一个socket描述符&#xff08;socket descriptor&#xff09;&#xff0c;它唯一标识…

ks webdid 滑块注册

web和app其实都一样&#xff0c;主要是针对于设备进行风控&#xff0c;web设备叫webdid; webdid注册出来&#xff0c;过了ks滑块激活&#xff0c;测试了主页&#xff0c;评论等接口都可以跑&#xff0c;平均也就2s注册一个&#xff0c;如果开并发那就更快了&#xff1b; 不过一…

hdvp.

hdvp:外部函数文件&#xff0c;函数定义在hdvp中可以传输给任何hdev使用&#xff0c;即可以发给别人使用。同时允许对hdvp进行加密

Mac 四大常用清理软件推荐,软件特色下载教程横向评测

Mac 一般来说基本是不会中毒的&#xff0c;而且像 现在的 windows 也是很少中毒&#xff0c;但我们可能还是需要一款杀毒清理软件&#xff0c;主要是为了清理垃圾&#xff0c;统一查看并管理软件开机自启、权限信息等&#xff0c;统一卸载清理等功能&#xff0c;另外我们可能还…

【python】在matlab中调用python

参考 Matlab调用Python - 知乎 (zhihu.com) 说一下我犯的错误&#xff1a; 1、电脑上有没有python都可以&#xff0c;我以为anaconda里的python不行&#xff0c;又重新下了一个python3.8 实际上导入的时候可以用 pyversion(D:\myDownloads\anaconda\envs\pytorch38\pytho…

SpringCloud学习路线(10)——分布式搜索ElasticSeach基础

一、初识ES &#xff08;一&#xff09;概念&#xff1a; ES是一款开源搜索引擎&#xff0c;结合数据可视化【Kibana】、数据抓取【Logstash、Beats】共同集成为ELK&#xff08;Elastic Stack&#xff09;&#xff0c;ELK被广泛应用于日志数据分析和实时监控等领域&#xff0…

【LangChain】检索器之上下文压缩

LangChain学习文档 【LangChain】检索器(Retrievers)【LangChain】检索器之MultiQueryRetriever【LangChain】检索器之上下文压缩 上下文压缩 LangChain学习文档 概要内容使用普通向量存储检索器使用 LLMChainExtractor 添加上下文压缩(Adding contextual compression with an…

AI视频监控综合管理平台EasyCVR多分屏默认播放协议的配置优化

智能视频监控平台EasyCVR可拓展性强、开放度高&#xff0c;既能作为业务平台使用&#xff0c;也能作为视频能力层被调用和集成。视频监控综合管理平台兼容度高&#xff0c;支持自由调用、支持与第三方集成。在AI能力的接入上&#xff0c;TSINGSEE青犀视频平台可支持AI智能分析网…

奇舞周刊第500期:TQL,巧用 CSS 实现动态线条 Loading 动画

记得点击文章末尾的“ 阅读原文 ”查看哟~ 下面先一起看下本期周刊 摘要 吧~ 奇舞推荐 ■ ■ ■ TQL&#xff0c;巧用 CSS 实现动态线条 Loading 动画 最近&#xff0c;群里有个很有意思的问题&#xff0c;使用 CSS 如何实现如下 Loading 效果&#xff1a; leaferjs&#xff0c…

STM32MP157驱动开发——LED 驱动( GPIO 子系统)

文章目录 编写思路GPIO子系统的LED驱动程序(stm32mp157)如何找到引脚功能和配置信息在设备树中添加 Pinctrl 信息leddrv.cledtest.cMakefile编译测试 编写思路 阅读&#xff1a;STM32MP157驱动开发——GPIO 和 和 Pinctrl 子系统的概念可知利用GPIO子系统去编写LED驱动&#x…

机器学习深度学习——softmax回归从零开始实现

&#x1f468;‍&#x1f393;作者简介&#xff1a;一位即将上大四&#xff0c;正专攻机器学习的保研er &#x1f30c;上期文章&#xff1a;机器学习&&深度学习——向量求导问题 &#x1f4da;订阅专栏&#xff1a;机器学习&&深度学习 希望文章对你们有所帮助 …