音频客观感知MOS对比，对ViSQOL、PESQ、MosNet（神经网络MOS分）和polqa一致性对比和可信度雁阵

音频客观感知MOS对比，对ViSQOL、PESQ、MosNet（神经网络MOS分）和polqa一致性对比和可信度雁阵

news/2025/4/26 22:33:15/文章来源:https://blog.csdn.net/qq_37100442/article/details/132057139

原创：转载需附链接：音频客观感知MOS对比，对ViSQOL、PESQ、MosNet（神经网络MOS分）和polqa一致性对比和可信度雁阵_machine-lv的博客-CSDN博客谢谢！

本文章以标准polqa的mos分为可信前提，验证visqol、peqq、mosnet与polqa的一致性，以及visqol的可信度验证；主要用于编解码、降噪、回声消除等算法的感知效果进行打分，从而促进算法的迭代和可信度；

一、评价方式

主观评价：

优点：主观测试是音频评价的黄金准则，最符合人的实际听感。
缺点：主观评测费时费力，测试者太少、测试者不规范等都会带来测试误差；
常用方法：AB-TEST， MUSHAR

客观打分：

优点：方便测试和开发人员，快速验证语音的相对质量，方便日常工作，提升开发和测试效率；
缺点：不能够完全符合人的听觉感知，存在听感好打分低的情况；
常用方案：有参考（POLQA, PESQ, VISQOL）和无参考（ITU-TP.1201传统方法和MOSNET的AI打分）

二、PESQ 和 VISQOL测试对比

对比维度：

基础对比：Visqol和polqa支持16khz和48khz打分， visqol支持频带和时间帧打分，pesq支持8khz和16khz打分；mosnet支持16khz的帧输出打分；

两者与POLQA的一致性对比： visqol和polqa的一致性更高， pesq颗粒度不够， mosnet（AI无参考模型）表现最差；

注：SMD48和SMD49，SMD50和SMD51，SMD271和SMD272这三对音频各对的音源相同，并且每对的后者都针对前者做了过认证优化。

音量的影响：音量差异影响不大，但是当降低-18db开始分数降低；

混响的影响：混响音响较大，加入混响分数就开始降低，但是混响大小影响有规律

噪音的影响：噪音影响很大，加入噪音分数就明显降低，但是不同信噪比变化有规律

频带缺失的影响：频带缺失影响打分较大，但是不同的频带模型还是能够匹配降低不同的分值；

2. 总结

visqol和polqa有较高的一致性（可能有幸存者偏差，但是拿到的数据是我们过认证的随机音频），visqol也存在和听感不符合的打分，例如加入轻微混响和噪音都会对打分有影响；但是混响和噪音的影响随着RT60和SNR的变化是有规律的，如果在降噪和混响模型的测试，也具相对意义，可以进行研发的自测；

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/18380.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

MPAndroidChart学习及问题处理

MPAndroidChart学习及问题处理

1.添加依赖项目目录->app->build.gradle dependencies {implementation com.github.PhilJay:MPAndroidChart:v3.0.3 }项目目录->app->setting.gradle dependencyResolutionManagement {repositories {maven { url https://jitpack.io }} }高版本的gradle添加依…

阅读更多...

Ceph错误汇总

Ceph错误汇总

title: “Ceph错误汇总” date: “2020-05-14” categories: - “技术” tags: - “Ceph” - “错误汇总” toc: false original: true draft: true Ceph错误汇总 1、执行ceph-deploy报错 1.1、错误信息 ➜ ceph-deploy Traceback (most recent call last):File "/us…

阅读更多...

2023年第四届“华数杯”数学建模思路 - 案例：感知机原理剖析及实现

2023年第四届“华数杯”数学建模思路 - 案例：感知机原理剖析及实现

# 赛题思路 （赛题出来以后第一时间在CSDN分享） https://blog.csdn.net/dc_sinor?typeblog 一、感知机的直观理解感知机应该属于机器学习算法中最简单的一种算法，其原理可以看下图： 比如说我们有一个坐标轴（图中的…

阅读更多...

关于视频汇聚融合EasyCVR平台多视频播放协议的概述

关于视频汇聚融合EasyCVR平台多视频播放协议的概述

视频监控综合管理平台EasyCVR具备视频融合能力，平台基于云边端一体化架构，具有强大的数据接入、处理及分发能力，平台既具备传统安防视频监控的能力与服务，也支持AI智能检测技术的接入，可应用在多行业领域的智能化监管场…

阅读更多...

Python简单应用II

Python简单应用II

#第一题： 将字符串joy存放于列表l1中，按要求完成如下操作。元素添加操作： 1）在列表l1的尾部添加空白字符， 2）在列表l1的尾部添加字符串singing， 3）在列表l1的首部添加字符串I e&…

阅读更多...

直线模组如何进行精度校准？

直线模组如何进行精度校准？

直线模组是一种高精度的传动元件，而精度是直线模组的重要指标，在直线模组的使用中，我们应该尽可能的避免直线模组的精度受损，这样才能够有真正的发挥出直线模组的稳定性。直线模组的精度一般是指重复定位精度和导向精度&#xff…

阅读更多...

React常见面试题

React常见面试题

React常见面试题一、React中的样式管理有哪些方法内联样式：对象，作用于当前组件普通样式表： 作用于全局，文件名是：xxx.scssCSS模块：类似Vue的scoped， 文件名需是：xxx.module.scs…

阅读更多...

代客泊车对HUT功能交互规范

代客泊车对HUT功能交互规范

目录 1. 版本记录... 7 2. 文档范围和控制... 8 2.1 目的/范围... 8 2.2 文档冲突... 8 2.3 文档授权... 8 2.4 文档更改控制... 8 3. 系统组成... 9 3.1 IPAS系统（环视和超声波雷达）...…

阅读更多...

Springboot简单利用@RestControllerAdvice优雅的捕获异常

Springboot简单利用@RestControllerAdvice优雅的捕获异常

1.注解 ExceptionHandler：用于指定异常处理方法。当与RestControllerAdvice配合使用时，用于全局处理控制器里的异常。 2.配置类 RestControllerAdvice Slf4j public class GlobalExceptionHandler {ExceptionHandler(Exception.class)public Result h…

阅读更多...

LeetCode 39. 组合总和（回溯+剪枝）

LeetCode 39. 组合总和（回溯+剪枝）

题目： 链接：LeetCode 39. 组合总和难度：中等给你一个无重复元素的整数数组 candidates 和一个目标整数 target ，找出 candidates 中可以使数字和为目标数 target 的所有不同组合 ，并以列表形式返回。你可以按 …

阅读更多...

Java - sh 脚本启动 jar 包等服务 - sh 脚本模板 - 适用于任何类似的服务启动

Java - sh 脚本启动 jar 包等服务 - sh 脚本模板 - 适用于任何类似的服务启动

sh 脚本模板该模板，每次运行一次都会 kill 掉原来的服务，然后重新启动 jar 包服务 #!/bin/bash# 定义Java进程的名称 APP_NAMEyour-app-name.jar# 定义Java进程的日志文件路径 LOG_PATH/var/log/your-app-name.log# 定义备份日志文件的目录 BACKUP_DI…

阅读更多...

PyTorch（安装及卸载）

PyTorch（安装及卸载）

目录 1. 安装 2. 卸载参考文献为什么用PyTorch：简单来说，19年之前tensorflow是大哥，19年tensorflow和PyTorch双龙并行，20年之后PyTorch一往无前。宗旨，哪个用的人多用哪个。 1. 安装 1. 先打开Anaconda Prompt&…

阅读更多...

uniapp自定义消息语音

uniapp自定义消息语音

需求是后端推送的消息APP要响自定义语音，利用官方插件，总结下整体流程 uniapp后台配置因为2.0只支持uniapp自己的后台发送消息，所以要自己的后台发送消息只能用1.0 插件地址和代码插件地址: link let isIos (plus.os.name "iOS&qu…

阅读更多...

C++内存管理

C++内存管理

目录一.C中内存区域划分一.C中内存区域划分 1.栈又叫堆栈--非静态局部变量/函数参数/返回值等等，栈是向下增长的。 2.内存映射段是高效的I/O映射方式，用于装载一个共享的动态内存库。用户可使用系统接口创建共享共享内存，做进程间通信。 …

阅读更多...

P1025 [NOIP2001 提高组] 数的划分（dfs+剪枝 or dp）

P1025 [NOIP2001 提高组] 数的划分（dfs+剪枝 or dp）

dfs剪枝思路：暴力枚举搜索，不过要优雅剪枝一下下 1:处理重复情况-->我们只需要然后方取值从前往后的时候呈现递增（可以相等，即不递减） 2：剪枝-->基于上思想，剩下的“盘子”里面的数至…

阅读更多...

手撕SpringBoot的自定义启动器

手撕SpringBoot的自定义启动器

一. 前言哈喽，大家好，最近金九银十，又有不少小伙伴私信辉哥，说自己在面试时被问到SpringBoot如何自定义启动器，结果自己不知道该怎么回答。那么今天就手把手地带着大家，去看看在SpringBoot中到底该怎么实…

阅读更多...

亚马逊买家账号ip关联怎么处理

亚马逊买家账号ip关联怎么处理

对于亚马逊买家账号，同样需要注意IP关联问题。在亚马逊的眼中，如果多个买家账号共享相同的IP地址，可能会被视为潜在的操纵、违规或滥用行为。这种情况可能导致账号受到限制或处罚。处理亚马逊买家账号IP关联问题，建议采取以下步骤…

阅读更多...

生化危机5找不到xlive.dll，要如何修复xlive.dll缺失

生化危机5找不到xlive.dll，要如何修复xlive.dll缺失

有朋友反映说他在玩生化危机5的时候，突然电脑就弹出一个找不到xlive.dll，然后游戏就打不开了，一直都很懵逼，不知道怎么处理这个问题，今天小编就来给大家详细的讲讲，找不到xlive.dll要怎么去修复&#xff01…

阅读更多...

危化品行业防雷检测综合解决方案

危化品行业防雷检测综合解决方案

危化品是指具有毒害、腐蚀、爆炸、燃烧、助燃等性质，能够对人体、设施或者环境造成危害的化学品。危化品的生产、储存、运输、使用等过程中，都存在着遭受雷击引发火灾或者爆炸事故的风险。因此，对危化品场所进行防雷检测，是保障危…

阅读更多...

【opencv学习】鼠标回调函数、鼠标控制画矩形

【opencv学习】鼠标回调函数、鼠标控制画矩形

#include <iostream> #include <opencv2/opencv.hpp> using namespace cv; #define WinDow "程序窗口"void MouseHandle(int event, int x, int y, int flags, void* param);//鼠标回调函数 void Drawrectangle(cv::Mat& img, cv::Rect box);//矩形绘…

阅读更多...

最新文章