多媒体技术:语音音频压缩

语音音频压缩

  • 语音音频基础知识
    • 物理世界的声音——语音
  • 语音音频编码方法
    • 波形编码
      • 波形编码原理
      • 常用波形编码技术
        • 脉冲编码调制PCM
        • 差分脉冲编码调制DPCM
        • 自适应差分脉冲编码调制ADPCM
        • 子带ADPCM
    • 参数编码
    • 感知编码
  • 语音音频编码框架
    • 语音编码框架
    • 音频编码框架
    • 混合编码框架
  • 语音音频编码标准
  • 语音音频质量评价
  • 空间音频编码
    • 多声道编码
    • 三维音频系统

语音音频基础知识

物理世界的声音——语音

语音短时平稳性:人在说话时,声道形状会随口腔肌肉运动而进行相应变化,肌肉运动频率相对于语音变化频率而言要相对缓慢,在一个短时间间隔(20~40ms)内,可以认为声道及其输入是近似平稳的。
语音信号分析帧:假设语音信号短时平稳,为便于语音信号处理,会将语音信号进行分帧处理,语音信号的处理帧长为20ms。
在这里插入图片描述
听觉感知

语音音频编码方法

波形编码

波形编码原理

波形编码:将时域波形信号采样、量化和编码形成数字语音信号,恢复的音频信号与原始信号波形基本上相同。

波形编码技术特点:高话音质量、压缩比低、码率通常在20kb/s以上、适用于高清高真语音编码。

在这里插入图片描述

  • 采样
    将时间连续信号变成时间离散信号。语音通信中采样频率通常为fs=8kHz,为了避免混叠,采样频率至少为连续信号频率的两倍。(奈奎斯特采样定理:采样频率至少应为信号最高频率的两倍)
    在这里插入图片描述

  • 量化
    将采样后的信号按幅度划分成有限个区段,把落入某个区段内的样值赋于相同的量化值。
    在这里插入图片描述

  • 编码
    将每个采样点赋值为量化单位的整数倍m(四舍五入),再对m进行二进制编码。
    在这里插入图片描述

常用波形编码技术

脉冲编码调制PCM

脉冲编码调制(Pulse Code Modulation, PCM):只对模拟音频采样量化。优点:方法简单,重构信号与原始信号几乎没有差别,代表了数字音频最佳保真水准,被广泛用于素材保存及音乐欣赏,CD、DVD文件中。缺点:实质上并没有进行压缩,编码后数据量大。

最高频率为20KHz双声道模拟音频信号,若采样频率为44.1KHz,量化位数为16位,采用PCM编码后数据带宽(数据传输率)为:44.1 × 16 × 2 = 1411.2𝐾𝑏𝑝s

  • 均匀量化方法
  • 非均匀量化方法
差分脉冲编码调制DPCM
自适应差分脉冲编码调制ADPCM
子带ADPCM

参数编码

感知编码

语音音频编码框架

语音编码框架

音频编码框架

混合编码框架

语音音频编码标准

语音音频质量评价

空间音频编码

多声道编码

三维音频系统

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/877354.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JDK8的新特性

目录 接口的默认方法和静态方法 Lambda表达式1、匿名内部类2、函数式接口(FunctionalInterface)2.1 无参函数式接口匿名内部类方式-->Lambda表达式方式 2.2 有参函数式接口匿名内部类方式-->Lambda表达式方式 3、Lambda实战 3.1 循环遍历 3.2 集合排序 3.3 创建线程方…

黑马头条Day12-项目部署_持续集成

一、今日内容介绍 1. 什么是持续集成 持续集成(Continuous integration,简称CI),指的是频繁地(一天多次)将代码集成到主干。 持续集成的组成要素: 一个自动构建过程,从检出代码、…

Golang处理Word文档模板实现标签填充|表格插入|图标绘制和插入

本教程主要实现【Golang处理Word文档模板实现标签填充|表格插入|图标绘制和插入】。 本文源码:https://gitee.com/songfayuan/go-zero-demo 教程源码分支:master 分支(_examples/word-template/fill-word-template.go) Golang处理…

Java-Swing开发-001组件

文章目录 Top-level containerJFrame容器对话框相关 JComponent组件面板相关文本相关菜单相关工具栏按钮下拉框进度条树形组件 Top-level container 1.JFrame 2.JDialog JFrame容器 //设置APP图标 this.setIconImage(new ImageIcon(getClass().getResource("/button/i…

论文解读(10)-图神经网络

加油,继续看论文。 这次学图神经网络,这个概念经常在其他论文里出现,所以我想先学习一下这方面的知识。 参考: 【图神经网络综述】一文道尽GNN原理、框架和应用-CSDN博客 【图神经网络】10分钟掌握图神经网络及其经典模型_图神经…

某“新一线城市“前端面试,纯纯被恶心到了

一.起因 在boss上刷到的一个小小厂,收大四全年实习生(web前端),因为离家乡比较近,而且双非一本的学历以及入坑的时间没有太长(前端部分不到一年),想去那里看看形势,要求是笔试面试,当场给是否录用结果&…

AgentBench: Evaluating LLMs As Agents

AgentBench: Evaluating LLMs As Agents Github: https://github.com/THUDM/AgentBench 榜单:https://llmbench.ai/agent/data demos:https://llmbench.ai/agent/demo 备注:该论文介绍为AgentBench v0.2版本 一、介绍 现如今&am…

三行代码高搞定nestjs静态图片映射方案

方案一 nestjs/serve-static 库映射 上代码 npm i nestjs/serve-staticimport { ServeStaticModule } from nestjs/serve-static; import { join } from path; const staticPath join(__dirname, .., /public/);Module({imports: [ServeStaticModule.forRoot({rootPath: sta…

用Python代码调用GPT-SoVITS

GPT-SoVITS 项目地址:https://github.com/RVC-Boss/GPT-SoVITS import os import requests from PySide6.QtCore import QThread from PySide6.QtWidgets import QWidget, QApplication from design import Ui_Form import subprocess import sounddevice as sd im…

JAVA基础 - 泛型

目录 一. 简介 二. 集合泛型 三. 自定义泛型 四. 自定义泛型类和普通类的区别 一. 简介 泛型是 Java 语言中一种强大的特性,它允许在定义类、接口和方法时使用类型参数,从而增加了代码的类型安全性和复用性。 类型安全性: 使用泛型可以…

day07 项目启动以及git

spring框架 spring 负责整合各种框架,把new对象的部分交给spring去做,对象new不出来,项目就启动不起来,这样可以有效保证所需要的对象都在容器中存在,后续的部分都可以顺利执行控制反转:业务对象创建依赖资…

“八股文”在实际工作中是助力、阻力还是空谈?

一:浅谈 关于“八股文”在程序员面试中的重要性和实际工作中的作用,确实是一个引发广泛讨论的话题。以下是我对这个问题的看法: 1. “八股文”的定义与特征 “八股文”通常指的是面试中常见的标准化问答或经典理论知识,例如…

Apollo:源码分析之cyber/mainboard启动入口介绍-my write, test ok

软件结构图 cyber入口 cyber的入口在"cyber/mainboard"目录中: ├── mainboard.cc // 主函数 ├── module_argument.cc // 模块输入参数 ├── module_argument.h ├── module_controller.cc // 模块加载,卸载 └── module_controller.…

关于Docker Engine AuthZ 插件授权绕过漏洞 (CVE-2024-41110)

一、漏洞概述 漏洞名称:Docker Engine AuthZ 插件授权绕过漏洞 (CVE-2024-41110) 漏洞等级:高危 漏洞描述:DockerEngine是Docker的核心组件,是一 个开源的容器引擎,负责构建、运行和管理容器…

【Vue】权限控制

权限管理 分类: 页面权限功能(按钮)权限接口权限 vue3-element-admin 的实现方案 一般我们在业务中将 路由可以分为两种,constantRoutes 和 asyncRoutes。 constantRoutes: 代表那些不需要动态判断权限的路由,如登录页、404(或…

【echarts】 柱状图,最后带“竖线”

具体: https://echarts.zhangmuchen.top/#/detail?cid28ea6-0601-e9f5-9cc29-c022b758 let data [{value: 0,name: 数据格式一},{value: 55,name: 数据格式二},{value: 66,name: 数据格式三},{value: 75,name: 数据格式四},{value: 20,name: 数据格式五}];getAr…

盘点.软件测试模型

软件开发模型   软件开发模型(Software Development Model)是指软件开发全部过程、活动和任务的结构框架。软件开发包括需求、设计、编码和测试等阶段,有时也包括维护阶段。 软件开发模型能清晰、直观地表达软件开发全过程,明确规定了要完成的主要活动…

C++类与对象-六大成员函数

默认成员函数就是用户没有显式实现,编译器会⾃动⽣成的成员函数称为默认成员函数。⼀个空类编译器会默认⽣成8个默认成员函数。本文只介绍其中6个,C11增加两个函数见后续博客。 目录 一、构造函数 1.1 概念 1.2 特性 1.3 使用举例 1.4 初始化列表 1…

如何通过前端表格控件实现自动化报表?

背景 最近伙伴客户的项目经理遇见一个问题,他们在给甲方做自动化报表工具,项目已经基本做好了,但拿给最终甲方,业务人员不太买账,项目经理为此也是天天抓狂,没有想到合适的应对方案。 现阶段主要面临的问…

docker笔记7-dockerfile

docker笔记7-dockerfile 一、dockerfile介绍二、dockerfile指令三、构建自己的镜像 一、dockerfile介绍 Dockerfile是用来构建Docker镜像的构建文件,是由一系列命令和参数构成的脚本。 以下是常用的 Dockerfile 关键字的完整列表和说明: 二、docker…