【音视频|PCM】PCM格式详解

😁博客主页😁:🚀https://blog.csdn.net/wkd_007🚀
🤑博客内容🤑:🍭嵌入式开发、Linux、C语言、C++、数据结构、音视频🍭
🤣本文内容🤣:🍭介绍数字音频的PCM格式🍭
😎金句分享😎:🍭子曰:君子不器。 ——《论语·为政篇》。意思是,君子不应像器具那样,只有一种用途。🍭

目录

  • 🎄一、PCM是什么?
    • ✨1.1 PCM 的定义
    • ✨1.2 PCM 和 声音(音频) 的关系
  • 🎄二、PCM 生成过程
    • ✨2.1 采样(Sampling)
    • ✨2.2 量化(Quantization)
    • ✨2.3 编码(Encoding)
  • 🎄三、PCM音频的特征或参数
  • 🎄四
  • 🎄五
  • 🎄六、


在这里插入图片描述

🎄一、PCM是什么?

✨1.1 PCM 的定义

PCM(Pulse Code Modulation)又称脉冲编码调制,是一种用于数字通信和音频记录的技术。PCM通过对模拟信号进行采样、量化、编码,将连续的模拟信号转换为离散的数字信号,从而实现信号的高保真传输和存储。

✨1.2 PCM 和 声音(音频) 的关系

从PCM的定义来看,它主要是将模拟信号转成数字信号。那它和音频有什么关系呢?为什么是要转成数字信号呢?

1、自然界中的声音通过麦克风等采集设备处理后,首先会将声音信号转换成电信号,但此时的电信号是连续的模拟信号,将这些音频模拟信号在坐标系表示就类似于下图:
在这里插入图片描述

2、计算机只认识0和1,这样连续的模拟信号要被计算机传输或存储等处理的话,就需要先转换成数字信号;

3、通过模数转换器(A/D),将音频模拟信号转换成数字信号后就可以被计算机处理,经过模数转换器处理后的音频数字信号就是PCM,是声音的原始数据。在音视频编程中,常被称为音频裸数据,它还可以继续被编码成其他格式的音频数据如:wav、mp3、aac、ogg;

4、计算机处理后的数字音频信号,再通过数模转换器(D/A),转换成音频模拟信号,最后通过扬声器等设备转成声音信号,进行播放。

通过前面的介绍,PCM可以总结为:通过模数转换器处理后,将声音模拟信号转换而成的数字信号,是声音要给计算机处理的最原始的音频数据。

在这里插入图片描述

🎄二、PCM 生成过程

读者可以先思考一下,怎样才能将连续的模拟信号转成数字信号呢?

既然模拟信号看起来像连续的一段曲线,是不是可以用很密集的一些点去表示,只要有足够多的点,就可以让这些点看起来像模拟信号的曲线了;

如果选择用很多点去表示连续的曲线,那么这些点的取值范围应该是多少呢?取值范围越大,越能精确地表示模拟信号曲线;

确定范围后,表示曲线的每个点就成了各个数值,最后将这些数值按照格式排列起来,就成了数字信号了。

其实,PCM也是大概按照上面的流程去生成的,PCM生成需要经过 采样(Sampling)量化(Quantization)编码(Encoding)

✨2.1 采样(Sampling)

采样就是将模拟信号的音频转换成数字信号音频的过程,通过模/数转换器(A/D)对声波进行采样,每一次采样都记录下了原始模拟声波在某一时刻的状态,称之为样本,将一串的样本连接起来,就可以描述一段声波。把每一秒钟所采样的次数称为采样频率,单位为HZ(赫兹)。其实,采样就是在时间轴上对信号进行数字化。
在这里插入图片描述
采用过程如上图,用若干个黑点来表示红色的曲线。红色的曲线是音频模拟信号,各个黑点就是样本。

采样率:每一秒钟所采样的样本个数;如果每秒所采集的样本越多,越能精确的表示曲线。常见的采样率有:通话时的采样率为8KHz(每秒8000个样本),常用的媒体采样率有44.1KHz(每秒44100个样本),更高要求的有48KHz(每秒48000个样本)等等。

✨2.2 量化(Quantization)

量化就是为采集的样本确定一个取值范围。

比如用16比特的二进制信号来表示声音的一个样本, 而16比特(一个short) 所表示的范围是[-32768,32767], 共有65536个可能取值, 因此最终音频的数字信号在幅度上也分为了65536层。

如果用8比特的二进制信号来表示声音的一个样本,8比特(一个unsigned char)所表示的范围是[0,255],共有256个层级。
在这里插入图片描述
注意:
在8位的PCM音频数据中,样本的取值范围是从0到255。对于有符号的8位PCM编码,取值范围为-128到127。每个样本使用一个8位字节来表示其幅度值,其中最低位(LSB)表示0,最高位(MSB)表示255。这种编码方式使得正负幅度能够均匀地分布在取值范围内,方便存储和处理。如果没有明确指定是有符号还是无符号的情况下,通常默认为无符号的0到255取值范围。

在16位PCM音频数据中,样本的取值范围是-32768到32767。16位PCM音频数据使用两个字节(16个比特)来表示每个样本的取值,其中一个比特用于表示正负号(16位中最高位为符号位)。因此,样本的取值范围可以表示为从 − 2 15 -2^{15} 215(-32768)到 2 15 2^{15} 215-1(32767)。这个范围与8位PCM音频数据的取值范围不同,因为它们使用了不同数量的比特来表示每个样本的取值。

✨2.3 编码(Encoding)

编码, 就是按照一定的格式记录采样和量化后的样本数据,将量化后的数字信号转换为二进制码的过程。比如顺序存储或压缩存储, 等等。

采样、量化后的数据经过编码后产生的二进制数据,就是PCM数据。
在这里插入图片描述

在这里插入图片描述

🎄三、PCM音频的特征或参数

  • 采样率(Sampling Rate):表示每秒钟采样的样本数量,单位为赫兹(Hz)。它决定了PCM音频的时间分辨率和频率范围。
  • 位深度(Bit Depth):表示每个样本的取值精度,通常以位数表示。它决定了PCM音频的动态范围和信噪比。一般为16bit。
  • 字节序(Byte Order):表示多字节数据在存储或传输中的排列顺序。常见的字节序有大端序(Big Endian)和小端序(Little Endian)两种。常见的为小端字节序。
  • 采样数据是否有符号(Signed or Unsigned Samples):表示每个样本的取值是否包含符号位。有符号PCM样本的取值范围涵盖正负值,而无符号PCM样本的取值范围仅包含非负值。
  • 声道数(Number of Channels):表示PCM音频中的独立声道数量。常见的声道数有单声道(Mono)和立体声(Stereo),还可以有更多声道如5.1声道、7.1声道等。

这些参数共同定义了PCM音频的基本特征,对于处理、存储和传输PCM音频非常重要。不同的应用场景和需求可能需要不同的参数设置来满足特定的要求。
在这里插入图片描述

🎄四

在这里插入图片描述

🎄五

在这里插入图片描述

🎄六、

在这里插入图片描述
如果文章有帮助的话,点赞👍、收藏⭐,支持一波,谢谢 😁😁😁

参考资料:
https://blog.csdn.net/qq_25333681/article/details/90682989

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/124130.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jenkins详细安装教程

这里写目录标题 一、Jenkins安装与部署1-1、Jenkins的简介1-2、下载需要的软件1-2-1 jekins.war1-2-2 tomcat安装方式 1-3、使用11版本的jdk1-4、开启jenkins1-5、获取密码1-5 修改镜像(可改可不改) 二、卸载Jenkins 一、Jenkins安装与部署 1-1、Jenkins的简介 Jenkins是一个…

比较浮点数时,我被绊倒了

📢欢迎点赞 :👍 收藏 ⭐留言 📝 如有错误敬请指正,赐人玫瑰,手留余香!📢本文作者:由webmote 原创📢作者格言:新的征程,我们面对的不是…

C++之string

C之string #include <iostream>using namespace std;/*string();//创建一个空的字符串string(const char* s);//使用字符串s初始化string(const string& str);//使用一个string对象初始化另外一个string对象string(int n,char c);//使用n个字符c初始化*/void test1()…

【计算机网络】浏览器的通信能力

1. 用户代理 浏览器可以代替用户完成http请求&#xff0c;代替用户解析响应结果&#xff0c;所以我们称之为用户代理 user agent。 浏览器两大核心能力&#xff1a; 自动发送请求的能力自动解析响应的能力 1.1 自动发送请求的能力 用户在地址栏输入了一个url地址&#xff0…

eslint提示 xxx should be listed in the project's dependencies

有时候手动安装了一个npm包A&#xff0c;npm包A里面包含了npm包B&#xff0c;这时候如果 import xxx from npm包B;eslint会报错&#xff0c;提示 npm包B 不在 package.json 里面 解决方法&#xff1a;在 eslintrc.js 增加配置 module.exports {rules: {import/no-extraneous-d…

GEO生信数据挖掘(十一)STRING数据库PPI蛋白互作网络 Cytoscape个性化绘图【SCI 指日可待】

GEO生信数据挖掘&#xff08;十&#xff09;肺结核数据-差异分析-WGCNA分析&#xff08;900行代码整理注释更新版本&#xff09; 通过 前面十篇文章的学习&#xff0c;我们应该已经可以获取到一个”心仪的基因列表“了&#xff0c;相较于原始基因数量&#xff0c;这个列表的数…

目标检测算法发展史

前言 比起图像识别&#xff0c;现在图片生成技术要更加具有吸引力&#xff0c;但是要步入AIGC技术领域&#xff0c;首先不推荐一上来就接触那些已经成熟闭源的包装好了再提供给你的接口网站&#xff0c;会使用别人的模型生成一些图片就能叫自己会AIGC了吗&#xff1f;那样真正…

定档11月2日,YashanDB 2023年度发布会完整议程公布

数据库作为支撑核心业务的关键技术&#xff0c;对数字经济的发展有着重要的支撑作用&#xff0c;随着云计算、AI等技术的迅猛发展和数据量的爆发式增长&#xff0c;推动着数据库技术的加速创新。 为了应对用户日益复杂的数据管理需求&#xff0c;赋能行业国产化建设和数字化转型…

Windows详细安装和彻底删除RabbitMQ图文流程

RabbiitMQ简介 RabbitMQ是实现了高级消息队列协议&#xff08;AMQP&#xff1a;Advanced Message Queue Protocol&#xff09;的开源消息代理软件&#xff08;亦称面向消息的中间件&#xff09;。RabbitMQ服务器是用Erlang语言编写的&#xff0c;而聚类和故障转移是构建在开放…

C语言-递归和迭代

&#x1f308;write in front&#x1f308; &#x1f9f8;大家好&#xff0c;我是Aileen&#x1f9f8;.希望你看完之后&#xff0c;能对你有所帮助&#xff0c;不足请指正&#xff01;共同学习交流. &#x1f194;本文由Aileen_0v0&#x1f9f8; 原创 CSDN首发&#x1f412; 如…

Windows下Redis配置密码,并设置自启动

1. 解压redis修改配置文件&#xff08;设置密码&#xff09; 打开Redis的配置文件&#xff0c;通常位于Redis安装目录下的 redis.windows.conf 去掉"requirepass"前注释&#xff0c;修改"foobared"为要设置的密码 requirepass foobared2.注册服务&#x…

SpringCloud之Eureka的学习【详细】

目录 服务架构演变 单体架构 分布式架构 分布式架构需要考虑的问题 微服务 架构比较 微服务技术对比 服务拆分注意事项 案例 服务远程调用 RestTemplate Eureka注册中心 RestTemplate存在的问题 服务调用考虑的问题 Eureka的作用 搭建EurekaServer 服务注册 …

刷穿力扣(31~60)

更好的阅读体验 \huge{\color{red}{更好的阅读体验}} 更好的阅读体验 31. 下一个排列 排列原理就是 C 中的 next_permutation 函数&#xff0c;生成指定序列的下一个全排列从给定序列的最右端开始&#xff0c;找到第一个满足 nums[i] < nums[i 1] 的元素 nums[i]若找不到这…

挑战吧,HarmonyOS应用开发工程师

一年一度属于工程师的专属节日1024&#xff0c;多重活动亮相啦~ 参与活动即有机会获得HUAWEI Freebuds 5i 耳机等精美礼品&#xff01; 点击“阅读原文”查看更多活动详情&#xff01;

算法笔记【8】-合并排序算法

文章目录 一、前言二、合并排序算法基本原理三、实现步骤四、优缺点分析 一、前言 合并排序算法通过采用分治策略和递归思想&#xff0c;实现了高效、稳定的排序功能。本文将深入探讨合并排序算法的原理、实现步骤&#xff0c;并讨论其优缺点。 二、合并排序算法基本原理 合…

双向链表的初步练习

&#x1d649;&#x1d65e;&#x1d658;&#x1d65a;!!&#x1f44f;&#x1f3fb;‧✧̣̥̇‧✦&#x1f44f;&#x1f3fb;‧✧̣̥̇‧✦ &#x1f44f;&#x1f3fb;‧✧̣̥̇: Solitary-walk ⸝⋆ ━━━┓ - 个性标签 - &#xff1a;来于“云”的“羽球人”…

dbeaver配置es连接org.elasticsearch.xpack.sql.jdbc.EsDriver

查看目标es服务版本&#xff0c;下载对应驱动

[UDS] --- CommunicationControl 0x28

1 0x28功能描述 根据ISO14119-1标准中所述&#xff0c;诊断服务28服务主要用于网络中的报文发送与接受&#xff0c;比如控制应用报文的发送与接收&#xff0c;又或是控制网络管理报文的发送与接收&#xff0c;以便满足一定场景下的应用需求。 2 0x28应用场景 一般而言&#…

迁移学习 - 微调

什么是与训练和微调&#xff1f; 你需要搭建一个网络模型来完成一个特定的图像分类的任务。首先&#xff0c;你需要随机初始化参数&#xff0c;然后开始训练网络&#xff0c;不断调整参数&#xff0c;直到网络的损失越来越小。在训练的过程中&#xff0c;一开始初始化的参数会…