【音视频 | AAC】AAC格式音频文件解析

😁博客主页😁:🚀https://blog.csdn.net/wkd_007🚀
🤑博客内容🤑:🍭嵌入式开发、Linux、C语言、C++、数据结构、音视频🍭
🤣本文内容🤣:🍭介绍AAC格式音频文件解析🍭
😎金句分享😎:🍭你不能选择最好的,但最好的会来选择你——泰戈尔🍭

本文未经允许,不得转发!!!

目录

  • 🎄一、概述
  • 🎄二、AAC文件分析
    • ✨2.1 ADTS帧
    • ✨2.2 AAC文件解析
  • 🎄三、解析AAC文件的C语言代码
  • 🎄四、总结


在这里插入图片描述

🎄一、概述

现在较常使用的AAC文件格式是使用ADTS帧来保存的,本文介绍以ADTS格式的AAC文件的解析过程。主要分为两个部分,第一部分是用编辑器直接打开一个AAC文件来分析;第二部分是引用一个C语言代码来解析ADTS格式的AAC文件。

关于AAC格式的一些基础知识,可以看上篇文章:【音视频 | AAC】AAC音频编码详解 。

在这里插入图片描述

🎄二、AAC文件分析

本节使用编辑器打开一个AAC文件分析,分析前,先简单了解一下ADTS帧。

✨2.1 ADTS帧

ADTS格式是AAC编码的其中一种格式,将整个AAC文件分成一个个ADTS帧,ADTS帧头一般是7个字节(没有CRC)或者9个字节(有CRC)。

在这里插入图片描述
ADTS头部又分为固定头部、可变头部,下面简单介绍ADTS头部的各个字段含义:

固定头部各个字段解析:

  • syncword(12bit):所有的bit位都是1。总是0xFFF,代表一个ADTS帧的开始,作为分界符,用于同步每帧起始位置。
  • ID(1 bit):表示MPEG版本,0代表MPEG-4, 1代表MPEG-2,一般用 0,因为都是属于 MPEG 的规范.。
  • layer:占用 2 bit;一直是0;
  • protection_absent:占用 1 bit;设置 1 表示没有CRC,整个ADST头为7字节;0 表示有CRC,整个ADST头为9字节。
  • profile_ObjectType:占用 2 bit,表示使用的AAC规格(profile);
    该字段的解释取决于ID位的值。如果ID等于1,则该字段包含与ISO/IEC 13818-7中定义的ADTS流中的配置文件字段相同的信息,也就是MPEG-2的规格;当ID为0是表示的是MPEG-4的规格,该字段的值等于 Audio Object Type 的值减1。字段取值如下面图片的表格。
    在这里插入图片描述
  • sampling_frequency_index:占用 4 bit;表示采样率下标,字段取值及解释如下图:
    在这里插入图片描述
  • private_bit:占用 1 bit,编码时设置为0,解码时忽略;
  • channel_configuration:占用 3 bit;
    通道配置即声道数,一般 2 表示立体声双声道。更多的值参考下图:
  • original_copy:占用 1 bit,编码时设置为0,解码时忽略;
  • home:占用 1 bit,编码时设置为0,解码时忽略。

可变头部字段解析:
字段解析:

  • copyright_identification_bit:占用 1 bit,编码时设置为0,解码时忽略;
  • copyright_identification_start:占用 1 bit,编码时设置为0,解码时忽略;
  • frame_length:占用 13 bit,当前 ADTS 帧的长度,包括 ADTS 头(固定+可变)和 AAC 原始流,单位byte;
  • adts_buffer_fullness:占用 11 bit,0x7FF 表示码率可变的码流,0x000 表示固定码率的码流;
  • number_of_raw_data_blocks_in_frame:占用 2 bit;
    该字段表示当前ADST帧中所包含的AAC帧的个数减一。为了最大的兼容性通常每个ADTS frame 包含一个AAC frame,所以该值一般为0。一个AAC原始帧包含一段时间内1024个采样及相关数据

✨2.2 AAC文件解析

下图是用编辑器打开一个AAC文件,用十六进制查看的截图:
在这里插入图片描述
没有CRC的情况下,文件开头的7个字节是ADTS帧头部,这里7个字节的数据是:0xff 0xf1 0x4c 0x80 0x20 0x02 0x80,我们按照ADTS帧的头部数据来解析看看这7个字节表示什么?

  • 前面1-12bit为 0xff 0xf,对应了ADTS头部的 syncword 字段,表示ADTS帧的开始。
  • 13-16bit为0x01,二进制是 0001,也就是说
    ID的1bit为0(MPEG-4);
    layer的2bit为00;
    protection_absent的1bit为1,表示没有CRC,整个头部7个字节。
  • 17-24bit为0x4c,二进制是 0100 1100,意思是
    profile_ObjectType的2bit为 01,结合前面ID为0,表示MPEG-4 AAC LC 规格;
    sampling_frequency_index的4bit为0011,也就是0x3,表示采样率为48000;
    private_bit的1bit为0;
    剩余1bit,结合后面的再看;
  • 25-32bit为0x80,二进制是 1000 0000,意思是
    channel_configuration的3bit(结合前面剩下的1bit)为 010,表示双声道;
    original_copy的1bit为0;
    home的1bit为0;
    copyright_identification_bit的1bit为0;
    copyright_identification_start的1bit为0;
    剩余2bit,结合下个字段再看;
  • 33-44bit为0x200,二进制是 0010 0000 0000,加上前面剩下的2bit,就是00 0010 0000 0000:
    frame_length的13bit为00 0010 0000 000,也就是0x100,表示这个ADTS帧的长度是0x100;那么下个ADTS就是0x100开始的;
    剩余1bit,留到下个字段再看;
  • 45-56bit为0x280,二进制是 0010 1000 0000,加上前面剩下的1bit,就是 0 0010 1000 0000:
    adts_buffer_fullness的11bit为 0 0010 1000 00,十六进制0xa0;(目前不知道有什么作用2023-12-20 19:34:07)
    number_of_raw_data_blocks_in_frame的2bit为 00,表示包含一个AAC frame。

后面的ADTS帧也可以类似上面的过程去解析。frame_length是代表了整个ADTS的大小。
在这里插入图片描述

🎄三、解析AAC文件的C语言代码

代码来源于:视音频数据处理入门:AAC音频码流解析

/*** 最简单的视音频数据处理示例* Simplest MediaData Test** 雷霄骅 Lei Xiaohua* leixiaohua1020@126.com* 中国传媒大学/数字电视技术* Communication University of China / Digital TV Technology* http://blog.csdn.net/leixiaohua1020** 本项目包含如下几种视音频测试示例:*  (1)像素数据处理程序。包含RGB和YUV像素格式处理的函数。*  (2)音频采样数据处理程序。包含PCM音频采样格式处理的函数。*  (3)H.264码流分析程序。可以分离并解析NALU。*  (4)AAC码流分析程序。可以分离并解析ADTS帧。*  (5)FLV封装格式分析程序。可以将FLV中的MP3音频码流分离出来。*  (6)UDP-RTP协议分析程序。可以将分析UDP/RTP/MPEG-TS数据包。** This project contains following samples to handling multimedia data:*  (1) Video pixel data handling program. It contains several examples to handle RGB and YUV data.*  (2) Audio sample data handling program. It contains several examples to handle PCM data.*  (3) H.264 stream analysis program. It can parse H.264 bitstream and analysis NALU of stream.*  (4) AAC stream analysis program. It can parse AAC bitstream and analysis ADTS frame of stream.*  (5) FLV format analysis program. It can analysis FLV file and extract MP3 audio stream.*  (6) UDP-RTP protocol analysis program. It can analysis UDP/RTP/MPEG-TS Packet.**/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>int getADTSframe(unsigned char* buffer, int buf_size, unsigned char* data ,int* data_size){int size = 0;if(!buffer || !data || !data_size ){return -1;}while(1){if(buf_size  < 7 ){return -1;}//Sync wordsif((buffer[0] == 0xff) && ((buffer[1] & 0xf0) == 0xf0) ){size |= ((buffer[3] & 0x03) <<11);     //high 2 bitsize |= buffer[4]<<3;                //middle 8 bitsize |= ((buffer[5] & 0xe0)>>5);        //low 3bitbreak;}--buf_size;++buffer;}if(buf_size < size){return 1;}memcpy(data, buffer, size);*data_size = size;return 0;
}int simplest_aac_parser(char *url)
{int data_size = 0;int size = 0;int cnt=0;int offset=0;//FILE *myout=fopen("output_log.txt","wb+");FILE *myout=stdout;unsigned char *aacframe=(unsigned char *)malloc(1024*5);unsigned char *aacbuffer=(unsigned char *)malloc(1024*1024);FILE *ifile = fopen(url, "rb");if(!ifile){printf("Open file error\n");return -1;}printf("-----+- ADTS Frame Table -+------+\n");printf(" NUM | Profile | Frequency| Size |\n");printf("-----+---------+----------+------+\n");while(!feof(ifile)){data_size = fread(aacbuffer+offset, 1, 1024*1024-offset, ifile);unsigned char* input_data = aacbuffer;while(1){int ret=getADTSframe(input_data, data_size, aacframe, &size);if(ret==-1){break;}else if(ret==1){memcpy(aacbuffer,input_data,data_size);offset=data_size;break;}char profile_str[10]={0};char frequence_str[10]={0};unsigned char profile=aacframe[2]&0xC0;profile=profile>>6;switch(profile){case 0: sprintf(profile_str,"Main");break;case 1: sprintf(profile_str,"LC");break;case 2: sprintf(profile_str,"SSR");break;default:sprintf(profile_str,"unknown");break;}unsigned char sampling_frequency_index=aacframe[2]&0x3C;sampling_frequency_index=sampling_frequency_index>>2;switch(sampling_frequency_index){case 0: sprintf(frequence_str,"96000Hz");break;case 1: sprintf(frequence_str,"88200Hz");break;case 2: sprintf(frequence_str,"64000Hz");break;case 3: sprintf(frequence_str,"48000Hz");break;case 4: sprintf(frequence_str,"44100Hz");break;case 5: sprintf(frequence_str,"32000Hz");break;case 6: sprintf(frequence_str,"24000Hz");break;case 7: sprintf(frequence_str,"22050Hz");break;case 8: sprintf(frequence_str,"16000Hz");break;case 9: sprintf(frequence_str,"12000Hz");break;case 10: sprintf(frequence_str,"11025Hz");break;case 11: sprintf(frequence_str,"8000Hz");break;default:sprintf(frequence_str,"unknown");break;}fprintf(myout,"%5d| %8s|  %8s| %5d|\n",cnt,profile_str ,frequence_str,size);data_size -= size;input_data += size;cnt++;}   }fclose(ifile);free(aacbuffer);free(aacframe);return 0;
}int main()
{simplest_aac_parser((char*)"./audio_chn0.aac");return 0;
}

保存后, gcc simplest_mediadata_aac.cpp编译,运行结果:
在这里插入图片描述

在这里插入图片描述

🎄四、总结

👉本文介绍用编辑器打开aac文件,怎样去分析,了解后,可以对aac文件有更深的认识。最后,借鉴了一份解析aac文件的源码。

在这里插入图片描述
如果文章有帮助的话,点赞👍、收藏⭐,支持一波,谢谢 😁😁😁

参考资料:
视音频数据处理入门:AAC音频码流解析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/236542.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大创项目推荐 深度学习 植物识别算法系统

文章目录 0 前言2 相关技术2.1 VGG-Net模型2.2 VGG-Net在植物识别的优势(1) 卷积核&#xff0c;池化核大小固定(2) 特征提取更全面(3) 网络训练误差收敛速度较快 3 VGG-Net的搭建3.1 Tornado简介(1) 优势(2) 关键代码 4 Inception V3 神经网络4.1 网络结构 5 开始训练5.1 数据集…

Python知识(1/20):变量、表达式、什么是程序?

23年是AI井喷的一年&#xff0c;我对AI的态度是恐惧的&#xff0c;以往我只需要CRUD就能需要的工作&#xff0c;AI能够编写出来&#xff0c;虽然现在还有很多缺陷&#xff0c;但是我比较喜欢向前看&#xff0c;在我未来我感觉我能遇到我被AI替代的那天。 我该怎能么办呢&#…

基于APB总线的SM4密码协处理器实现(附Verilog代码)

基于APB总线的SM4密码协处理器实现&#xff08;附Verilog代码&#xff09; 本文内容摘要理论依据和设计内容SM4分组密码算法APB_slave协处理器 测试过程与结果调试经历测试结果SM4.0部分测试APB协处理器部分测试 整体代码 本文内容摘要 本文使用Verilog语言实现SM4加密协处理器…

智能养殖解决方案:如何利用485转WiFi无线路由

随着科技的发展&#xff0c;智能养殖已经成为了一种新兴的生产方式。智能养殖不仅可以提高养殖效率和质量&#xff0c;还可以减少资源浪费和环境污染。其中&#xff0c;485转WiFi无线路由器作为智能养殖解决方案中的重要组成部分&#xff0c;发挥着关键的作用。以下将从三个方面…

多维时序 | MATLAB实现BiTCN-Multihead-Attention多头注意力机制多变量时间序列预测

多维时序 | MATLAB实现BiTCN-Multihead-Attention多头注意力机制多变量时间序列预测 目录 多维时序 | MATLAB实现BiTCN-Multihead-Attention多头注意力机制多变量时间序列预测预测效果基本介绍模型描述程序设计参考资料 预测效果 基本介绍 多维时序 | MATLAB实现BiTCN-Multihea…

IP子网划分【专题突破】

1、IP地址基础 IPv4地址是32位&#xff0c;采用点分十进制方式表示&#xff0c;其次必须掌握二进制的转换。 IPv6地址是128位&#xff0c;采用冒号分隔的十六进制表示方法。 2、IP地址的分类 RFC1918规定的私有地址 A类地址范围&#xff1a;10.0.0.0-10.255.255.255(1个A类…

EasyExcel使用: RGB字体,RGB背景颜色,fillForegroundColor颜色对照表

EasyExcel使用: RGB字体&#xff0c;RGB背景颜色&#xff0c;fillForegroundColor颜色对照表 使用EasyExcel导出表格可能会对字体颜色和单元格背景颜色进行自定义的修改。 可以自定义字体颜色或者每个单元格的颜色 要想自定义颜色&#xff0c;需要重写CellWriteHandler接口&am…

CAS为什么还存在线程安全问题(从所谓的ABA问题再学CAS)

概述 之前学习 CAS&#xff0c;从 Java 代码层面知道其原理&#xff0c;借助一条 CPU 原子指令&#xff0c;通过不断地自旋去比较&#xff08;compare&#xff09;和&#xff08;and&#xff09;赋值&#xff08;set&#xff09;。当时对线程安全的认知停留在将多条 Java 语句…

数据管理平台Splunk Enterprise本地部署结合内网穿透实现远程访问

文章目录 前言1. 搭建Splunk Enterprise2. windows 安装 cpolar3. 创建Splunk Enterprise公网访问地址4. 远程访问Splunk Enterprise服务5. 固定远程地址 前言 Splunk Enterprise是一个强大的机器数据管理平台&#xff0c;可帮助客户分析和搜索数据&#xff0c;以及可视化数据…

二维码智慧门牌管理系统升级的重要性与功能

文章目录 前言一、系统的双重作用二、系统的挑战与未来发展三、结论与未来展望四、为未来智慧管理铺平道路 前言 随着科技不断进步&#xff0c;智能化管理已贯穿于我们日常生活的各个领域。其中&#xff0c;二维码智慧门牌管理系统升级解决方案因其独特的考核评估系统和实用功…

基于红外传感的野外变压站生物入侵检测系统(论文+源码)

1. 系统设计 本课题为基于红外传感的野外变压站生物入侵检测系统&#xff0c;主要是针对野外变压站生物入侵的问题进行设计&#xff0c;整个系统的框图如图经过上述的功能需求分析和各个关键模块的选型后&#xff0c;最终得到了如图2.1所示的&#xff0c;采用STC89C52单片机为…

移动安全APP--Frida+模拟器,模拟器+burp联动

最近测APP被通报了&#xff0c;问题点测得比较深&#xff0c;涉及到frida和burp抓包&#xff0c;一般在公司可能会有网络的限制&#xff0c;手机没办法抓包&#xff0c;我就直接在模拟器上试了&#xff0c;就在这记录一下安装过程。 目录 一、Frida安装 二、burp与逍遥模拟器…

外卖系统海外版:技术智能引领全球美食新潮流

随着全球数字化浪潮的推动&#xff0c;外卖系统海外版不仅是食客们品味美食的便捷通道&#xff0c;更是技术智能在美食领域的引领者。本文将深入剖析其背后的技术实现&#xff0c;揭开代码带来的美食革新。 多语言支持&#xff1a;构建全球美食沟通桥梁 def multilingual_su…

获取本机公网内网 ip 地址

获取公网地址 winr 输入 cmd 打开终端 获取公网地址命令 curl http://icanhazip.com # 或者 curl http://ifconfig.me在线工具网址 获取内网 ip ipconfig

WebGL开发虚拟旅游应用

WebGL可以用于开发虚拟旅游应用&#xff0c;提供用户在浏览器中探索虚拟景点和环境的交互体验。以下是在WebGL中开发虚拟旅游应用的一般流程&#xff0c;希望对大家有所帮助。北京木奇移动技术有限公司&#xff0c;专业的软件外包开发公司&#xff0c;欢迎交流合作。 1.需求分析…

B040-SpringMVC进阶 JSON 上传下载 拦截器 执行流程

目录 项目准备JSONJSON作用JSON演示ResponseBody注解日期返回json格式 文件上传与下载文件上传准备工作文件项上传文件完成 文件下载文件下载页面下载业务代码 SpringMVC的执行流程 项目准备 大体步骤&#xff1a; 新建dynamic web project&#xff0c; 修改默认输出的class路…

​ SK Ecoplant借助亚马逊云科技,海外服务器为环保事业注入新活力

在当今全球面临着资源紧缺和环境挑战的大背景下&#xff0c;数字技术所依赖的海外服务器正成为加速循环经济转型的关键利器。然而&#xff0c;很多企业在整合数字技术到运营中仍然面临着一系列挑战&#xff0c;依然存在低效流程导致的不必要浪费。针对这一问题&#xff0c;SK E…

确保调查问卷合理性:设计、实施与评估指南

在如今的信息时代&#xff0c;问卷调查成为了一种常见的数据采集方式。问卷广泛用于市场调研、科学研究、员工幸福评估等各个领域。但是&#xff0c;问卷调查的有效性和可靠性在于问卷设计和实施过程。怎么确保调查问卷的合理性&#xff1f;首先建立研究目的、正确选择问卷种类…

EDA实验-----直流电机驱动设计(Quartus II )

目录 一、实验目的 二、实验仪器设备 三、实验的重点和难点 四、实验原理 五、实验步骤 六、实验报告 七、实验过程 1.分频器代码 2.方向选择器 3.直流电动机工作原理 4.电路连接图 5.文件烧录 一、实验目的 了解直流电机控制的工作原理和实现的方法。掌握PWM波控…

Jupyter Notebook修改默认工作目录

1、参考修改Jupyter Notebook的默认工作目录_jupyter文件路径-CSDN博客修改配置文件 2.在上述博客内容的基础上&#xff0c;这里不是删除【%USERPROFILE%】而是把这个地方替换为所要设置的工作目录路径&#xff0c; 3.【起始位置】也可以更改为所要设置的工作目录路径&#x…