音频基本概念
声音的本质
音调:频率
音量:振幅
音色:与材质有关,谐波(不规则的正玄波)
采样-量化-编码
采样大小:
一个采样用多少bit存放,目前常用16bit
采样率:
每秒采样多少次, 单位k,常见采样频率:8k、16k、32k、44看、48k;
声道数:
单声道、双声道、多声道
码率:
采样率 X 采样大小 X 声道数
压缩
消除冗余数据
人耳听觉范围外的音频信号: 20hz-20000hz
频域遮蔽效应
- 去除人耳听觉频率范围临界附近的值
- 大声音附近如果有小的声音可以去除
时域屏蔽效应
- 高声附近50ms内如果声音比较小可以去掉
无损压缩
常见的音频编码器
OPUS、AAC、Vorbis、Speex、iLBC、AMR、G.711等
OPUS:
- 目前性能最好、质量最高,但是由于时间短,暂时还没有普及,rtmp协议还不支持它。
AAC:
- 有损压缩算法,目的取缔mp3,压缩率很高、但还能接近原始的质量;
- MPEG-4标准出现后,加入了SBR技术和PS技术,目前常用规格有AAC LC、AAC HE V1、AAC HE V2;
- AAC LV:低复杂度,码流128k
- AAC HE V1:AAC+SBR 分频编码,低频(减少采样率)和高频(增加采样率)分开编码
- AAC HE V2:AAC+SBR+PS 由于声道间相同的性质很大,所以对于其它声道只要存储一些差异性的特征
- AAC格式: ADIF-只能从头开始解码,常用于磁盘文件中;ADTS 每帧都有一个头信息,可以在音频流的任何位置解码,但是占用比较大。
- AAC编码库:Libfdk_AAC > ffmpeg AAC > libfaac > libvo_aacenc
性能对比
作者:夏趣意转秋来
链接:https://www.jianshu.com/p/6fcbfb99b5c1
来源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。
posted on 2019-05-07 17:07 明净 阅读(...) 评论(...) 编辑 收藏