H.263可以2~4Mbps的传输速度实现标准清晰度广播级数字电视(符合CCIR601、CCIR656标准要求的720*576);而H264由于算法优化,可以低于2Mbps的速度实现标清数字图像传送;H.264 High Profile 可实现低于1.5Mbps的传输带宽下,实现1080p全高清视频传输;H265相比h264进步更为明显,可以实现利用1Mbps以下的传输速度传送1080P(分辨率1920*1080)全高清音视频传送。除了在编解码效率上的提升外,在对网络的适应性方面H.265也有显著提升,可很好运行在Internet等复杂网络条件下。
在运动预测方面,下一代算法将不再沿袭“宏块”的画面分割方法,而可能采用面向对象的方法,直接辨别画面中的运动主体。在变换方面,下一代算法可能不再沿袭基于付立叶变换的算法族,有很多文章在讨论,其中提请大家注意所谓的“超完备变换”,主要特点是:其MxN的变换矩阵中,M大于N,甚至远大于N,变换后得到的向量虽然比较大,但其中的0元素很多,经过后面的熵编码压缩后,就能得到压缩率较高的信息流。
关于运算量,H.264的压缩效率比MPEG-2提高了1倍多,其代价是计算量提高了至少4倍,导致高清编码需要100GOPS的峰值计算能力。尽管如此,仍有可能使用目前的主流IC工艺和普通设计技术,设计出达到上述能力的专用硬件电路,且使其批量生产成本维持在原有水平。5年(或许更久)以后,新的技术被接受为标准,其压缩效率应该比H.264至少提高1倍,估计对于计算量的需求仍然会增加4倍以上。随着半导体技术的快速进步,相信届时实现新技术的专用芯片的批量生产成本应该不会有显著提高。因此,500GOPS,或许是新一代技术对于计算能力的需求上限。
在数字视频应用产业链的快速发展中,面对视频应用不断向高清晰度、高帧率、高压缩率方向发展的趋势,当前主流的视频压缩标准协议H.264(AVC)的局限性不断凸显。同时,面向更高清晰度、更高帧率、更高压缩率视频应用的HEVC(H.265)协议标准应运而生。本文重点分析了下一代视频压缩协议标准HEVC(H.265)的技术亮点,并对其在未来应用中将给整个产业带来的深刻变化予以展望。
H.264(AVC)从2003年5月草稿发布以来,凭借其相对于以往的视频压缩标准在压缩效率以及网络适应性方面的明显优势,逐步成为视频应用领域的主流标准。根据 MeFeedia的数据,由于iPad 以及其它新兴设备大多支持H.264 硬件加速,至2011年底,80%的视频使用H.264编码,并且随着支持H.264解码的设备不断增多,这一占有率还将进一步增长。
但是,随着数字视频应用产业链的快速发展,视频应用向以下几个方向发展的趋势愈加明显:
l 高清晰度(Higher Definition):数字视频的应用格式从720 P向1080 P全面升级,在一些视频应用领域甚至出现了4K x 2K、8K x 4K的数字视频格式;
l 高帧率(Higher frame rate ):数字视频帧率从30 fps向60fps、120fps甚至240fps的应用场景升级;
l 高压缩率(Higher Compression rate ):传输带宽和存储空间一直是视频应用中最为关键的资源,因此,在有限的空间和管道中获得最佳的视频体验一直是用户的不懈追求。
由于数字视频应用在发展中面临上述趋势,如果继续采用H.264编码就出现的如下一些局限性:
(1) 宏块个数的爆发式增长,会导致用于编码宏块的预测模式、运动矢量、参考帧索引和量化级等宏块级参数信息所占用的码字过多,用于编码残差部分的码字明显减少。
(2) 由于分辨率的大大增加,单个宏块所表示的图像内容的信息大大减少,这将导致相邻的4 x 4或8 x 8块变换后的低频系数相似程度也大大提高,导致出现大量的冗余。
(3) 由于分辨率的大大增加,表示同一个运动的运动矢量的幅值将大大增加,H.264中采用一个运动矢量预测值,对运动矢量差编码使用的是哥伦布指数编码,该编码方式的特点是数值越小使用的比特数越少。因此,随着运动矢量幅值的大幅增加,H.264中用来对运动矢量进行预测以及编码的方法压缩率将逐渐降低。
(4) H.264的一些关键算法例如采用CAVLC和CABAC两种基于上下文的熵编码方法、deblock滤波等都要求串行编码,并行度比较低。针对GPU/DSP/FPGA/ASIC等并行化程度非常高的CPU,H.264的这种串行化处理越来越成为制约运算性能的瓶颈。
为了面对以上发展趋势,2010年1月,ITU-T VCEG(Video Coding Experts Group) 和ISO/IEC MPEG(Moving Picture Experts Group)联合成立JCT-VC(Joint Collaborative Team on Video Coding)了联合组织,统一制定下一代编码标准:HEVC(High Efficiency Video Coding)。
HEVC协议标准计划于2013年2月份正式在业界发布,目前整个框架结构已基本确定。截至2012年4月份,JCT-VC联合工作组已经召开了第八次会议,并于2012年2月17日发布了第一版内部草稿《High efficiency video coding (HEVC) text specification draft 6》,计划2012年7月发布第一版公开版草稿,在H.264标准2~4倍的复杂度基础上,将压缩效率提升一倍以上。
下表列出了HM4.0(HEVC参考代码)相对于JM18.0 BD-Rate对比:
表1 HEVC相对于H.264的压缩效率提升数据列表
由表中数据可见,在Low Delay的情况下,HEVC(HM4.0)相对于H.264比特率平均下降44%。
二、 HEVC(H.265)的技术亮点
作为新一代视频编码标准,HEVC(H.265)仍然属于预测加变换的混合编码框架。然而,相对于H.264,H.265 在很多方面有了革命性的变化。HEVC(H.265)的技术亮点有:
1. 灵活的编码结构
在H.265中,将宏块的大小从H.264的16x16扩展到了64x64,以便于高分辨率视频的压缩。同时,采用了更加灵活的编码结构来提高编码效率,包括编码单元(Coding Unit)、预测单元(Predict Unit)和变换单元(Transform Unit)。如图1所示:
图1 编码单元(CU)、预测单元(PU)、变换单元(CU)
其中编码单元类似于H.264/AVC中的宏块的概念,用于编码的过程,预测单元是进行预测的基本单元,变换单元是进行变换和量化的基本单元。这三个单元的分离,使得变换、预测和编码各个处理环节更加灵活,也有利于各环节的划分更加符合视频图像的纹理特征,有利于各个单元更优化的完成各自的功能。
2. 灵活的块结构----RQT(Residual Quad-tree Transform)
RQT是一种自适应的变换技术,这种思想是对H.264/AVC中ABT(Adaptive Block-size Transform)技术的延伸和扩展。对于帧间编码来说,它允许变换块的大小根据运动补偿块的大小进行自适应的调整;对于帧内编码来说,它允许变换块的大小根据帧内预测残差的特性进行自适应的调整。大块的变换相对于小块的变换,一方面能够提供更好的能量集中效果,并能在量化后保存更多的图像细节,但是另一方面在量化后却会带来更多的振铃效应。因此,根据当前块信号的特性,自适应的选择变换块大小,如图2所示,可以得到能量集中、细节保留程度以及图像的振铃效应三者最优的折中。
图2 灵活的块结构示意图
3、采样点自适应偏移(Sample Adaptive Offset)
SAO在编解码环路内,位于Deblock之后,通过对重建图像的分类,对每一类图像像素值加减一个偏移,达到减少失真的目的,从而提高压缩率,减少码流。
采用SAO后,平均可以减少2%~6%的码流,而编码器和解码器的性能消耗仅仅增加了约2%。
4、自适应环路滤波(Adaptive Loop Filter)
ALF在编解码环路内,位于Deblock和SAO之后,用于恢复重建图像以达到重建图像与原始图像之间的均方差(MSE)最小。ALF的系数是在帧级计算和传输的,可以整帧应用ALF,也可以对于基于块或基于量化树(quadtree)的部分区域进行ALF,如果是基于部分区域的ALF,还必须传递指示区域信息的附加信息。
5、并行化设计
当前芯片架构已经从单核性能逐渐往多核并行方向发展,因此为了适应并行化程度非常高的芯片实现,HEVC/H265引入了很多并行运算的优化思路, 主要包括以下几个方面:
(1) Tile
如图3所示,用垂直和水平的边界将图像划分为一些行和列,划分出的矩形区域为一个Tile,每一个Tile包含整数个LCU(Largest Coding Unit), Tile之间可以互相独立,以此实现并行处理:
图3 Tile划分示意图
(2) Entropy slice
Entropy Slice允许在一个slice内部再切分成多个Entropy Slices,每个Entropy Slice可以独立的编码和解码,从而提高了编解码器的并行处理能力:
图4 每一个slice可以划分为多个Entropy Slice
(3) WPP(Wavefront Parallel Processing)
上一行的第二个LCU处理完毕,即对当前行的第一个LCU的熵编码(CABAC)概率状态参数进行初始化,如图5所示。因此,只需要上一行的第二个LCU编解码完毕,即可以开始当前行的编解码,以此提高编解码器的并行处理能力:
图5 WPP示意图
6、H.264中已有特性的改进
相对于H.264,H.265标准的算法复杂性有了大幅提升,以此获得较好的压缩性能。H.265在很多特性上都做了较大的改进,如表2所示:
表2 H.264和H.265关键特性对比
三、 HEVC(H.265)技术应用前景展望
H.265标准是在H.264标准的基础上发展起来的,结合H.264在视频应用领域的主流地位可以预见H.265协议在未来广大的发展前景。
世界的一些主流电视组织以及媒体运营商已经选择H.264作为媒体格式标准,一些主要的编解码设备厂商也一直积极参与到H.265标准的研究当中。华为是ITU-T视讯标准的主要Reporter(报告人)和Editor(编辑者)。作为国际电信联盟(ITU-T)成员单位,华为牵头并参与制订了多项国家标准和行业、企业标准。在H.265协议制定期间,华为提交了多项相关提案、建议,并提供了非常典型的应用场景测试序列,得到ITU-T的高度认可和接纳。华为提供的ChinaSpeed序列已经被标准组织采纳作为Class F的标准测试序列。
随着芯片处理能力越来越强,算法复杂性对应用的影响因素越来越小。相反,在算法实时通讯应用以及IPTV应用中,业务的不断扩展和需求的增加使得有限的带宽资源逐渐成为瓶颈,高压缩率的编码是解决这一难题的有效技术手段,这也为H.265在基于IP进行流媒体服务领域的应用奠定了坚实的基础。目前很多电信运营商使用H.264标准作为其媒体格式,也有很多厂商推出了基于H.264标准的机顶盒以及基于H.264标准的视频会议解决方案。
华为作为全球领先的电信解决方案供应商,是国内目前最大的视频会议研发机构,从1993年华为正式推出ViewPoint系列视频会议产品以来,已经发布了五代视频会议产品,在视频通信领域目前获得600多项专利受理,其中国际专利100多项。华为能够提供全系列的视频会议产品,包括智真视频会议系统、高清视频会议系统、标清视频会议系统以及基于IPTV的解决方案。根据Frost& Sullivan咨询报告,2011年华为视频会议解决方案市场占有率全球排名前三,智真的市场占有率全球排名第二。华为作为研究HEVC的第一梯队企业,密切关注H.265标准的发展,并将率先推出H.265相关的视讯产品。
四、 结束语
HEVC(H.265)标准预计2013年2月发布正式版本,由于其在压缩效率、并行处理能力以及网络适应性方面的极大改进,它的发展和应用必将把视频编解码理论和应用推向一个新的高度。
五、 参考文献
1. Gary J. Sullivan and Jens-Rainer Ohm, "Recent developments in standardization of high efficiency video coding (HEVC)", SPIE Applications of Digital Image Processing XXXIII, Andrew G. Tescher (editor), Proceedings of SPIE Volume 7798, Paper number 7798-30, August, 2010.
2. http://phenix.int-evry.fr/jct
3. ON RESIDUAL QUAD-TREE CODING IN HEVC, Yih Han Tan, Chuohao Yeo, Hui Li Tan, Zhengguo Li,978-1-4577-1434-4/11 ©2011 IEEE
4. 从H.264向H.265的数字视频压缩技术升级, 刘国梁,铁路通信信号工程技术(RSCE) 2011年6月,第8卷第3期
5. High Efficiency Video Coding (HEVC) text specification draft 6, JCTVC-H1003
6. 陈清.H.265 标准现状和发展应用趋势[J].中国多媒体通信,2008(10):12-15.
并不是所有人和所有市场接受新鲜事物的程度都是一样的,特别是对于高端的技术来说,一个新技术的诞生需要长时间磨合,在人们适应新技术的同时该技术也需要不停地作调整,以达到最满意的水平。正如大家用2年的时间从认识网络高清到使用高清监控,同样面对视频压缩技术标准时,H.265却有话要说。
众所周知,在视频领域中目前使用最广泛的压缩协议为H.264协议,随着视频领域不断的拓宽和人们对视频要求不断提高,H.264即将升级成H.265,然而,问题就出现在这个新的压缩标准上。一个新标准的出现必然会存在专利权,那么在借鉴前辈之后,H.265是否收费则成了关注的话题。
专利“双刃剑” H.265标准不收费最靠谱?
H.265收费与否看H.264
对于视频压缩标准,在H.264之前还有很多,但是当人们视觉效果必须满足在1080p高清之后,自然H.264成了主角。H.265要不要收费当然还得看前辈的"脸色",由于H.264是由多项专利所组成的影片格式,虽然专利权所有组织MPEGLA先前允诺在一定期限内可以免费授权H.264提供给消费者使用,但未来是否要收费仍然是个疑虑。以目前来看,若使用一项新的标准自然存在着一定的风险,若H.264还处于免费时,若H.265收费有些似乎对市场推广会有影响。
H.265优于H.264收费可不可以?
在大安防市场中,H.264的出现,使得在同等速率下,H.264能够比H.263减小50%的码率。也就是说,用户若想体验高质量的视频服务,再带宽减半即可轻松实现。H.264不但有助于节省庞大开支,还可以提高资源的使用效率,同时令达到商业质量的视频会议服务拥有更多的潜在客户。H.265若要在视频会议中体现,那么该技术必须要优于H.264。
H.264其实就是高度压缩数字视频编解码器标准,H.265与H.264出自同一专家组,是在该技术基础之上的一种延伸。目前H.265只应用于商用领域,在大家所常见的领域中几乎很少被人了解。
新的H.265视频标准在数据传输和码流效率上较之前的编解码算法,有明显的提升。H.263到H.264提高了50%,而H.264到H.265将提高67%。据工业和信息化部电信研究院通信标准研究所工程师栗蔚女士称,针对网络传输流媒体的分辨率越来越大,对带宽要求也越来越高的情况下,H.265可提供类似质量下更小的码率。或许在同样的图像质量下,带宽要求将会缩减到1/3。
未来在视频标准上,虽然H.264并没有收费,但是单以H.265的技术水平来看,似乎收费又有合理的因素。同样,H.265在市场使用上依旧面临两难,一个是该专利的独特创新权,另一个则还是市场的普及率,似乎从下图我们可以看到,H.264目前的使用情况的确会给H.265带来不少压力。
H.265编码对视频的损伤
与HD-SDI非压缩视频图像不同的是,经过压缩的视频图像或多或少的都会对图像有所损伤,特别还是在网络传输过程中,更是避免不了丢包的现象。客观地说,只要视频图像存在压缩既会有损伤,当然在高效率的压缩也难逃这一弊端。从客观情况分析来看,视频编码损伤主要有三大类:编码标准、IP网络、Error-prone通信,细致地说这对图像模糊、噪声、数据丢包、延时、抖动以及无线信道传输带来的失真都不可避免。
尽管H.265真的能够实现超出H.264的多倍高清,一些视频损失是通过数据测算出来的,肉眼则看到就是高清晰的画质。以目前大安防市场的视频会议来看,在高清晰画质的不断需求之下,高压缩标准的确能够进一步推动市场,只不过成本还是用户最为关注的话题。理想的价格才是最终产品流向市场的王道。
H.265应用前景
对于H.265高压缩标准,有高清视频的地方就少不了它的身影。以大安防市场为例,高清视频会议中,1080p视频会议已经成为市场的主流。据栗工程师介绍,目前根据视频会议市场需求的调查数据显示,高清视频会议的需求和使用率正在以高达30%~40%的速度增长。除了企业级别领域外,高清在线视频和高清电视也可以采用H.265这个新协议。优酷土豆、奇艺、乐视网等都是网友们的最爱。
2013年将发布H.265标准
目前H.265草案已经完成,预计在2013年初发布该标准,届时该标准的正式诞生则又象征这高清视频标准的再一次飞跃,从标清的高清,从高清到超高清,未来在视频会议、视频监控市场将得到很好的推广和使用。当然,在保障该专利的利益下,不收费的H.265才是最靠谱的。