h264的码率控制 JVT-G012

开始看h264的码率控制,很多地方都提到 G012,拿来做为参考比较,看来很有必要研究清楚。

偶这人,E文文档不翻译的话,看过就忘了,于是草草翻译了下,因为不打算做B帧,也不准备在同一帧中使用不同的MB,这些地方就跳过了。

Title:

Adaptive Basic Unit Layer Rate Control for JVT

 

1.     Introduction

 

编码器使用码率控制来控制编码码流变化的bit rate特性,以追求给定目标bit rate下的高质量解码。码率控制因此成为了编码器的必要部分,并在标准中被广泛的研究,比如MPEG2,MPEG4,H.263等等。因此,他也被JVT充分的研究。JVT的码率控制与其他的标准相比更加困难。这是因为量化参数被同时应用到码率控制算法(rate control algorithm)和码率失真最优化(rate distortion optimization RDO)中,这样在进行码率控制研究的时候导致了蛋鸡悖论:要对当前帧的宏块进行RDO,需要用当前帧或者宏块的MAD决定每个宏块的QP值。然而,当前帧或宏块的MAD只有在RDO之后才能算出。此外,可用的编码信道带宽也可能是固定的或是随时间变化的。因此我们需要同时考虑固定bit rate(CBR)和可变bit rate(VBR)。然而现存的方案集中与CBR。

 

JVT通过引入基本单元的概念和线性模型,提出了一种自适应基本单元层的码率控制算法。这个基本单元可以是帧,条带,或者宏块MB,线性模型通过前一帧的相关位置的基本单元来预测当前帧当前基本单元的MAD。蛋鸡悖论解决如下:当前帧的目标码率采用漏桶(leaky bucket)模型和线性跟踪理论根据预先定义的帧率,当前缓冲区占有率,目标缓冲区级别和可用的信道带宽计算。因为未编码的基本单元MAD未知,所以剩余的bit平均分配到未编码的当前帧基本单元中。当前基本单元的MAD靠线性模型使用前一帧相关位置的基本单元的MAD来预测。二次率失真模型(RD)用于计算相应的QP,这个值用与当前基本单元中每个宏块的最小率失真(rate distortion optimization)我们同时也关注VBR。我们设计了虚拟缓冲区来根据信道带宽的动态变化而调整编码程序。该缓冲区是不能向上或者向下溢出的。因为该模型和漏桶模型基本一致,我们的码率控制因此符合理想参考解码器(hypothetical reference decoder)

我们测试VBR和CBR来验证我们的设计。VBR比特率曲线是一条预定义的曲线。他表明实际生成的比特数保持接近比特率曲线并且缓冲并没有溢出。CBR中,我们的码率控制方案的编码效率与使用固定QP值的比较。编码的计算率由我们的码率控制方案指定。我们方案的编码效率提高了1.02dB,所有测试序列的平均PSNR提高了0.32dB。我们也同使用AHM2.0软件AHG推荐的F086进行比较。PSNR提高了1.73dB,最高损失0.25dB,必须提及的是我们的方案是one pass而F086是two pass(two pass:采用2次编码,每一帧的第一次编码用来产生第2次编码所需要的编码策略)

  1. Preliminary Knowledge

 

在这一章中,我们提出关于H.264码率控制的相关问题。

2.1 The Chicken and Egg Dilemma

涉及码率控制的MB编码过程如下

因为QP由码率控制和RDO指定,这里就有个问题,当进行码率控制时:为MB做RDO,MB的QP应该首先使用MB的MAD决定。然而,当前MB的MAD只有在做了RDO之后才能得到。这是一个典型的蛋鸡悖论。因此,H.264的码率控制要比MPEG2,MPEG4,H.263的更加困难。学习H.264的码率控制,我们必须解决这个问题去建立当前MB的MAD。除此之外,我们也应该计算当前MB的目标码率和决定共享相同QP的连续MB数量。为了解决这些问题,我们需要下列的预备知识。

2.2 Definition of A Basic Unit

基本单元的概念定义。

定义1:假设一帧由MB组成,基本单元定义为一组由MB组成的连续MB,其中属于

在一帧中基本单元的总数如下

                                                                                (1)

假设一个基本单元可以为MB,条带,场,帧。例如,一个QCIF大小的视频序列 = 99. 根据定义1, 可以为 1, 3, 9, 11, 33, or 99. 相应的 分别为 99, 33, 11, 9, 3, and 1,

这表明使用一个较大的基本单元,可以实现较高的PSNR值同时码率波动也就更大。换句话说,使用较小基本单元,码率波动会显著变小,但是会轻微损失PSNR

2.3 A Fluid Flow Traffic Model

我们现在提出一种流体流动通信模型(fluid flow traffic model)来计算当前编码帧的目标bit。标识一组图片(GOP)的总帧数。表示在ithGOP中的jth帧,表示编码jth帧后虚拟缓存的占有率。那么我们得到

                                        (2)

 

其中A()是ithGOP中jth帧生成的比特数。u()是可用信道带宽,可以使VBR,也可以是CBR,是预定义的帧率,是缓存大小,其最大值由不同的level和profile决定。

注意初始缓冲区的值设置为,这个是可以设置为其他的值的,通常,初始缓冲区值可以设置为一个小的值如果比特波动很小的话。

这个模型和漏桶模型[7]类似,令,在我们的设计中,我们保证码流包含在上述的虚拟缓存中,因此,当码流以参数 and输入到HRD,中,HRD缓存是不会向上或者向下溢出的,换句话说,我们的码率控制方案是符合HRD的。

2.4  A Linear Model for MAD Prediction

现在引入线性模型在当前帧中预测当前基本单元的MAD。

这个同样是依赖于前一帧中相关位置的基本单元。假设当前帧中当前基本单元的预测MAD和前一帧相关位置基本单元的实际MAD分别表示为为 和,线性预测模型由下式给出

                                                                     (3)

其中 和为预测模型的2个相关系数。 和的初始值分别设置为1和0,他们在每个基本单元被编码后更新。线性模型被用来解决蛋鸡悖论。

使用基本单元的概念和模型(2)模型(3),我们方案的步骤如下:

1. 使用fluid traffic模型(2)和线性跟踪理论[5]计算当前帧的目标bit

2.  把剩余的bit平均分配给给当前帧的未编码基本单元。

3. 使用前一帧相关位置的基本单元的实际MAD通过线性模型(3)来预测当前帧基本单元的MAD。

4. 使用二次RD模型计算相应的参数

5.  使用来自step4的QP计算当前基本单元每个MB的RDO

如果基本单元选择为帧,那么我们的码率控制方案由2层组成:GOP层和帧层。否则,应该加上基本单元层码率控制。他们会在下面详细说明。

 

 

以上内容为转载,个人接着翻译以后的章节,属于原创了吧。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/453760.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android RecyclerView嵌套EditView实时更新Item数据

一、场景(例如:购物车) 1、当我们需要以列表样式管理某些数据时,可能需要列表项的某个字段可编辑 2、编辑Item上的某个字段后可能还要更新相关字段的值 二、可能遇到的问题 1、列表滑动导致输入框中的数据错位(或者焦点…

workbench拓扑优化教程_优化技术在水泵水力设计的应用(上篇)

文章来源:安世亚太官方订阅号(搜索:Peraglobal)CFD技术在泵的内流数值模拟、研究泵内部流动规律和结构方面已广泛应用,取得了很多成果。但是初步设计的产品如果通过CFD仿真得到的性能曲线不能满足使用要求,…

深度学习之 TensorRT

1 简介 TensorRT是一个高性能的深度学习推理(Inference)优化器,可以为深度学习应用提供低延迟、高吞吐率的部署推理。TensorRT可用于对超大规模数据中心、嵌入式平台或自动驾驶平台进行推理加速。TensorRT现已能支持TensorFlow、Caffe、Mxne…

H.264笔记

H.264标准写得比较繁复,所以考虑在浏览完Whitepaper之后就开始研读X264代码。X264代码风格还是比较清晰简洁的。根据对标准得理解,Picture Order Count在Slice解码的一开始就被提及:I0 B1 B2 P3 B4 B5 P6I0 P3 B1 B2 P6 B4 B5于是I0的POC是0&…

进制转换中dbho是什么意思_什么是网段?二进制十进制如何互相转换?看完这篇,你就全明白了...

之前的文章讲了ip,子网掩码,网关的关系,今天着重讲一下网段。我们用傻瓜交换机通讯时,一个网段的设备才能互相通讯,怎么能判断两个ip是同一个网段呢?今天就简单的说一下。(这篇文章用语音听可以起到催眠作用…

【网络流24题】星际转移问题(最大流)

【网络流24题】星际转移问题(最大流) 题面 Cogs 题解 因为天数是未知的,所以我们要想办法处理天数 可以选择二分或者依次累加天数 因为数据范围较小,使用二分可能反而复杂度会增高 所以使用不断累加天数 那么,把所有的…

使用 gunicorn 部署flask项目

1、WSGI协议 Web框架致力于如何生成HTML代码,而Web服务器用于处理和响应HTTP请求。Web框架和Web服务器之间的通信,需要一套双方都遵守的接口协议。WSGI协议就是用来统一这两者的接口的。 2、WSGI容器 常用的WSGI容器有Gunicorn和uWSGI,但G…

软件需求与问题解决

(一) 小满当上项目经理后不久,参与了一个大项目。当时市场签下来的时候,公司里面是欢天喜地的。项目做了一年多。到了交付的时候,用户却很不满意,当初说好的东西,好多都变了卦。用户是上帝&…

flex 换主轴后子元素占满_Chrome72 嵌套 flex 布局修改,你的网站可能会发生布局错乱...

起源2019 年 1 月 29 日,Chrome72 正式版(72.0.3626.81)发布,本次发布带来了一个改变,且没有在更新日志中提及,该改变导致某些网站发生了布局错乱。该改变主要针对的是嵌套的flex布局,下面我们一起看下是怎么回事。问题…

使用 Django + Wusgi + Nginx 部署 Django

如何在生产上部署Django? Django的部署可以有很多方式,采用 nginxuwsgi 的方式是其中比较常见的一种方式。 uwsgi介绍 uWSGI是一个Web服务器,它实现了WSGI协议、uwsgi、http等协议。Nginx中HttpUwsgiModule的作用是与uWSGI服务器进行交换。 WSGI / …

网络学习网址

网络之路博客 http://ccieh3c.com/ 转载于:https://www.cnblogs.com/changha0/p/8179801.html

路由到另外一个页面_Nextjs使用解读一(项目搭建与路由系统)

文章说明:1. 之前想搭建个人博客,由于学习的是react技术栈,所以就到处搜罗资料学了nextjs,配合koa就把博客搭起来了。该系列文章基于我的学习笔记,重新整理了一遍,如果有错误之处,还请指正。2. …

微信获取token -1000

最终翻看微信开发api找到需要去配置IP白名单。只需要配置访问来源IP即可。 转载于:https://www.cnblogs.com/yangjinqiang/p/8184663.html

产品技术和管理

为啥纯粹为消费者传递体验的活动可以价格不菲,几为暴利?——谈客户体验作为客户价值提升之源 不论产品还是服务,如果能够为消费者传递有益的体验,其价值就可以在一般的产品服务之上得以体现;附加了体验的产品&#xff…

Linux 修改系统编码

linux服务器的字符集设置可能影响到网站页面出现 “???” 等问号乱码,还有可能导致文件中的汉字部分出现乱码。有两个原因 服务器没有安装 zh_CN.UTF-8 字符集,导致不支持中文!服务器虽然装了 zh_CN.UTF-8…

jquery ztree 设置勾选_047 JAVA-jQuery

jQuery操作元素属性的值表单:<body><input type"button" name"" id"but1" value"测试获得属性值" /><hr />账号&#xff1a;<input type"text" name"sxtzh" id"zhanghao" value&q…

Opencv undefined reference to `cv::imread() Ubuntu编译

Ubuntu下编译一个C文件&#xff0c;C源程序中使用了opencv&#xff0c;opencv的安装没有问题&#xff0c;但是在编译的过程中出现如下错误&#xff1a; undefined reference to cv::imread(std::string const&, int)undefined reference to cv::noArray()undefined referen…

深度学习目标检测之 YOLO v1

这是继 RCNN&#xff0c;fast-RCNN 和 faster-RCNN 之后&#xff0c;rbg&#xff08;RossGirshick&#xff09;针对DL目标检测速度问题提出的另外一种框架。YOLO V1 增强版本GPU中能跑45fps&#xff0c;简化版本155fps。 论文名&#xff1a; 《You Only Look Once&#xff1a;…

编程珠玑番外篇

1.Plan 9 的八卦 在 Windows 下喜欢用 FTP 的同学抱怨 Linux 下面没有如 LeapFTP 那样的方便的工具. 在苹果下面用惯了 Cyberduck 的同学可能也会抱怨 Linux 下面使用 FTP 和 SFTP 是一件麻烦的事情. 其实一点都不麻烦, 因为在 LINUX 系统上压根就不需要用 FTP. 为什么呢? 因…

BT下载原理分析

版权声明&#xff1a;本文为博主原创文章&#xff0c;未经博主允许不得转载。 BitTorrent协议。 BT全名为BitTorrent,是一个p2p软件,你在下载download的同时&#xff0c;也在为其他用户提供上传upload&#xff0c;因为大家是“互相帮助”&#xff0c;所以不会随着用户数的增加而…