基于上下文自适应可变长熵编码 CAVLC 原理详细分析

CAVLC

CAVLC,即Context-Adaptive Variable-Length Coding,是一种用于视频压缩的编码技术,特别是在MPEG-4视频编码标准中使用。CAVLC是一种熵编码方法,它根据视频数据的上下文信息来调整编码长度,以实现更有效的数据压缩。

CAVLC的主要特点包括:

  1. 上下文适应性:编码器会根据视频帧中的特定上下文来选择最合适的编码长度,例如在图像的平坦区域使用较短的编码,而在边缘区域使用较长的编码。
  2. 可变长度编码:编码的长度不是固定的,而是根据数据的统计特性来确定,这有助于进一步压缩数据。
  3. 效率:CAVLC提供了比固定长度编码更高的压缩效率。

CAVLC通常用于视频编码的残差数据部分,即在变换编码(如DCT)之后,用于编码变换系数。这种编码方式可以显著减少编码后数据的比特率,从而提高视频传输和存储的效率。

CAVLC原理

相关名词解释

  • TotalCoeffs :非零系数,代表ZigZag扫描后序列中非0值的个数;取值 0~16。
  • TrailingOnes :拖尾系数,代表ZigZag扫描后序列中+1,和-1的总个数,取值0~3,如果超过3,则为3,在ZigZag扫描序列中从右到左选取三个,作为拖尾系数,其余的系数就当普通的非零系数;TotalCoeffs和TrailingOnes是通过查表方式,共有4 个变长表格和 1 个定长表格;其中定长表格是6 个比特长,高 4 位表示TotalCoeffs,低 2 位表示TrailingOnes。
  • TotalZeros: 编码最后一个非零系数前零的数目。
  • NC:当前块值,用来决策coeff如何编码的变量; 上述的 5 个表格的选择就是根据 NC 值来决定的。
  • ZerosLeft: 当前系数之前所有的0的个数,其初始值等于TotalZeros。
  • RunBefore: 编码每个非零系数前0的个数。
  • Levels:编码除了拖尾系数之外的非零系数的幅值。

NC 计算

  • 该值的求解过程中,体现了基于上下文的思想。除了色度的直流系数外,其它系数类型的 NC 值是根据当前块左边 4x4 块的非零系数数目(NA)和当前块上面 4x4 块的非零系数数目(NB)求得的。当输入的系数是色度的直流系数时,NC = -1。求 NC 的过程见表 6.10,X 表示与当前块同属于一个片并可用。 选择非零系数数目和拖尾系数数目的编码表格的过程见表 6.11 。
    在这里插入图片描述

Levels 计算

  • 非零系数的幅值(Levels)的组成分为两个部分,前缀(level_prefix)和后缀(level_suffix)。levelSuffixsSize 和 suffixLength 是编码过程中需要使用的两个变量。后缀是长度为 LevelSuffixsSize 位的无符号整数。通常情况下变量 levelSuffixsSize 的值等于变量 suffixLength 的值,有两种情况例外:
    • 当前缀等于 14 时,suffixLength 等于 0,levelSuffixsSize 等于 4。
    • 当前缀等于 15 时,levelSuffixsSize 等于 12。
  • 变量 suffixLength 是基于上下文模式自适应更新的,suffixLength 的更新与当前的 suffixLength 的值以及已经解码好的非零系数的值(Level)有关。suffixLength 数值的初始化以及更新过程如下所示:
    • 普通情况下 suffixLength 初始化为 0,但是当块中有多于 10 个非零系数并且其中拖尾系数的 数目少于 3 个,suffixLength 初始化为 1。
    • 编码在最高频率位置上的非零系数。
    • 如果当前已经解码好的非零系数值大于预先定义好的阈值,变量 suffixLength 加 1。 决定是否要将变量 suffixLength 的值加一的阈值如表 3 所示。第一个阈值是 0,表示在第一个非零系数被编码后,suffixLength 的值总是增加 1。
      在这里插入图片描述
  • Levels 的算法过程
  • 将有符号变成无符号:如果level > 0: levelcode = level << 1 - 2 如果level < 0: levelcode = -(level << 1) - 1 ;(上面的公式对应句法也就是把正数转换为偶数,负数转换为奇数。比如level=1时,levelcode=0,level=-1,levelcode=1)。
  • 根据level_prefix 码表进行查表: level_prefix = levelcode / (1 << suffix_length) 得到level_prefix之后通过查表即可以获得对应该如何编码。(在句法中,有 levelCode = level_prefix << suffix_length,进行转换,就可以得到上面的公式)。
  • Suffix_length表示的是level编码后缀的长度,后缀用0填充,长度为多少就填充多少个0。初始值为0,如果非零系数 > 10且 拖尾数目 < 1的时候,suffix_length初始值为1,if(suffix_length == 0) suffix_length++; else if(level > 3 << (suffix_length - 1) && suffix_length < 6) suffix_length++
    在这里插入图片描述
    在这里插入图片描述

CAVLC示例

  1. 编码残差数据经过变换量化后的4x4 块矩阵举例如下:
    在这里插入图片描述
  2. 量化后矩阵系数有负数的原因:因为在变换前,一般字节的值在 0~255,为了减少像素绝对值的波动,先把数值移位一下,变成-128~127;这样就出现了负数,移位之后再进行变换和量化操作。
  3. 对 4x4 矩阵进行 zigzag 扫描:0、0、5、3、2、-1、0、0、0、1、0、0、0、0、0、0
  4. TotalCoeffs = 5
  5. TrailingOnes = 2
  6. TotalZeros = 5
  7. NC = 3 (假定)
  8. 编码coeff_token:根据TotalCoffes,TrailiingOnes以及NC而确定;确定coeff_token编码为 0000101
    在这里插入图片描述
  9. 编码TrailingOnes:标志位符号Trailing_ones_sign_flag 中 0 表示 +1,1 表示 -1,从右到左依次编码为 01
  10. 编码除拖尾以外的非零系数的Levels:按照 zigzag 的逆序,从右向左。
  • 编码“2”:levelcode = 2 << 1 - 2 = 2; level_prefix = 2 / (1 << 0) = 2; 此时suffix_length == 0,没有后缀,同时suffix_length++,suffix_length = 1. 查表,level_prefix = 2时,编码为“001”,且suffix_length = 0,无后缀,此时编码为:001
  • 编码“3”: levelcode = 3 << 1 - 2 = 4; level_prefix = levelcode / (1 << suffix_length) = 4 / (1 << 1) = 2 ; level_prefix = 2, 编码为“001”,且suffix_length = 1, 填充 1 位“0”,根据公式:if(suffix_length == 0) suffix_length++; else if(level > 3 << (suffix_length - 1) && suffix_length < 6) suffix_length++ ;条件不成立,则此时suffix_length不需要累加 1,suffix_length依旧等于 1,此时编码为:0010
  • 编码"5": levelcode = 5 << 1 - 2 = 8; level_prefix = levelcode / (1 << suffix_length) = 8 / (1 << 1) = 4 ; level_prefix = 4,suffix_length = 1,此时, 编码为“00001”,且此时suffix_length == 1, 填充1位“0”, 根据公式,条件成立,suffix_length需要累加1;suffix_length = 2,最终编码为:000010
  1. 编码最后一个非零系数前的0的个数TotalZeros: 此时TotalZeros = 5, TotalCoeffs = 5, 查第一张表,因为TotalZeros=5,所以此时的编码为 101
    在这里插入图片描述
  2. 对每个非零系数前零的个数RunBefore进行编码,依旧采用ZigZag反序:
  • RunBefore 在以下两种情况下是不需要编码的:
    • 最后一个非零系数(在低频位置上)前零的个数;
    • 如果没有剩余的零需要编码(Σ[RunBefore]=TotalZeros)时,没有必要再进行 RunBefore 的编码;
  • 按照ZigZag逆序分别为 1, -1, 2, 3, 5,查表;
    • 对1编码: zerosLeft = 5, run_before = 3, 编码为010
    • 对-1编码: zerosLeft = 2, run_before = 0, 编码为1
    • 对2编码: zerosLeft = 2, run_before = 0, 编码为1
    • 对3编码: zerosLeft = 2, run_before = 0, 编码为1
    • 对5编码: zerosLeft = 2, run_before = 0, 最后一个系数不需要编码。
      在这里插入图片描述
  1. 最终的CAVLC熵编码之后码流为:0000101010010010000010101010111

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/47171.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【LeetCode:35. 搜索插入位置 + 二分】

&#x1f680; 算法题 &#x1f680; &#x1f332; 算法刷题专栏 | 面试必备算法 | 面试高频算法 &#x1f340; &#x1f332; 越难的东西,越要努力坚持&#xff0c;因为它具有很高的价值&#xff0c;算法就是这样✨ &#x1f332; 作者简介&#xff1a;硕风和炜&#xff0c;…

Linux systemd 服务启动失败Main process exited, code=exited, status=203/EXEC

文章目录 问题描述解决思路及方法排除方向一&#xff1a;nohup排除方向二&#xff1a;使用绝对路径而不是相对路径 问题描述 命令&#xff1a; java -Xms1024m -Xmx1024m -jar /usr/local/java/bin/mashang/app.jar --server.port8532 ----spring.profiles.activetest是可以直…

【Vue】重新理解Vue-Router中的两种路由模式

历史小剧场 唐代实在太高太强了&#xff0c;他们忽忘了民族界限&#xff0c;他们不懂害怕外国人&#xff0c;不懂提防外国人&#xff0c;大量使用外国人当兵作将&#xff0c;结果才弄得不可收拾。于是唐代的府兵一变而成为“藩镇”&#xff0c;军阀割据&#xff0c;胡族临制。-…

uni-app:踩坑路---scroll-view内使用fixed定位,无效的问题

前言&#xff1a; emmm&#xff0c;说起来这个问题整得还挺好笑的&#xff0c;本人在公司内&#xff0c;奋笔疾书写代码&#xff0c;愉快的提交测试的时候&#xff0c;测试跟我说&#xff0c;在苹果手机上你这个样式有bug&#xff0c;我倒是要看看&#xff0c;是什么bug。 安卓…

vscode 远程 Ubuntu 系统

1、在 Ubuntu 下检查 sshd 守护进程是否开启 ps -aux | grep sshd如果没有开启&#xff0c;请在 Ubuntu 下输入指令安装 sudo apt-get install openssh-server2、首先打开 Windows 下的 vscode&#xff0c;点击左下角图标打开远程窗口 3、打开远程窗口&#xff0c;选择“Con…

【HZHY-AI300G智能盒试用连载体验】在华为IoTDA平台上建立设备

目录 华为IoTDA平台 注册IoTDA实例 创建产品 添加设备 本文首发于&#xff1a;【HZHY-AI300G智能盒试用连载体验】 智能工业互联网网关 - 北京合众恒跃科技有限公司 - 电子技术论坛 - 广受欢迎的专业电子论坛! 在上一篇博文中介绍了如何在HZHY-AI300G智能盒创建南向设备&a…

前端特效动画魔法书:文字渐入效果实现,可做引导页面

前端特效动画魔法书&#xff1a;文字渐入效果实现&#xff0c;可做引导页面 简介 在网页设计的世界中&#xff0c;动画是吸引用户眼球的魔法。Anime.js&#xff0c;一个轻量级且功能强大的JavaScript动画库&#xff0c;是实现这一魔法的完美工具。本文将作为你的技术文档&…

【3D编程技巧】如何用四元数旋转矢量在相机空间进行光照计算

这里介绍一个小TIPS&#xff0c;很久没有这么有成就感了。我以前在学3D数学的时候&#xff0c;书上就有一句话&#xff0c;说你把矢量这些东西用久了&#xff0c;就应该形成一种“直觉”&#xff0c;仿佛这些东西就是你的左右手一样。而这次&#xff0c;我居然真的用“直觉”来…

【开源库学习】libodb库学习(三)

4 查询数据库 如果我们不知道我们正在寻找的对象的标识符&#xff0c;我们可以使用查询在数据库中搜索符合特定条件的对象。ODB查询功能是可选的&#xff0c;我们需要使用--generate-query ODB编译器选项显式请求生成必要的数据库支持代码。 ODB提供了一个灵活的查询API&#x…

复现Android中GridView的bug并解决

几年前的一个bug&#xff0c;GridView的item高度不一致。如下图&#xff1a; 复现bug的代码&#xff1a; import android.os.Bundle; import android.widget.BaseAdapter; import android.widget.GridView; import androidx.appcompat.app.AppCompatActivity; import java.uti…

麻省理工学院 - MIT - 线性代数学习笔记

学习视频地址 文章目录 1.01方程组的几何解释2.02矩阵消元3.03乘法和逆矩阵乘法逆 4.04矩阵A的LU分解5.05转置&#xff0c;置换&#xff0c;向量空间置换转置向量空间 6.06列空间和零空间7.07求解Ax0&#xff1a;主变量&#xff0c;特解 1.01方程组的几何解释 对于二元方程组&…

Scratch自制:《袁坤》游戏攻略

大家好&#xff01;我也是很久没有动静了&#xff0c;这次我又来了&#xff0c;并且还带来了一个用Scratch制作的游戏&#xff0c;大家还记得我很久以前用C制作的《袁坤》吗&#xff1f;&#xff08;详见C自制游戏《袁坤》1.2版本发布&#xff01;-CSDN博客&#xff09;这次它又…

种类并查集

最近玩的太嗨了&#xff0c;都忘了自己还有三篇博客还在拖更&#xff0c;也是今天一更到底好吧&#xff0c;边更新边写题&#xff0c;让看官老爷有更多的样题去联系 引入—— 在学这个之前&#xff0c;我相信各位应该已经接触过了并查集了吧&#xff0c;嗯&#xff1f;什么&a…

Kubernetes 1.24 版弃用 Dockershim 后如何迁移到 containerd 和 CRI-O

在本系列的上一篇文章中&#xff0c;我们讨论了什么是 CRI 和 OCI&#xff0c;Docker、containerd、CRI-O 之间的区别以及它们的架构等。最近&#xff0c;我们得知 Docker 即将从 kubernetes 中弃用&#xff01;&#xff08;查看 kubernetes 官方的这篇文章&#xff09;那么让我…

VSCODE 下 openocd Jlink 的配置笔记

title: VSCODE 下 openocd Jlink 的配置笔记 tags: STM32HalCubemax 文章目录 内容VSCODE 下 openocd Jlink 的配置笔记安装完成后修改jlink的配置文件然后修改你的下载器为jlink烧录你的项目绝对会出现下面的问题那么打开下载的第一个软件 &#xff08;点到这个jlink右键&…

Kafka架构详解之分区Partition

目录 一、简介二、架构三、分区Partition1.分区概念2.Offsets&#xff08;偏移量&#xff09;和消息的顺序3.分区如何为Kafka提供扩展能力4.producer写入策略5.consumer消费机制 一、简介 Apache Kafka 是分布式发布 - 订阅消息系统&#xff0c;在 kafka 官网上对 kafka 的定义…

【11】微服务链路追踪SkyWalking

1、skywalking是什么 1.1 链路追踪介绍 对于一个大型的几十个、几百个微服务构成的微服务架构系统&#xff0c;通常会遇到下面一些问题&#xff0c;比如&#xff1a; 如何串联整个调用链路&#xff0c;快速定位问题&#xff1f;如何缕清各个微服务之间的依赖关系&#xff1f;…

【AI学习】LLaMA 系列模型的进化(二)

在前面LLaMA 系列模型的进化&#xff08;一&#xff09;中学习了LLama模型的总体进化发展&#xff0c;再来看看其中涉及的一些重要技术。 PreLayerNorm Layer Norm有Pre-LN和Post-LN两种。Layer Normalization&#xff08;LN&#xff09;在Transformer架构中的放置位置对模型…

基于PaddleOCR + NLP实现证件识别

基于PaddleOCR NLP实现证件识别 PaddleOCR识别paddleOCR安装安装 anconda虚拟环境(可参考yolov5的安装教程) paddleOCR识别PaddleNLP模型信息抽取paddle打包exe 进行ocr识别 什么是PaddleOCR&#xff1f; PaddleOCR 旨在打造一套丰富、领先、且实用的 OCR 工具库&#xff0c;助…

【HarmonyOS开发】Navigation使用

简介 Navigation是路由容器组件&#xff0c;包括单栏(Stack)、分栏(Split)和自适应(Auto)三种显示模式。适用于模块内和跨模块的路由切换。 在页面跳转时&#xff0c;应该使用页面路由router&#xff0c;在页面内的页面跳转时&#xff0c;建议使用Navigation达到更好的转场动效…