AV1 Bitstream Decoding Process Specification:术语和定义

  • 原文地址:https://aomediacodec.github.io/av1-spec/av1-spec.pdf
  • 没有梯子的下载地址:AV1 Bitstream & Decoding Process Specification
  • 摘要:这份文档定义了开放媒体联盟(Alliance for Open Media)AV1视频编解码器的比特流格式和解码过程。
  • 规范:此文档规定了开放媒体联盟(Alliance for Open Media)AV1比特流格式和解码过程。

术语和定义

对于本文档的目的,以下术语和定义适用:

  1. AC coefficient :AC 系数,在至少一个维度上频率索引非零的任何变换系数。
  2. Altref:替代参考帧, 在帧间编码中可以使用的帧。
  3. Base layer:基础层,即spatial_id 和 temporal_id 的值为 0 的层。
  4. Bitstream:比特流,即编码一系列帧生成的比特序列。
  5. Bit string:比特字符串,有限数量的比特的有序字符串。最左边的比特是最显著比特(MSB),最右边的比特是最不显著比特(LSB)。
  6. Block:块,样本的正方形或矩形区域。
  7. Block scan:块扫描,量化系数的特定序列排序。
  8. Byte:字节,8 比特的比特字符串。
  9. Byte alignment:字节对齐,如果比特的位置是从比特流中第一个比特的位置开始的八的整数倍,则该比特是字节对齐的。
  10. CDEF:约束方向增强滤波器,设计用于根据识别方向自适应地过滤块的滤波器。
  11. CDF:累积分布函数,表示符号值小于或等于给定水平的概率乘以 32768 的函数。
  12. Chroma:色度,一个色度样本值矩阵或其中一个色度差分信号的单个样本值。注意:色度的符号是 U 和 V。
  13. Coded frame:编码帧,解码过程之前一帧的表示形式。
  14. Component:分量,三个样本值矩阵中的一个(一个亮度矩阵和两个色度矩阵)或其单个样本值。
  15. Compound prediction:复合预测,一种帧间预测,通过混合两个参考帧的预测来计算样本值(混合的帧可以是相同的或不同的)。
  16. DC coefficient:DC 系数,在两个维度上频率索引都为零的变换系数。
  17. Decoded frame:解码帧,解码器从比特流重构出的帧。
  18. Decoder:解码器,解码过程的一个实现。
  19. Decoding process:解码过程,从语法元素推导出解码帧的过程,包括在使用电影颗粒合成过程之前和过程中使用的任何处理步骤。
  20. Dequantization:去量化,通过缩放量化系数来获得变换系数的过程。
  21. Encoder:编码器,编码过程的一个实现。
  22. Encoding process,编码过程,本规范中未指定的过程,它生成符合本文档描述的比特流。
  23. Enhancement layer:增强层,spatial_id 和 temporal_id 的值大于 0 的层。
  24. Flag:标志,二进制变量 - 一些变量和语法元素(例如 obu_extension_flag)使用“标志”一词来描述,以突出语法元素只能等于 0 或 1。
  25. Frame:帧,视频信号在空间域的表示,由一个亮度样本矩阵(Y)和两个色度样本矩阵(U 和 V)组成。
  26. Frame context:帧上下文,解码过程中使用的一组概率。
  27. Golden frame:黄金帧,可以在帧间编码中使用的帧。通常黄金帧以更高的质量编码,并用作多个帧间帧的参考。
  28. Inter coding:帧间编码,使用帧间预测来编码一个块或帧。
  29. Inter prediction:帧间预测,使用之前解码的帧推导出当前帧的预测值的过程。
  30. Intra coding:帧内编码,使用帧内预测来编码一个块或帧。
  31. Intra frame:帧内帧,仅使用帧内预测压缩的帧,可以独立解码。
  32. Intra prediction:帧内预测,使用同一已解码帧中先前解码的样本值推导出当前样本的预测值的过程。
  33. Inverse transform:逆变换,将变换系数矩阵转换为空间样本值矩阵的过程。
  34. Key frame:关键帧,一种帧内帧,当显示时会重置解码过程。
  35. Layer:层,一组具有相同spatial_id和相同 temporal_id 值的 tile group OBUs。
  36. Level:级别,对语法元素和变量值的一组定义的约束。
  37. Loop filter:环路滤波,应用于重建的滤波过程,旨在减少块边缘的可见性。
  38. Luma:亮度,代表与主要颜色相关的单色信号的样本值矩阵或单个样本值。注意:表示亮度的符号是 Y。
  39. Mode info:模式信息,在解码过程中包含有关如何预测块的指示的语法元素。
  40. Mode info block:模式信息块,一个 4x4 或更大尺寸的亮度样本值块及其对应的两个色度样本值块(如果存在)。
  41. Motion vector:运动矢量,用于帧间预测的二维矢量,将当前帧指向参考帧,其值提供了从当前帧中的位置到参考帧中位置的坐标偏移。
  42. OBU:开发比特流单元,所有结构都打包在“开放比特流单元”或 OBUs 中。每个 OBU 都有一个头部,提供包含数据(有效载荷)的识别信息。
  43. Parse:解析,从比特流中获取语法元素的过程。
  44. Prediction:预测,包括帧间或帧内预测的预测过程的实现。
  45. Prediction process:预测过程,使用预测器估算已解码样本值或数据元素的过程。
  46. Prediction value:预测值,在下一个样本值或数据元素的解码过程中使用的值,它是先前解码的样本值或数据元素的组合。
  47. Profile:配置文件,在规范部分中定义的语法、语义和算法的子集。
  48. Quantization parameter:量化参数,用于在解码过程中缩放量化系数的变量。
  49. Quantized coefficient:量化系数,去量化前的变换系数。
  50. Raster scan:光栅扫描,将二维矩形光栅映射到一维光栅,一维光栅的条目从二维光栅的第一行开始,然后扫描第二行、第三行等。每一行光栅都按从左到右的顺序扫描。
  51. Reconstruction:重建,获得已解码残差和相应预测值的加和。
  52. Reference:参考,一组标签中的一个,每个标签都映射到一个参考帧。参考帧是存储先前解码帧和相关信息的区域。
  53. Reserved:保留,一个特殊的语法元素值,将来可能会用于扩展本部分。
  54. Residual:残差,重建样本与相应预测值之间的差异。
  55. Sample:样本,构成帧的基本元素。
  56. Sample value:样本值,样本的值。对于 8 位帧,这是一个从 0 到 255(含)的整数;对于 10 位帧,这是一个从 0 到 1023(含)的整数;对于 12 位帧,这是一个从 0 到 4095(含)的整数。
  57. Segmentation map:分割图,一个 3 位数字,包含图像中每个 4x4 块的段归属。每个参考帧都存储一个分割图,允许新帧使用先前编码的图。
  58. Sequence:序列,编码比特流的最高级语法结构,包括一个或多个连续的编码帧。
  59. Superblock:超块,一个 tile 内块四叉树的最高级别。所有超块在帧内大小相同,并且是正方形。超块可以是 128x128 亮度样本或 64x64 亮度样本。一个超块可能包含 1 个或 2 个或 4 个模式信息块,或者可以在每个方向上分割成 4 个子块,这些子块可以进一步细分,形成块四叉树。
  60. Switch Frame:切换帧,可以用作序列之间切换点的帧。切换帧覆盖所有参考帧,而不强制使用帧内编码。目的是允许在流媒体使用案例中,视频可以以小块(比如1 秒时长)编码,每个块都以切换帧开始。如果可用带宽下降,服务器可以开始发送较低比特率编码的块。当这种情况发生时,帧间预测使用现有的较高质量参考帧来解码切换帧。这种方法允许在不产生完整关键帧成本的情况下切换比特率。
  61. Syntax element:语法元素,比特流中表示的数据元素。
  62. Temporal delimiter OBU:时间分割符OBU,表明随后的 OBUs 将与时间分隔符之前的上一帧有不同的表示/解码时间戳。
  63. Temporal unit:时间单元,时间单元由与特定、不同时间点相关联的所有 OBUs 组成。它由一个时间分隔符 OBU 和所有随后的 OBUs 组成,直到但不包括下一个时间分隔符。
  64. Temporal group:时间组,一组定期在视频序列中使用其时间预测结构的帧。
  65. Tile:瓦片,可以独立编码和解码的帧的矩形区域,尽管跨瓦片边缘仍然应用环路滤波。
  66. Transform block:变换块,用作逆变换过程输入的矩形变换系数矩阵。
  67. Transform coefficient:变换系数,在变换块中包含的标量值,被认为是在频率域中的值。
  68. Uncompressed header:未压缩的头部,要解码的帧的高级描述,编码时未使用算术编码。

原文

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/52442.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

UE4_后期处理五—饱和度调整、隔离、扭曲、重影

一、色彩饱和度调整: 原图 后期处理材质节点: 效果图: 可以根据参数saturation调整饱和还是去饱和。 当saturation为1时:去饱和度,如下图: 当saturation为0时:原始的一个状态,如下…

展会通过智慧客流统计分析优化运营策略-讯鹏科技

在当今数字化高速发展的时代,展会行业也在积极探索利用智慧科技进行转型与升级。其中,智慧客流统计分析成为了展会优化运营策略的关键要素。 智慧客流统计分析首先为展会提供了精准的数据支撑。通过先进的传感器、摄像头等设备,能够实时、准确…

PyCharm修改背景颜色、修改字体大小+Python常用快捷键+Python常见的运算符

文章目录 PyCharm软件的使用1. 修改背景颜色和字体大小1.1 修改背景颜色1.2 修改字体大小 2. 常用的快捷键3. 常见的运算符3.1 算术运算符3.2 赋值运算符3.3 比较运算符3.4 逻辑运算符 PyCharm软件的使用 1. 修改背景颜色和字体大小 1.1 修改背景颜色 1.2 修改字体大小 2. 常…

图文并茂带你理解Java的SPI机制

目录 一、Java的SPI机制1、什么是Java的SPI ?2、JavaSPI 代码示例 (使用Maven项目演示)3、 JavaSPI 机制的核心-ServiceLoader4、实现自己的ServiceLoader5、Java中还有哪些SPI实现? 一、Java的SPI机制 1、什么是Java的SPI ? SPI全称 Servi…

中秋快到了,要给哪些国外客户送祝福(附贺卡模板)

马上就要中秋节了,在这里提前祝小伙伴们中秋节快乐,身体健康,阖家团圆,业绩越来越好,公司越来越好,一切都越来越好! 中秋节是我们非常重要的几个传统节日之一了,除了我们自己庆祝之…

计算机网络练级第一级————认识网络

目录 网络搁哪? 网络的发展史(了解) 独立模式: 网络互联: 局域网时期: 广域网时期: 什么是协议 TCP/IP五层/四层模型 用官话来说: 我自己的话来说 第一层应用层&#xff1…

Python+selenium自动化元素定位防踩坑(建议收藏)

踩坑一:StaleElementReferenceException selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: element is not attached to the page document 异常原因: 意思是,引用的元素已过期。原因是页面…

soup.find(‘div‘)获取的数据长度为3,为什么1和3都是空的?

用beautifulSoup中的find(‘div’)可以获取一个div数据,为什么用len()计数是显示长度为3? 实际在打印输出时,1和3又没有内容输出?用print(div【0】)和print&…

Java小白一文讲清Java中集合相关的知识点(七)

LinkedHashSet LinkedHashSet是HashSet的子类 LinkedHashSet底层是一个LinkedHashMap,底层维护了一个数组双向链表 而在之前讲的HashSet中的链表是单向的哈,注意区分! LinkedHashSet根据元素的hashcode值来决定元素的存储位置,同时使用链表…

极限编程XP例题

答案:D 解析: 结对编程,一个人写代码,一个人看,由于是两个或两个以上的人负责,因此选项A 支持共同代码拥有和共同对系统负责是正确的 选项B 由于是一个人写一个人看,变相实现了代码审查 选项…

深入了解 GROW with SAP:它究竟是什么?

GROW with SAP 是一套综合全面的产品组合,包含一系列解决方案、加速采用服务、社区支持和学习资源,能够确保各种规模的企业成功采用 ERP 云软件。部署 GROW with SAP 后,企业可以采用 SAP S/4HANA Cloud Public Edition [ERP 公有云版]。在 S…

4 路由模式

路由模式 逻辑图 如果我们将生产环境的日志进行处理,而日志是分等级的,我们就按照 error waring info三个等级来讲解 一个消费者是处理【所有】(info,error,warning)的日志,用于做数据仓库&am…

Redis搭建集成

图示 正常来讲配置一主两从需要三台服务器,博主内存告急,就使用一台进行操作了,使用多台跟一台操作没有区别,只是多台不需要新建太多配置文件 一. 准备配置文件 如果你跟我一样是在一台服务器里面进行配置主从服务的,跟我一起操作即可 找到redis目录 在bin目录同位置创建一…

Linux驱动.之驱动开发思维,设备,驱动,总线分析思想,驱动的分类(字符设备,块设备,网络设备)

在stm32,裸机开发时,偏底层,跟寄存器打交道,有些MCU提供了库,库也还是操作寄存器的,通过配置寄存器, 配置各种工作模式,时钟,等等,交换数据等等。 Linux下驱…

Unity笔记之静态/动态合批

借用博主链接 一、静态合批 1、首先项目设置里面需要勾选静态合批 2、添加静态合批选项 3、至此就完成了,至于成功没有就要去分析器里面看了。 静态合批注意问题: 二、动态合批 1、首先项目设置里面需要勾选动态合批 2、调用 StaticBatchingUtilit…

给大家推荐好用的AI网站

地址:https://ai.ashuiai.com/auth/register?inviteCode8E8DIC1QCR 个人觉得挺好用的,可以免费,免费有限制次数,也可以会员升级200永久免费,我用的200永久免费。 可以在国内使用以下ai模型 回答问题更智能&#xff…

IBM中国研发部裁员:全球化背景下的IT产业变局与应对之道

裁员风波中的思考与机遇 前言了解霍尼韦尔的“东方服务东方”施耐德电气的“中国中心”战略对比与分析 中国信息技术(IT)行业展现出蓬勃发展的前景**政府支持与政策导向****技术创新与应用****市场规模与需求****人才培养与就业**国际化与开放合作总结 前言 如何看待IBM中国研发…

“冰山之下”:谁在成为车企的真正智能助手?

“其实我们一直扮演的角色就是数字化助手,也就是别人可以去挖金,我们给大家提供铲子,这是我们扮演的角色,而现在我们希望给大家提供最好的铲子。” 作者| 皮爷 出品|产业家 如果说AI发展的最鲜明印痕是什么?有人…

【原创教程】自动化工程案例01:8工位插针装配机03-程序解读

在前面两篇文章中,我们介绍了8工位设备每个工位的情况,然后我们介绍了触摸屏的情况,接着我们来看一下程序。关于一些实物照片不宜公开发表,需要的可以私信。 程序系统块设置 系统块中的模块实际上是我们所使用的的硬件设施 符号…

本地Linux服务器使用docker搭建DashDot并实现公网实时监测服务器信息

文章目录 前言1. 本地环境检查1.1 安装docker1.2 下载Dashdot镜像 2. 部署DashDot应用3. 本地访问DashDot服务4. 安装cpolar内网穿透5. 固定DashDot公网地址 前言 本篇文章我们将使用Docker在本地部署DashDot服务器仪表盘,并且结合cpolar内网穿透工具可以实现公网实…