RTP Payload Format for H.264 Vide(1)

摘要::

本备忘录描述了一种用于 ITU-T H.264 视频编码标准(与 ISO/IEC 国际标准 14496-10 技术上相同)的 RTP 负载格式,但不包括可伸缩视频编码(SVC)扩展和多视角视频编码(MVC)扩展,这两种扩展的 RTP 负载格式在其他文档中有定义。该 RTP 负载格式允许在每个 RTP 负载中封装一个或多个由 H.264 视频编码器产生的网络抽象层单元(NALU)。这种负载格式具有广泛的适用性,支持从简单的低比特率会话应用,到带有交错传输的互联网视频流,再到高比特率的视频点播等多种应用场景。

The H.264 Codec:

H.264 视频编码器具有非常广泛的应用范围,涵盖了各种形式的数字压缩视频,从低比特率的互联网流媒体应用,到高清电视(HDTV)广播和几乎无损编码的数字电影应用。与当前的技术水平相比,H.264 在整体性能方面表现优异,据报道其比特率节省可达到 50% 甚至更多。例如,据称数字卫星电视的画质可在 1.5 Mbit/s 的比特率下实现,而当前 MPEG-2 视频的典型比特率大约为 3.5 Mbit/s  。

编码规范在概念上将视频编码层(VCL)和网络抽象层(NAL)区分开来。VCL 包含编解码器的信号处理功能,包括变换、量化、运动补偿预测等机制,以及环路滤波器。它遵循当今大多数视频编解码器的一般概念:基于宏块的编码器,采用带有运动补偿的帧间预测和残差信号的变换编码。VCL 编码器输出的是切片(slice):即包含若干个宏块数据的比特串,以及切片头的信息(其中包含该切片中第一个宏块的空间地址、初始量化参数以及其他相关信息)。除非通过切片组(slice groups)的语法另作指定,否则切片中的宏块按扫描顺序排列。帧内预测仅在切片内部使用。更多信息可参考文献 。

NAL 编码器会将 VCL(视频编码层)编码器输出的切片封装成网络抽象层单元(NALU),以便适用于在分组网络中传输,或者用于面向分组的复用环境。H.264 标准的附录 B 定义了一种用于字节流导向网络(比如本地存储、串行传输等)上传输这些 NALU 的封装方法。但在本备忘录(即该 RTP 负载格式规范)的讨论范围内,附录 B 的内容并不适用或相关,因为 RTP 是基于分组的传输方式,而不是字节流方式。

在内部,NAL(网络抽象层)使用的是 NAL 单元。每个 NAL 单元由一个字节的头部和有效负载字节流组成。

每个 NAL 单元包含两个部分:

● 一个字节的头部(header):这个头部指出了 NAL 单元的类型(比如是帧、SPS、PPS 等),是否可能存在比特错误或语法错误,以及这个单元在解码过程中有多重要。

● 有效负载部分(payload):也就是实际的数据内容,比如一帧图像的数据.

头部指示该 NAL 单元的类型、有效负载中是否可能存在比特错误或语法违规,以及该 NAL 单元在解码过程中相对的重要性。本 RTP 负载规范在设计时并不关心 NAL 单元有效负载中的比特流内容。

H.264 的一个主要特点是:切片(slice)和图像的传输时间、解码时间以及采样或显示时间是完全解耦的。H.264 中规定的解码过程与时间无关,H.264 语法中也不携带类似于早期视频压缩标准中“时间参考(Temporal Reference)”那样表示跳帧数量的信息。此外,还有一些 NAL 单元会影响多帧图像,因此本质上不具备时间属性。因此,在处理 RTP 时间戳时,对于那些采样时间或显示时间未定义或在传输时尚未知的 NAL 单元,需要进行特别的处理和考虑。

Parameter Set Concept:

H.264 的一个非常基础的设计理念是生成自包含的分组,从而使诸如 RFC 4629 [11] 中的头部重复机制,或 MPEG-4 Visual 的头部扩展码(HEC)等机制变得不再必要。

这是通过将涉及多个切片的信息从媒体流中解耦来实现的。 这些高层的元信息应当以可靠的、异步的、提前的方式发送,与包含切片数据的 RTP 数据流分开进行传输。

(对于没有合适的带外传输通道的应用,也提供了带内发送该信息的机制。) 这一类高层参数的组合被称为参数集(parameter set)。H.264 规范中定义了两种参数集:

● 序列参数集(Sequence Parameter Set, SPS)

● 图像参数集(Picture Parameter Set, PPS)

一个活动的序列参数集在整个编码视频序列期间保持不变, 一个活动的图像参数集在一个编码图像内保持不变。

这些参数集结构中包含了如下信息:

● 图像大小

● 所使用的可选编码模式

● 宏块与切片组之间的映射关系等。

为了能够在无需与切片数据流同步传输参数集的情况下更改图像参数(例如图像大小),编码器和解码器可以各自维护一个包含多个序列和图像参数集的列表。每个切片头中都会包含一个码字,用于标识应该使用哪个序列参数集和图像参数集。这种机制允许将参数集的传输与视频数据包的传输分离,并可以通过外部手段进行传输(例如作为能力交换的一部分),或者通过可靠或不可靠的控制协议来发送。甚至在某些情况下,这些参数集可以完全不通过网络传输,而是在应用设计规范中预设并固定。

H.264 通过把编码参数信息(如分辨率、编码方式)从图像数据中剥离出来,形成独立的参数集,从而实现了数据包的自包含和高效传输。这些参数集不依赖 RTP 流,可以通过其他方式灵活传输或预设,大大增强了系统的适应性和效率。

Network Abstraction Layer Unit Types:

所有NAL单元都由一个单独的NAL单元类型字节组成,该字节同时也作为本RTP载荷格式的载荷头(payload header)。随后是对NAL单元载荷的描述。

NAL单元类型字节的语法和语义在h264官方文档中进行了规定,但其基本属性在下文中简要总结。NAL单元类型字节的格式如下:

+---------------+|0|1|2|3|4|5|6|7|+-+-+-+-+-+-+-+-+|F| NRI | Type  |+---------------+

根据H.264标准,对NAL单元类型字节各组成部分的语义简要说明如下:

● F:1位

forbidden_zero_bit。H.264标准中规定该位为1即为语法违规。

● NRI:2位

nal_ref_idc。值为 00 表示该NAL单元的内容不会用于重建参考图像,因此可以被丢弃而不会影响参考图像的完整性。值大于 00 表示该NAL单元的解码对保持参考图像的完整性是必要的。

● Type:5位

nal_unit_type。该字段表示NAL单元载荷的类型。

Definitions::

● 访问单元(access unit):一组NAL单元,总是包含一个主编码图像(primary coded picture)。除了主编码图像之外,访问单元还可以包含一个或多个冗余编码图像,或其他不包含片(slice)或编码图像的切片数据分区的NAL单元。访问单元的解码始终会产生一个解码图像。

● 编码视频序列(coded video sequence):按解码顺序排列的访问单元序列,由一个瞬时解码刷新(IDR)访问单元开始,后面跟着零个或多个非IDR访问单元,直到下一个IDR访问单元(不包括该IDR单元)为止。

● IDR访问单元(IDR access unit):其主编码图像是IDR图像的访问单元。

● IDR图像(IDR picture):仅包含I或SI片类型的编码图像,该图像会触发解码过程的“重置”。解码IDR图像之后,其后的所有编码图像都可以在无需对IDR图像之前的图像进行帧间预测的情况下完成解码。

● 主编码图像(primary coded picture):H.264标准中用于解码处理的图像编码表示。主编码图像包含图像的所有宏块(macroblock)。

● 冗余编码图像(redundant coded picture):图像或图像部分的编码表示。对于符合H.264标准的码流,解码过程不会使用冗余编码图像的内容。但在存在错误或丢包的码流中,冗余编码图像的内容可用于解码处理。

● VCL NAL单元(VCL NAL unit):用于统称编码片(coded slice)和编码数据分区(coded data partition)类型的NAL单元。

此外,以下定义也适用:

● 解码顺序号(decoding order number, DON):RTP负载结构中的一个字段,或一个表示NAL单元解码顺序的派生变量。DON的取值范围为0到65535。当达到最大值后,会回绕至0。

● NAL单元解码顺序(NAL unit decoding order):符合文献 [1] 第7.4.1.2节所述顺序约束的NAL单元顺序。

● NALU时间(NALU-time):如果NAL单元被传输在其独立的RTP包中,该值表示RTP时间戳应取的值。

● 传输顺序(transmission order):按RTP序列号升序排列的数据包顺序(按模算术处理)。在聚合包中,NAL单元的传输顺序与其在包中出现的顺序一致。

● 媒体感知网络元素(media-aware network element, MANE):如中间设备或应用层网关这类网络元素,能够解析RTP载荷头或RTP载荷的某些部分,并对内容做出反应。

说明性注释:MANE的概念超越了普通路由器或网关,因为MANE需要了解信令(例如,获取媒体流的负载类型映射信息),并且在使用安全实时传输协议(SRTP)时需要被信任。使用MANE的好处是可以根据媒体编码的需要丢弃数据包。例如,在某个链路上因拥塞而必须丢包时,MANE可以识别并丢弃对用户体验影响最小的数据包。

● 静态宏块(static macroblock):视频流中某些宏块可被定义为静态块,详见文献 [3] 第8.3.2.8节。静态宏块可释放出额外的处理资源用于非静态宏块处理。在一定视频处理资源和分辨率条件下,静态宏块数量越多,帧率越高。

● 默认子配置(default sub-profile):编码工具的子集,可以是一个profile的全部编码工具,也可以是多个profile共有的编码工具子集,由 profile-level-id 参数指示。

● 默认等级(default level):由 profile-level-id 参数指示的等级,由三个字节组成:profile_idc、profile-iop 和 level_idc。默认情况下,level_idc 表示等级,在某些情况下还需结合 profile-iop 一起判断。

Abbreviations:

● DON:解码顺序号(Decoding Order Number)

● DONB:解码顺序号基值(Decoding Order Number Base)

● DOND:解码顺序号差值(Decoding Order Number Difference)

● FEC:前向纠错(Forward Error Correction)

● FU:分片单元(Fragmentation Unit)

● IDR:瞬时解码刷新(Instantaneous Decoding Refresh)

● IEC:国际电工委员会(International Electrotechnical Commission)

● ISO:国际标准化组织(International Organization for Standardization)

● ITU-T:国际电信联盟 电信标准化部门(International Telecommunication Union, Telecommunication Standardization Sector)

● MANE:媒体感知网络元素(Media-Aware Network Element)

● MTAP:多时间聚合包(Multi-Time Aggregation Packet)

● MTAP16:带有16位时间戳偏移的MTAP(MTAP with 16-bit timestamp offset)

● MTAP24:带有24位时间戳偏移的MTAP(MTAP with 24-bit timestamp offset)

● NAL:网络提取层(Network Abstraction Layer)

● NALU:NAL单元(NAL Unit)

● SAR:采样宽高比(Sample Aspect Ratio)

● SEI:补充增强信息(Supplemental Enhancement Information)

● STAP:单时间聚合包(Single-Time Aggregation Packet)

● STAP-A:STAP类型A

● STAP-B:STAP类型B

● TS:时间戳(Timestamp)

● VCL:视频编码层(Video Coding Layer)

● VUI:视频可用性信息(Video Usability Information)

参考来源:

https://www.yuque.com/u2132176/yfiyal/kbobkofh66aldrg7

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/75950.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文翻译:2024-arxiv How to Steer LLM Latents for Hallucination Detection?

总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328 How to Steer LLM Latents for Hallucination Detection? https://arxiv.org/pdf/2503.01917 https://www.doubao.com/chat/2818934852496130 其它资料: https://blog.csdn.net/we…

第四篇:[特殊字符] 深入理解MyBatis[特殊字符] 掌握MyBatis Generator ——入门与实战

引言 什么是 MyBatis Generator? MyBatis Generator (MBG) 是一个代码生成工具,专为 MyBatis 框架设计。它可以根据数据库表结构自动生成 Java 实体类、Mapper 接口、Mapper XML 文件以及 Example 类。通过使用 MBG,开发者可以显著减少编写…

利用纯JS开发浏览器小窗口移动广告小功能

效果展示 直接上代码 如果要用到vue项目里面&#xff0c;直接按照vue的写法改动就行&#xff0c;一般没有多大的问题&#xff0c;顶部的占位是我项目需求&#xff0c;你可以按照要求改动。 <!DOCTYPE html> <html> <head><meta charset"utf-8"…

React 更新 state 中的数组

更新 state 中的数组 数组是另外一种可以存储在 state 中的 JavaScript 对象&#xff0c;它虽然是可变的&#xff0c;但是却应该被视为不可变。同对象一样&#xff0c;当你想要更新存储于 state 中的数组时&#xff0c;你需要创建一个新的数组&#xff08;或者创建一份已有数组…

java -jar与java -cp的区别

java -jar与java -cp 1、情景描述2、情景分析3、两者区别 通常情况下&#xff0c;我们会看到以下两种命令启动的Java程序&#xff1a; java -jar xxx.jar [args] java -cp xxx.jar mainclass [args]这两种用法有什么区别呢&#xff1f; 1、情景描述 1&#xff09;Java打包单个…

【Java】面向对象程序三板斧——如何优雅设计包、封装数据与优化代码块?

&#x1f381;个人主页&#xff1a;User_芊芊君子 &#x1f389;欢迎大家点赞&#x1f44d;评论&#x1f4dd;收藏⭐文章 &#x1f50d;系列专栏&#xff1a;【Java】内容概括 【前言】 在Java编程中&#xff0c;类和对象是面向对象编程的核心概念。而包&#xff08;Package&am…

玩转Docker | 使用Docker搭建Blog微博系统

玩转Docker | 使用Docker搭建Blog微博系统 前言一、Blog介绍项目简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署Blog服务下载镜像创建容器检查容器状态设置权限检查服务端口安全设置四、访问Blog系统访问Blog首页登录Blog五、总结前言 在数字…

用Java NIO模拟HTTPS

HTTPS流程 名词解释&#xff1a; R1:随机数1 R2:随机数2 R3:随机数3 publicKey:公钥 privateKey:私钥 要提供https服务&#xff0c;服务端需要安装数字证书&#xff0c;在&#xff08;TCP建立连接之后&#xff09;TLS握手时发给客户端&#xff0c;客户端验证证书&#x…

树莓派_利用Ubuntu搭建gitlab

树莓派_利用Ubuntu搭建gitlab 一、给树莓派3A搭建基本系统 1、下载系统镜像 https://cdimage.ubuntu.com/ubuntu/releases/18.04/release/ 2、准备系统SD卡 二、给树莓派设备联网 1、串口后台登录 使用串口登录后台是最便捷的&#xff0c;因为前期网络可能不好直接成功 默…

Hook_Unfinished

#include <windows.h>// 假设这两个函数是存在的 void DoRD() {} void 改堆栈cal1() {} void 改回堆栈cal1() {}__declspec(naked) void HOOKcall() {__asm{pushadnop}__asm{popadmov eax, dword ptr [esi 8]sub eax, ecxretn} }int main() {// 第一个 Hook 操作DWORD H…

数据结构(六)——红黑树及模拟实现

目录 前言 红黑树的概念及性质 红黑树的效率 红黑树的结构 红黑树的插入 变色不旋转 单旋变色 双旋变色 插入代码如下所示&#xff1a; 红黑树的查找 红黑树的验证 红黑树代码如下所示&#xff1a; 小结 前言 在前面的文章我们介绍了AVL这一棵完全二叉搜索树&…

c# 数据结构 链表篇 有关双向链表的一切

本人能力有限,如有不足还请斧正 目录 0.双向链表的好处 1.双向链表的分类 2.不带头节点的标准双向链表 节点类:有头有尾 链表类:也可以有头有尾 也可以只有头 增 头插 尾插 删 查 改 遍历 全部代码 3.循环双向链表 节点类 链表类 增 头插 尾插 删 查 遍历…

Numba 从零基础到实战:解锁 Python 性能新境界

Numba 从零基础到实战&#xff1a;解锁 Python 性能新境界 一、引言 在 Python 的世界里&#xff0c;性能一直是一个备受关注的话题。Python 以其简洁易读的语法和丰富的库生态&#xff0c;深受开发者喜爱&#xff0c;但在处理一些计算密集型任务时&#xff0c;其执行速度往往…

单位门户网站被攻击后的安全防护策略

政府网站安全现状与挑战 近年来&#xff0c;随着数字化进程的加速&#xff0c;政府门户网站已成为政务公开和服务公众的重要窗口。然而&#xff0c;网络安全形势却日益严峻。国家互联网应急中心的数据显示&#xff0c;政府网站已成为黑客攻击的重点目标&#xff0c;被篡改和被…

Spring Boot 项目三种打印日志的方法详解。Logger,log,logger 解读。

目录 一. 打印日志的常见三种方法&#xff1f; 1.1 手动创建 Logger 对象&#xff08;基于SLF4J API&#xff09; 1.2 使用 Lombok 插件的 Slf4j 注解 1.3 使用 Spring 的 Log 接口&#xff08;使用频率较低&#xff09; 二. 常见的 Logger&#xff0c;logger&#xff0c;…

NI的LABVIEW工具安装及卸载步骤说明

一.介绍 最近接到个转交的项目&#xff0c;项目主要作为上位机工具开发&#xff0c;在对接下位机时&#xff0c;有用到NI的labview工具。labview软件是由美国国家仪器&#xff08;NI&#xff09;公司研制开发的一种程序开发环境&#xff0c;主要用于汽车测试、数据采集、芯片测…

cmd 终端输出乱码问题 |Visual Studio 控制台输出中文乱码解决

在网上下载&#xff0c;或者移植别人的代码到自己的电脑&#xff0c;使用VS运行后&#xff0c;控制台输出中文可能出现乱码。这是因为源代码的编码格式和控制台的编码格式不一致。 文章目录 查看源代码文件编码格式查看输出控制台编码格式修改编码格式修改终端代码页 补充总结 …

A009-基于pytest的网易云自动化测试

题 目 :基于pytest的网易云自动化测试 主要内容 综合应用所学的软件测试理论和方法,实现网易云的功能自动化测试。 (1)自动化测试介绍; (2)自动化功能测试框架介绍; (3)设计功能测试用例 (4)书写自动化测试脚本; (5)测试评价与结论。 任务要求 (1)能…

LVGL Video控件和Radiobtn控件详解

LVGL Video控件和Radiobtn控件详解 一、 Video控件详解1. 概述2. 创建和初始化3. 基本属性设置4. 视频控制5. 回调函数6. 高级功能7. 注意事项 二、Radiobtn控件详解1. 概述2. 创建和初始化3. 属性设置4. 状态控制5. 组管理6. 事件处理7. 样式设置8. 注意事项 三、效果展示四、…

AbortController:让异步操作随时说停就停

AbortController&#xff1a;让异步操作随时说停就停 一、什么是 AbortController&#xff1f; AbortController 是 JavaScript 在浏览器和部分 Node.js 环境中提供的全局类&#xff0c;用来中止正在进行或待完成的异步操作&#xff08;如 fetch() 请求、事件监听、可写流、数…