H264编码 封装成MP4格式 视频流 RTP封包

From:http://www.cnblogs.com/ghw-NO1/archive/2012/08/28/2660848.html

一、概述

本文讲述的是对H264编码且封装成MP4格式的视频流进行RTP打包过程时需要了解的一些基本知识。

二、H264的基础知识

1.H264的编码格式

H.263 定义的码流结构是分级结构,共四层。自上而下分别为:图像层(picturelayer)、块组层(GOB layer)、宏块层(macroblock layer)和块层(block layer)。而与H.263 相比,H.264的码流结构和H.263 的有很大的区别,它采用的不再是严格的分级结构。H.264 支持4:2:0 的连续或隔行视频的编码和解码。H.264 压缩与H.263、MPEG-4 相比,视频压缩比提高了一倍。

H.264 的功能分为两层:视频编码层(VCL, Video Coding Layer)和网络提取层(NAL,Network Abstraction Layer)。VCL 数据即编码处理的输出,它表示被压缩编码后的视频数据序列。在VCL 数据传输或存储之前,这些编码的VCL 数据,先被映射或封装进NAL 单元中。每个NAL 单元包括一个原始字节序列负荷(RBSP, Raw Byte Sequence Payload)、一组对应于视频编码的NAL 头信息。RBSP 的基本结构是:在原始编码数据的后面填加了结尾比特。一个bit“1”若干比特“0”,以便字节对齐。

2.H264的传输

H.264 的编码视频序列包括一系列的NAL 单元,每个NAL 单元包含一个RBSP,见表1。编码片(包括数据分割片IDR 片)和序列RBSP 结束符被定义为VCL NAL 单元,其余
为NAL 单元。典型的RBSP 单元序列如图2 所示。每个单元都按独立的NAL 单元传送。单元的信息头(一个字节)定义了RBSP 单元的类型,NAL 单元的其余部分为RBSP 数据。




3.H264的码流结构

起始码:如果NALU 对应的Slice 为一帧的开始,则用4 字节表示,即0x00000001;否则用3 字节表示,0x000001。

一个frame是可以分割成多个Slice来编码的,而一个Slice编码之后被打包进一个NAL单元,不过NAL单元除了容纳Slice编码的码流外,还可以容纳其他数据,比如序列参数集SPS。

三、MP4封装的H264数据

MP4文件中所有数据都封装在box中,它是由若干个子box组成,每个box还可以包含另外的子box,且每个box都有长度和类型。“ftyp”(66 74 79 70)box:作为MP4格式的标志并包含关于文件的一些信息,有且仅有一个;“moov”(6D 6F 6F 76)box:包含了媒体的metadata信息(特别是avcC中的sps和pps),有且仅有一个;“mdat”(6D 64 61 74)box:包含了MP4的媒体数据,可以有多个,也可以没有。但是媒体数据的结构由metadata进行描述。MP4中box存储方式为大端模式。一般,标准的box开头会有四个字节的box size。

MP4格式文件中,H264 slice并不是以00 00 00 01来作分割,而是存储在mdat box中。H264基本码流由一些列的NALU组成。原始的NALU单元组成:[start code] + [NALU header] + [NALU payload].

MP4数据格式:|"ftyp"box|"moov"box(及其子box)|"mdat"box|....|。

"mdat"box的格式:|box的length(4字节)|box类型(4字节)mdat-6D 64 61 74|NALU的length(4字节)|NALU的header(1字节)|payload|;

MP4封装结构图:

box结构图:


 用MP4info分析的实例分析图:


四、H264视频流的RTP封包

1.RTP打包原则

RTP的包长度必须要小于MTU(最大传输单元),IP协议中MTU的最大长度为1500字节。除去IP报头(20字节)、UDP报头(8字节)、RTP头(12字节),所有RTP有效载荷(即NALU内容)的长度不得超过1460字节。

2.RTP协议的报文结构 

 

开始12个八进制出现在每个RTP包中,而CSRC标识列表仅出现在混合器插入时。各段含义如下: 
①版本(V) 
version (V): 2 bits   2位,标识RTP版本,协议初始版本为0,RFC3550中规定的版本号为2。。 
②填充标识(P) 
padding (P): 1 bit   1位,如设置填充位,在包末尾包含了额外的附加信息,它不属于有效载荷。附加信息的最后一个字节表示额外附加信息的长度(包含该字节本身)。该字段之所以 存在是因为某些加密算法需要固定大小的填充字,或为在底层协议数据单元中携带几个RTP包。 
③扩展(X) 
extension (X): 1 bit           1位,如果该位被设置,则在固定的头部后存在一个扩展头部,格式定义在RFC3550 5.3.1节。 
④CSRC计数(CC) 
CSRC count (CC): 4 bits    4位,CSRC计数包括紧接在固定头后标识CSRC个数。 
⑤标记(M) 
marker (M): 1 bit     1位,标记解释由设置定义,目的在于允许重要事件在包流中标记出来。设置可定义其他标示位,或通过改变位数量来指定没有标记位,该位的功能依赖于 profile的定义。profile可以改变该位的长度,但是要保持marker和payload type总长度不变(一共是8 bit)。。

或M:标示位,1 位。如果当前 NALU为一个接入单元最后的那个NALU,那么将M位置 1;或者当前RTP 数据包为一个NALU 的最后的那个分片时(NALU 的分片在后面讲述),M位置 1。其余情况下M 位保持为 0。
⑥载荷类型(PT) 
payload type (PT): 7 bits   7位,记录后面资料使用哪种 Codec , receiver 端找出相应的 decoder 解碼出來,该位标记着RTP packet所携带信息的类型,标准类型列出在RFC3551中。如果接收方不能识别该类型,必须忽略该packet。 
⑦系列号 
sequence number:16 bits  16位,系列号随每个RTP数据包发送后而增加1接收方可以根据该序列号重新排列数据包顺序,或者探测包损失。系列号初值是随机的,使对加密的文本攻击更加困难。 
⑧时间戳
timestamp: 32 bits    32位,时标反映RTP数据包中第一个八进制数的采样时刻,采样时刻必须从单调、线性增加的时钟导出,以允许同步与抖动计算。时标可以让receiver端知道在正确的时间将资料播放出来。实际中当采用”分片封包模式“打包RTP时,当一个NALU打包完毕时,时间戳更一次。


RTP与RTCP协议介绍

 

   由上图可知,如果只有系列号,并不能完整按照顺序的将data播放出来,因为如果data中间有一段是没有资料的,只有系列号的话会造成错误,需搭配上让它知道在哪个时间将data正确播放出来,如此我们才能播放出正确无误的信息。 
⑨SSRC 
SSRC: 32 bits                     32位,SSRC段标识同步源。此标识不是随机选择的,目的在于使同一RTP包连接中没有两个同步源有相同的SSRC标识,也就是在一个RTP Session其间每个数据流都应该有一个不同的SSRC。尽管多个源选择同一个标识的概率很低,所有RTP实现都必须探测并解决冲突。如源改变源传输地 址,也必须选择一个新SSRC标识以避免插入成环行源。 
⑩CSRC列表 
CSRC list: 0 to 15 items     bits0到15项,每项32位。CSRC列表表示包内的对载荷起作用的源。标识数量由CC段给出。如超出15个作用源,也仅标识15个。CSRC标识由 混合器插入,采用作用源的SSRC标识。只有存在Mixer的时候才有效。如一个将多声道的语音流合并成一个单声道的语音流,在这里就列出原来每个声道的 SSRC。

3.NALU header结构图

NALU header由一个字节组成, 它的语法如下:

F: 1 个比特.forbidden_zero_bit. 在 H.264 规范中规定了这一位必须为 0.

NRI: 2 个比特.nal_ref_idc. 取 00 ~ 11, 似乎指示这个 NALU 的重要性, 如00的NALU解码器可以丢弃它而不影响图像的回放. 不过一般情况下不太关心这个属性.

Type: 5 个比特.nal_unit_type. 这个 NALU 单元的类型. 但是在h264中只有 1~23 是有效的值.而其他的24~29在RTP封包采用”组合封包模式“和”分片封包模式“时所用的type类型,而非“单一NAL单元模式”时。

简述如下:

  0     没有定义
  1-23  NAL单元  单个 NAL 单元包.
  24    STAP-A   单一时间的组合包
  25    STAP-B   单一时间的组合包
  26    MTAP16   多个时间的组合包
  27    MTAP24   多个时间的组合包
  28    FU-A     分片的单元
  29    FU-B     分片的单元
  30-31 没有定义

4.RTP打包模式

主要分为三种模式:单一NALU模式、分片模式、组合模式,实际中前两种用的比较多。

(1)单一NALU模式

一个RTP包仅由一个完整的NALU组成。这种情况下RTP NAL头类型字段和原始的H.264的NALU头类型字段是一样的。适合条件是当NALU的长度小于RTP包长减去12时。

特别NALU type 值为 7 和 8 的NALU分别为序列参数集(sps)和图像参数集(pps)。

(2)组合封包模式

即可能是由多个 NAL 单元组成一个 RTP 包. 分别有4种组合方式: STAP-A, STAP-B, MTAP16, MTAP24.那么这里的类型值分别是 24, 25, 26 以及 27.适合条件当 NALU 的长度特别小时, 可以把几个 NALU 单元封在一个 RTP 包中.

(3)分片封包模式Fragmentation Units (FUs)

用于把一个 NALU 单元封装成多个 RTP 包. 存在两种类型 FU-A 和 FU-B. 类型值分别是 28 和 29。适合条件当 NALU 的长度超过 MTU 时, 就必须对 NALU 单元进行分片封包. 


FU indicator 结构

  
F:当网络识别此单元存在比特错误时,可将其设为 1,以便接收方丢掉该单元。 
NRI:必须根据分片NAL单元的NRI域的值设置,用来指示该NALU的重要性等级。值越大,表示当前NALU越重要。
TYPE:28表示FU-A和29表示FU-B

FU Header 结构:

S:当设置成1,开始位指示分片NAL单元的开始。当跟随的FU荷载不是分片NAL单元荷载的开始,开始位设为0。                
E:当设置成1,结束位指示分片NAL单元的结束。即荷载的最后字节是分片NAL单元的最后一个字节。当跟随的FU荷载不是分片NAL单元的最后分片,结束位设置为0。
R:保留位必须设置为0,接收者必须忽略该位。

Type:与NALU的header中的Type类型一致。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/404051.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

hadoop 分布式缓存

Hadoop 分布式缓存实现目的是在所有的MapReduce调用一个统一的配置文件,首先将缓存文件放置在HDFS中,然后程序在执行的过程中会可以通过设定将文件下载到本地具体设定如下: public static void main(String[] arge) throws IOException, Clas…

在Eclipse中查看JDK类库的源代码

转自:http://www.cnblogs.com/wuhenke/archive/2011/06/22/2087134.html 核心提示:在Eclipse中查看JDK类库的源代码!!! 设置: 1.点 window- Preferences - Java - Installed JRES 2.此时Installed JRES右边…

[单选题]PHP函数,mail($param1, $param2, $param3),其中的$param2参数包含什么?

信息的内容 信息的发送地址 信息的回复地址 信息的主题正确答案:转载于:https://www.cnblogs.com/pizishui/p/5361848.html

不使用加减乘除实现加法

思路: 例如: a5,b9,ab14 a转换为二进制形式为101,b转换为二进制形式为1001,其和转换为二进制形式为1110。 对于二进制形式的相加,可分两步进行操作: 1)先不考虑进位,则01…

VLC 源代码结构

From: http://blog.csdn.net/jack_incredible/article/details/7301155 译者:捞刀客 VLC源代码目录树 本节介绍VLC源代码目录树结构,以期使开发者对源代码的分布结构有一个整体的认识。下面的目录按照字母顺序列出,右边为该目录包…

让开!!!谁也别拦着我封装React组件!

1简介 我是歌谣 放弃很容易 但是坚持一定很酷 喜欢我就一键三连哈 2前言 在我们的工作生活中 每次学习一个框架我们就不免要封装组件 而具备封装一个完美组件的能力 我称之为"优秀" 3准备工作 父组件 <Geyao/> 子组件 import React, { Component } from re…

UI-UIButton、UILable、UITextField总结

UIButton按钮 第一、UIButton的定义 UIButton *button[[UIButton buttonWithType:(UIButtonType); 能够定义的button类型有以下6种&#xff0c; typedef enum { UIButtonTypeCustom 0, 自定义风格 UIButtonTypeRoundedRect, 圆角矩形 UIButtonTypeDetailDisclosure, 蓝色小…

JAVA中线程同步的方法

1、wait方法。 2、notify方法和notifyAll方法。3、synchronized关键字。

ffmpeg教程

From&#xff1a; http://blog.csdn.net/cffishappy/article/details/7352898 概要 电影文件有很多基本的组成部分。首先&#xff0c;文件本身被称为容器Container&#xff0c;容器的类型决定了信息被存放在文件中的位置。AVI和Quicktime就是容器的例子。接着&#xff0c;你有一…

如何实现在一个网页中弹出多个不同的小窗口

【1、最基本的弹出窗口代码】 其实代码非常简单&#xff1a; 1 <script language"javascript"> 2 <!-- 3 window.open (page.html) 4 --> 5 </script> 因为着是一段javascript代码&#xff0c;所以它们应该放在<script language"jav…

实现Parcelable接口

2019独角兽企业重金招聘Python工程师标准>>> 1 官方例子 public class MyParcelable implements Parcelable {private int mData;public int describeContents() {return 0;}public void writeToParcel(Parcel out, int flags) {out.writeInt(mData);}public static…

在Linux下编写C程序,怎么检查程序是否有内存泄漏?

From: http://bbs.chinaunix.net/thread-908769-1-1.html 如题。 ------------------------------- 找到了! http://www.valgrind.org/ 同时附一个转自 http://blog.chinaunix.net/u/18381/showart.php?id162015 的示例: #include <stdlib.h> void f(void) { i…

【蓝桥杯】历届试题 错误票据

历届试题 错误票据 时间限制&#xff1a;1.0s 内存限制&#xff1a;256.0MB问题描述某涉密单位下发了某种票据&#xff0c;并要在年终全部收回。 每张票据有唯一的ID号。全年所有票据的ID号是连续的&#xff0c;但ID的开始数码是随机选定的。 因为工作人员疏忽&#xff0c;在…

apue源码编译

http://www.apuebook.com/ 可以下载源码src.tar.gz 修改配置文件 编辑源码解压生成的apue.2e文件夹下的Make.defines.linux 修改WKDIR/home/var/apue.2e为你的apue.2e目录&#xff0c;比如我的apue源码解压在/usr/local,那我就改为&#xff1a; WKDIR/usr/local/apue .2e 然后…

一个跨平台的 C++ 内存泄漏检测器

From&#xff1a;http://www.ibm.com/developerworks/cn/linux/l-mleak2/index.html 内存泄漏对于C/C程序员来说也可以算作是个永恒的话题了吧。在Windows下&#xff0c;MFC的一个很有用的功能就是能在程序运行结束时报告是否发生了内存泄漏。在Linux下&#xff0c;相对来说就没…

PAT 1039. 到底买不买(20)

题目链接&#xff1a;https://www.patest.cn/contests/pat-b-practise/1039 解题思路&#xff1a;自己刚开始想的是用两个字符串来做&#xff0c;搜别人题解的时候发现别人一种很好的解题思路&#xff0c;是用string做的&#xff0c;感觉做的很巧妙 具体的代码如下&#xff1a;…

ios UIPickerView 技巧集锦

重新实现 UIPickerView 参考资料: http://www.cocoachina.com/bbs/read.php?tid85374 http://www.cocoachina.com/iphonedev/toolthain/2011/1205/3663.html 设置循环滚动 设置 UIPickerView 的数据源数量为很大的规模, 取数据时对行数进行取模, 从而实现循环滚动的效果. 在每…

PHP-递归扫描目录和删除目录

(1) 通过递归扫描目录并打印 // php递归扫描目录 function scanMyDir($path){// 打开目录$dh opendir($path);echo <ul>;// 循环读取目录while(($file readdir($dh)) ! false){// 先要过滤掉当前目录.和上一级目录..if($file . || $file ..) continue;// 为了能够显示…

std::map的insert和下标[]访问

From: http://www.cnblogs.com/kex1n/archive/2011/11/16/2251520.html 在map中插入元素 改变map中的条目非常简单&#xff0c;因为map类已经对[]操作符进行了重载 enumMap[1] "One"; enumMap[2] "Two"; ..... 这样非常直观&#xff0c;但存在一个性…

Delphi工具之TDUMP

TDUMP是一个命令行程序&#xff0c;它输出.exe或.dll&#xff08;以及其他文件类型&#xff09;文件的结构。 TDUMP位于Delphi安装目录下的Bin目录里&#xff0c;如下&#xff1a; 缺省时&#xff0c;TDUMP的输出显示到屏幕上&#xff1b; 用户可以将TDUMP的输出定向到一个文本…