【FFmpeg】解封装 ① ( 封装与解封装流程 | 解封装函数简介 | 查找码流标号和码流参数信息 | 使用 MediaInfo 分析视频文件 )

文章目录

  • 一、解封装
    • 1、封装与解封装流程
    • 2、解封装 常用函数
  • 二、解封装函数简介
    • 1、avformat_alloc_context 函数
    • 2、avformat_free_context 函数
    • 3、avformat_open_input 函数
    • 4、avformat_close_input 函数
    • 5、avformat_find_stream_info 函数
    • 6、av_read_frame 函数
    • 7、avformat_seek_file 函数
    • 8、av_seek_frame 函数
  • 三、查找码流标号和参数信息
    • 1、码流标号
    • 2、查找码流标号 - av_find_best_stream 函数
    • 3、查找码流参数信息 - avformat_find_stream_info 函数
    • 4、查找码流参数信息延迟分析
  • 四、视频文件解封装示例
    • 1、使用 MediaInfo 分析视频文件
    • 2、使用 MediaInfo 分析视频文件的每个字节的信息


FFmpeg 4.0 版本源码地址 :

  • GitHub : https://github.com/FFmpeg/FFmpeg/tree/release/4.0
  • GitCode : https://gitcode.com/gh_mirrors/ff/FFmpeg/tree/release/4.0
  • FFmpeg/libavcodec/avpacket.c 源码 : https://gitcode.com/gh_mirrors/ff/FFmpeg/blob/release/4.0/libavcodec/avpacket.c




一、解封装




1、封装与解封装流程


" 封装 " 是 将 音频流 / 视频流 / 字幕流 等多媒体流 , 按照一定的规则 组合成 特定格式的 视频文件 ;

  • 封装 主要是由 " 复用器 " 完成的 ;
  • 封装示例 : 将 AAC 格式的 音频流 和 H.264 格式的 视频流 封装成一个 .mp4 文件 ;

在这里插入图片描述

" 解封装 " 是 将 特定格式的 视频文件 , 按照一定的规则 拆分成 音频流 / 视频流 / 字幕流 等多媒体流 ;

  • 解封装 主要是由 " 解复用器 " 完成的 ;
  • 解封装示例 : 将 .mp4 文件 拆分成 AAC 格式的 音频流 和 H.264 格式的 视频流 ;

在这里插入图片描述


2、解封装 常用函数


解封装 常用函数 简介 :

  • avformat_alloc_context 函数 : 用于 申请 AVFormatContext 结构体内存 , 并 对 结构体的字段 进行简单初始化操作 ;
  • avformat_free_context 函数 : 释放 AVFormatContext 结构体 及其 关联的资源 ;
  • avformat_open_input 函数 : 使用 解复用器 打开 视频文件 / 媒体流 ;
  • avformat_close_input 函数 : 关闭 解复用器 ;
  • avformat_find_stream_info 函数 : 获取 媒体流信息 ;
  • av_read_frame 函数 : 读取 媒体流 中的 AVPacket 数据包 ;
  • avformat_seek_file 函数 : 根据 时间戳 跨多个流 定位文件 中的位置 ;
  • av_seek_frame 函数 : 根据 时间戳 跳转到指定流的指定位置 ;




二、解封装函数简介



下面的 解封装 函数 可 参考 【FFmpeg】FFmpeg 函数简介 ② ( 封装格式相关函数解析 | 封装格式与解复用器 | avformat_alloc_context 函数 | avformat_open_input函数 ) 博客 ;

解封装流程如下 :
在这里插入图片描述


1、avformat_alloc_context 函数


avformat_alloc_context 函数原型 :

AVFormatContext *avformat_alloc_context(void);
  • 函数作用 : 该函数用于 分配并初始化一个 AVFormatContext 结构体 ;
  • 函数参数 : 函数参数为空 ;
  • 函数返回值 : 函数 返回一个 AVFormatContext 指针 , 指向分配的结构体 ; 如果分配失败 , 则返回 NULL ;

AVFormatContext 结构体 用于 存储 文件格式相关信息 , 其中包括文件中 各个媒体流 的参数信息 ;


2、avformat_free_context 函数


avformat_free_context 函数 用于 释放 AVFormatContext 结构体 以及相关的资源 , 包括 流信息 / IO 资源 / 解码器 / 格式上下文 等数据 ,


avformat_free_context 函数原型如下 :

void avformat_free_context(AVFormatContext *s);

avformat_free_context 函数avformat_alloc_context 函数 一般都要成对使用 , 防止内存泄漏 ;

如果 之前调用过 avformat_alloc_context 函数 , 则必须调用 avformat_free_context 函数 释放内存 ;

如果 之前没有调用过 avformat_alloc_context 函数 , 则不必调用 avformat_free_context 函数 ;


3、avformat_open_input 函数


avformat_open_input 函数 使用 " 解复用器 " 打开 视频文件 , 该函数 在内部会调用 avformat_alloc_context 函数 用于为 AVFormatContext 结构体分配内存 ;


avformat_open_input 函数原型如下 :

int avformat_open_input(AVFormatContext **ps, const char *url, AVInputFormat *fmt, AVDictionary **options);
  • 函数参数 :
    • AVFormatContext **ps : 指向 AVFormatContext 指针的指针 ;
    • const char *url : 输入流的地址或文件名 , 文件路径 或 网络流的 URL ;
    • AVInputFormat *fmt : 设置输入格式 , 一般都是 NULL , FFmpeg 自动选择输入格式 ;
    • AVDictionary **options : 附加参数 , 设置解码器 , 网络连接 等参数 ;
  • 函数返回值 : 关闭成功 返回 0 , 关闭失败 返回 负值错误码 ;

注意 : avformat_open_input 函数 要与 avformat_close_input 函数 成对使用 ;


4、avformat_close_input 函数


avformat_close_input 函数 用于 关闭 " 解复用器 " , 该函数 在内部会调用 avformat_free_context 函数 ;


avformat_close_input 函数原型如下 :

int avformat_close_input(AVFormatContext **ps);
  • 函数参数 : 其中的参数 ps 是 指向 AVFormatContext 指针的指针 ;
  • 函数返回值 : 关闭成功 返回 0 , 关闭失败 返回 负值错误码 ;

注意 : avformat_open_input 函数 要与 avformat_close_input 函数 成对使用 ;


5、avformat_find_stream_info 函数


avformat_find_stream_info 函数 用于获取 媒体流 信息 ;

一般情况下 , 调用 avformat_open_input 函数 就可以获取到 视频文件的 媒体流信息 ;

如果调用 avformat_open_input 函数 无法获取 媒体流信息 , 此时 需要 开发者 手动调用 avformat_find_stream_info 函数 用于获取媒体流信息 ;


函数原型如下 :

int avformat_find_stream_info(AVFormatContext *ic, AVDictionary **options);
  • 函数参数 :
    • AVFormatContext *ic : 指向 AVFormatContext 的指针 ;
    • AVDictionary **options : 可选附加参数 , 设置解码器 , 网络连接 等参数 ;
  • 函数返回值 : 关闭成功 返回 0 , 关闭失败 返回 负值错误码 ;

6、av_read_frame 函数


av_read_frame 函数 用于 读取 音视频流 中的 数据包 , 这是压缩后的数据 , 不能直接播放 , 需要经过解码后才能播放 ;

AAC 格式的 音频流 数据包 , 需要转为 PCM 格式 才能播放 ;

H.264 格式的 视频流 数据包 , 需要转为 YUV 或 RGB 格式 才能播放 ;


av_read_frame 函数 原型 :

int av_read_frame(AVFormatContext *s, AVPacket *pkt);
  • 函数参数 :
    • AVFormatContext *s : 指向 AVFormatContext 的指针 , 这是已经打开的 多媒体流 的格式上下文 ;
    • AVPacket *pkt : 指向 AVPacket 的指针 , 用于存储读取的 一帧 音视频数据 ;
  • 函数返回值 : 关闭成功 返回 0 , 关闭失败 返回 负值错误码 ;

7、avformat_seek_file 函数


avformat_seek_file 函数 参考 【FFmpeg】FFmpeg 函数简介 ② ( 封装格式相关函数解析 | 封装格式与解复用器 | avformat_alloc_context 函数 | avformat_open_input函数 ) 一、FFmpeg 音视频文件 封装格式相关函数 8、avformat_seek_file 函数 博客章节 ;


8、av_seek_frame 函数


av_seek_frame 函数 参考 【FFmpeg】FFmpeg 函数简介 ② ( 封装格式相关函数解析 | 封装格式与解复用器 | avformat_alloc_context 函数 | avformat_open_input函数 ) 一、FFmpeg 音视频文件 封装格式相关函数 9、av_seek_frame 函数 博客章节 ;


avformat_seek_file 函数 与 av_seek_frame 函数 对比 :

  • 跳转粒度 :
    • avformat_seek_file : 支持 视频文件 跨多个媒体流 定位跳转 到 指定时间戳 , 并且 可以控制最小、最大时间戳范围 ;
    • av_seek_frame : 跳转到 特定流 的 指定时间戳 ;
  • 跳转控制 :
    • avformat_seek_file : 可以 精细控制时间戳范围 , 设置最小时间戳和最大时间戳 ;
    • av_seek_frame : 跳转到关键帧 , 灵活性较低 ;
  • 常用场景 :
    • avformat_seek_file : 适用于 跨多个媒体流 的文件 的 精准跳转 ;
    • av_seek_frame : 适用于 单个媒体流操作 , 通常用于快速定位到 视频流、音频流 或 字幕流 的 关键帧 ;




三、查找码流标号和参数信息




1、码流标号


在 FFmpeg 中 , 每个 多媒体文件 可能 包含 多个多媒体流 , 如 : 视频流、音频流、字幕流 等 ;

这些 媒体流都 会 被分配 一个 唯一的索引号 来标识 , 称为 " Stream index " , 用于区分文件中的不同流 ;

上述 流索引号 可以称为 " 码流标号 " , 从 0 开始进行递增编号 , 其中 标号为 0 的码流 可能是 视频流 / 音频流 / 字幕流 ;


2、查找码流标号 - av_find_best_stream 函数


av_find_best_stream 函数 用于查找 媒体文件 中的 最佳流 ;

int av_find_best_stream(AVFormatContext *ic, enum AVMediaType type, int wanted_stream, int related_stream, AVCodec **decoder_ret, int flags);
  • 函数参数 :
    • AVFormatContext *ic : 指向已打开媒体文件的 AVFormatContext 结构体的指针 , 其中封装了 媒体信息 包括 流的数量 以及 每个流的详细信息 ;
    • enum AVMediaType type : 要查找的 媒体流的类型 , 可选的媒体流类型如下 :
      • AVMEDIA_TYPE_VIDEO : 视频流类型 ;
      • AVMEDIA_TYPE_AUDIO : 音频流类型 ;
      • AVMEDIA_TYPE_DATA : 数据流类型 ;
      • AVMEDIA_TYPE_SUBTITLE : 字幕流类型 ;
      • AVMEDIA_TYPE_UNKNOWN : 未知类型 ;
      • AVMEDIA_TYPE_ATTACHMENT : 附件类型 ;
    • int wanted_stream : 用户期望的流索引 , 默认设置 -1 ;
    • int related_stream : 与之相关的最佳流的索引 , 默认设置 -1 ;
    • AVCodec **decoder_ret : 指向找到的流的对应解码器 , 默认设置 NULL ;
    • int flags : 指定额外的查找选项 , 默认设置 0 ;
  • 函数返回值 : 查找成功返回流索引 , 查找失败返回 AVERROR_STREAM_NOT_FOUND 或 错误码 ;

查找视频流示例 :

int video_index = av_find_best_stream(ic, AVMEDIA_TYPE_VIDEO, -1, -1, NULL, 0)

查找音频流示例 :

int audio_index = av_find_best_stream(ic, AVMEDIA_TYPE_AUDIO, -1, -1, NULL, 0)

3、查找码流参数信息 - avformat_find_stream_info 函数


视频文件 在 播放前 , 必须要进行解码 , 解码的前提就是要知道 文件中的如下信息 :

  • 媒体流数量
  • 媒体流类型 : 视频流、音频流、字幕流 等 ;
  • 每个流的详细信息 : 编码格式、比特率、分辨率 等 ;

获取到这些信息后 , 都设置到 AVFormatContext 结构体中 ;


avformat_open_input 函数 在 打开 输入媒体文件 后 , 会读取 文件的头部信息 , 函数执行过程中会 初始化 AVFormatContext 结构体 , 并将读取到的文件流信息填充到该结构体中 ;


有些类型的文件 , 如 : FLV 文件 / H.264 文件 / 网络直播流 , 文件的 头部信息 中并没有完整的流信息 , 甚至就没有头部信息 ;

此时就需要 调用 avformat_find_stream_info 函数 , 获取每个媒体流的完整流信息 , 包括流的 编码参数、比特率、分辨率 等信息 ;

avformat_find_stream_info 函数 可以 在 信息缺失的情况下 , 通过分析 数据包 格式 , 探测并分析 流 的 缺失参数信息 ;


4、查找码流参数信息延迟分析


avformat_find_stream_info 函数会尝试读取足够的数据 , 来确定每个流的参数 , 如 : 编解码器、比特率、采样率 等 ;

读取数据 , 分析数据 , 然后获取流的参数信息 , 这个过程 需要花费一定的时间 , 这就会造成延迟 , 设置的 读取数据越多 , 造成的延迟越大 ;

开发者 通过 AVFormatContext 相关结构设置的一些参数 , 设置 avformat_find_stream_info 函数 读取数据的多少 ;





四、视频文件解封装示例



视频文件 封装在 文件容器中 , 将容器中的数据提取出来 , 就是解封装过程 ;

在本章节中 使用 MediaInfo 分析视频文件 提取视频文件的信息 , 之后在下一篇博客中自己编写代码提取视频文件中的数据 , 并在 输出日志 中展示出来 ;


1、使用 MediaInfo 分析视频文件


MediaInfo 软件 可 用于 提取 视频文件 的 技术信息和元数据 , 支持多种格式和编码 , 可以快速显示文件的详细信息 ;

下面我们使用 MediaInfo 软件 分析 mp4 格式的 视频文件 ;

MediaInfo 软件 默认显示的 文件内容细节是 Details - 0 级别 , 在 " 菜单栏 / 调试 " 选项中可以查看当前的 调试级别 ;

在这里插入图片描述

在 Details - 0 调试级别下 , 只能看到 文件的 容器格式 一般信息 , 有几个文件流 , 每个文件流都是什么格式的 , 具体的文件流的内容是无法看到的 ;

下图就是 mp4 文件的 Details - 0 调试级别 显示的文件的容器信息 , 很简略 ;

在这里插入图片描述


2、使用 MediaInfo 分析视频文件的每个字节的信息


在 " 菜单栏 / 调试 " 选项中 , 设置 调试级别为 Details - 10 级别 , 这样就可以分析文件中每个字节的信息 ;

在这里插入图片描述

此时再打开上个章节中的 mp4 文件 , 就会显示如下信息 , MediaInfo 会将文件的每个字节的数据都解析出来 , 同时将每个字节的含义也展出出来 ;

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/64569.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

YOLOv8目标检测——详细记录使用ONNX Runtime进行推理部署C++/Python实现

概述 在之前博客中有介绍YOLOv8从环境安装到训练的完整过程,本节主要介绍ONNX Runtime的原理以及使用其进行推理加速,使用Python、C两种编程语言来实现。 https://blog.csdn.net/MariLN/article/details/143924548?spm1001.2014.3001.5501 1. ONNX Ru…

python学opencv|读取图像(十六)修改HSV图像HSV值

【1】引言 前序学习进程中,我们已经掌握了对HSV通道和BGR通道的拆分和合并,并通过自由组合的形式,获得了和初始图像完全不一样的新图像,相关文章可以参考下述链接: python学opencv|读取图像(十四&#xf…

CEF127 编译指南 MacOS 篇 - 编译 CEF(六)

1. 引言 经过前面的准备工作,我们已经完成了所有必要的环境配置。本文将详细介绍如何在 macOS 系统上编译 CEF127。通过正确的编译命令和参数配置,我们将完成 CEF 的构建工作,最终生成可用的二进制文件。 2. 编译前准备 2.1 确认环境变量 …

关于小程序内嵌h5打开新的小程序

关于小程序内嵌h5打开新的小程序 三种方式 https://juejin.cn/post/7055551463489011749 只依赖于h5本身的就是 https://huaweicloud.csdn.net/64f97ebb6b896f66024ca16c.html https://juejin.cn/post/7055551463489011749 navigateToMiniProgram 故小程序webview里的h5无法…

开发平台接口规范:北斗终端->北斗三号卫星->指挥机(北斗终端)->北斗短报文融合平台->客户平台(上行)| 时空信息产品

文章目录 引言I 技术架构和业务流程技术架构北斗终端信息流II 渠道接口验证签名白名单IP渠道配置表设计III 其他辅助功能TCP 发送消息到消息中心nginx转发网关服务异常捕获日志采集IV 知识扩展对请求参数进行校验引言 开发平台的应用场景:平台需要开发能力给下游平台需要接收上…

知识分享第三十天-力扣343.(整数拆分)

343 整数拆分 给定一个正整数 n,将其拆分为至少两个正整数的和,并使这些整数的乘积最大化。 返回你可以获得的最大乘积。 示例 1: 输入: 2 输出: 1 解释: 2 1 1, 1 1 1。 示例 2: 输入: 10 输出: 36 解释: 10 3 3 4, 3 3 4 36。 说明: 你可…

搭建Tomcat(六)---Response的实现

目录 引入 一、前端项目容器的搭建 重建项目: 1.创建一个新的项目: 2.创建HTML文件 3.将先前编写的所有tomcatJava文件挪过来 二、配置java文件 1.重启一下MyTomcat 2.配置两个工具包 ①FileUtil ②ResponseUtil(响应头) 三、处理…

机械鹦鹉与真正的智能:大语言模型推理能力的迷思

编者按: 大语言模型真的具备推理能力吗?我们是否误解了"智能"的本质,将模式匹配误认为是真正的推理? 本文深入探讨了大语言模型(LLMs)是否真正具备推理能力这一前沿科学问题,作者的核…

.net winform 实现CSS3.0 泼墨画效果

效果图 代码 private unsafe void BlendImages1(Bitmap img1, Bitmap img2) {// 确定两个图像的重叠区域Rectangle rect new Rectangle(0, 0,Math.Min(img1.Width, img2.Width),Math.Min(img1.Height, img2.Height));// 创建输出图像,尺寸为重叠区域大小Bitmap b…

短视频矩阵:构建多平台曝光的高效运营网络

在当今这个瞬息万变的数字化时代,短视频以其独特的魅力迅速占领了人们的视野,成为信息传播与娱乐消遣的重要一环。随着短视频平台的不断增多和用户群体的日益庞大,如何精准高效地利用短视频进行品牌推广和产品营销,成为了众多企业…

ubuntu+ros新手笔记(三):21讲没讲到的MoveIt2

系统ubuntu22.04 ros2 humble 1 安装MoveIt2 安装参照在ROS2中,通过MoveIt2控制Gazebo中的自定义机械手 安装 MoveIt2可以选择自己编译源码安装,或者直接从二进制安装。 个人建议直接二进制安装,可以省很多事。 sudo apt install ros-humbl…

DotNetBrowser 3.0.0 正式发布!

🛠️ 重要消息:DotNetBrowser 3.0.0 正式发布! 我们很高兴向您介绍全新的 DotNetBrowser 3.0.0 版本。此次更新带来了多项重要功能与优化,进一步提升了 Web 开发的效率和体验。 📢 DotNetBrowser 3.0.0 包含哪些新功…

在 Visual Studio Code 中编译、调试和执行 Makefile 工程 llama2.c

在 Visual Studio Code 中编译、调试和执行 Makefile 工程 llama2.c 1. Installing the extension (在 Visual Studio Code 中安装插件)1.1. Extensions for Visual Studio Code1.2. C/C1.2.1. Pre-requisites 1.3. Makefile Tools 2. Configuring your project (配置项目)2.1.…

EfficientNet:对模型深度、宽度和分辨率的混合缩放策略

论文:https://arxiv.org/abs/1905.11946 项目:https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet Pytorch实现:EfficientNet模型Pytorch版本具体实现-CSDN博客 一、概况 1、概述: 这张图可以清晰明…

大模型学习笔记------SAM模型详解与思考

大模型学习笔记------SAM模型详解与思考 1、SAM框架概述2、Segment Anything Task3、Segment Anything Model SAM模型是Meta 提出的分割一切模型(Segment Anything Model,SAM)突破了分割界限,极大地促进了计算机视觉基础模型的发展…

【嵌入式软件】跑开发板的前置服务配置

在嵌入式开发中,通常需要在 开发板和主机之间共享、传输和挂载文件。 这篇文章是关于如何在 Ubuntu 中配置 Samba、TFTP 和 NFS 协议的详细步骤。这些协议分别用于远程文件共享、文件传输和内核挂载文件系统。 如何安装协议: 参考:ubuntu18配置:详细的内容我手写了一份文档。…

02、服务器的分类和开发项目流程

硬件介绍 1、服务器分类2.开发流程 1、服务器分类 1.1 服务器分类 1u服务器(u表示服务器的厚度) 1U4.45cm; 4u服务器(u表示服务器的厚度) , 服务器有两个电源模块,接在不同的电源,…

图像生成工具WebUI

介绍 Stable Diffusion WebUI(AUTOMATIC1111,简称A1111)是一个为高级用户设计的图形用户界面(GUI),它提供了丰富的功能和灵活性,以满足复杂和高级的图像生成需求。如今各种人工智能满天飞&…

面试经典题目:LeetCode274_H指数

leetcode274——H指数 暴力循环代码分析性能分析 方法1:排序加线性扫描算法步骤: 方法2:计数排序(适用于引用次数有上限)算法步骤: 题目链接:leetcode274_H指数 暴力循环 class Solution { publ…

【前端爬虫】关于如何获取自己的请求头信息(user-agent和cookie)

注意:由于user-agent和cookie中保存了部分账户信息,所以一定不要随意泄露给他人!!! 1.首先打开某个页面,点击键盘的F12键进入控制台,或者鼠标右键页面选择打开控制台 2.然后点击控制台上方的网…