【FFmpeg】解封装 ① ( 封装与解封装流程 | 解封装函数简介 | 查找码流标号和码流参数信息 | 使用 MediaInfo 分析视频文件 )

文章目录

  • 一、解封装
    • 1、封装与解封装流程
    • 2、解封装 常用函数
  • 二、解封装函数简介
    • 1、avformat_alloc_context 函数
    • 2、avformat_free_context 函数
    • 3、avformat_open_input 函数
    • 4、avformat_close_input 函数
    • 5、avformat_find_stream_info 函数
    • 6、av_read_frame 函数
    • 7、avformat_seek_file 函数
    • 8、av_seek_frame 函数
  • 三、查找码流标号和参数信息
    • 1、码流标号
    • 2、查找码流标号 - av_find_best_stream 函数
    • 3、查找码流参数信息 - avformat_find_stream_info 函数
    • 4、查找码流参数信息延迟分析
  • 四、视频文件解封装示例
    • 1、使用 MediaInfo 分析视频文件
    • 2、使用 MediaInfo 分析视频文件的每个字节的信息


FFmpeg 4.0 版本源码地址 :

  • GitHub : https://github.com/FFmpeg/FFmpeg/tree/release/4.0
  • GitCode : https://gitcode.com/gh_mirrors/ff/FFmpeg/tree/release/4.0
  • FFmpeg/libavcodec/avpacket.c 源码 : https://gitcode.com/gh_mirrors/ff/FFmpeg/blob/release/4.0/libavcodec/avpacket.c




一、解封装




1、封装与解封装流程


" 封装 " 是 将 音频流 / 视频流 / 字幕流 等多媒体流 , 按照一定的规则 组合成 特定格式的 视频文件 ;

  • 封装 主要是由 " 复用器 " 完成的 ;
  • 封装示例 : 将 AAC 格式的 音频流 和 H.264 格式的 视频流 封装成一个 .mp4 文件 ;

在这里插入图片描述

" 解封装 " 是 将 特定格式的 视频文件 , 按照一定的规则 拆分成 音频流 / 视频流 / 字幕流 等多媒体流 ;

  • 解封装 主要是由 " 解复用器 " 完成的 ;
  • 解封装示例 : 将 .mp4 文件 拆分成 AAC 格式的 音频流 和 H.264 格式的 视频流 ;

在这里插入图片描述


2、解封装 常用函数


解封装 常用函数 简介 :

  • avformat_alloc_context 函数 : 用于 申请 AVFormatContext 结构体内存 , 并 对 结构体的字段 进行简单初始化操作 ;
  • avformat_free_context 函数 : 释放 AVFormatContext 结构体 及其 关联的资源 ;
  • avformat_open_input 函数 : 使用 解复用器 打开 视频文件 / 媒体流 ;
  • avformat_close_input 函数 : 关闭 解复用器 ;
  • avformat_find_stream_info 函数 : 获取 媒体流信息 ;
  • av_read_frame 函数 : 读取 媒体流 中的 AVPacket 数据包 ;
  • avformat_seek_file 函数 : 根据 时间戳 跨多个流 定位文件 中的位置 ;
  • av_seek_frame 函数 : 根据 时间戳 跳转到指定流的指定位置 ;




二、解封装函数简介



下面的 解封装 函数 可 参考 【FFmpeg】FFmpeg 函数简介 ② ( 封装格式相关函数解析 | 封装格式与解复用器 | avformat_alloc_context 函数 | avformat_open_input函数 ) 博客 ;

解封装流程如下 :
在这里插入图片描述


1、avformat_alloc_context 函数


avformat_alloc_context 函数原型 :

AVFormatContext *avformat_alloc_context(void);
  • 函数作用 : 该函数用于 分配并初始化一个 AVFormatContext 结构体 ;
  • 函数参数 : 函数参数为空 ;
  • 函数返回值 : 函数 返回一个 AVFormatContext 指针 , 指向分配的结构体 ; 如果分配失败 , 则返回 NULL ;

AVFormatContext 结构体 用于 存储 文件格式相关信息 , 其中包括文件中 各个媒体流 的参数信息 ;


2、avformat_free_context 函数


avformat_free_context 函数 用于 释放 AVFormatContext 结构体 以及相关的资源 , 包括 流信息 / IO 资源 / 解码器 / 格式上下文 等数据 ,


avformat_free_context 函数原型如下 :

void avformat_free_context(AVFormatContext *s);

avformat_free_context 函数avformat_alloc_context 函数 一般都要成对使用 , 防止内存泄漏 ;

如果 之前调用过 avformat_alloc_context 函数 , 则必须调用 avformat_free_context 函数 释放内存 ;

如果 之前没有调用过 avformat_alloc_context 函数 , 则不必调用 avformat_free_context 函数 ;


3、avformat_open_input 函数


avformat_open_input 函数 使用 " 解复用器 " 打开 视频文件 , 该函数 在内部会调用 avformat_alloc_context 函数 用于为 AVFormatContext 结构体分配内存 ;


avformat_open_input 函数原型如下 :

int avformat_open_input(AVFormatContext **ps, const char *url, AVInputFormat *fmt, AVDictionary **options);
  • 函数参数 :
    • AVFormatContext **ps : 指向 AVFormatContext 指针的指针 ;
    • const char *url : 输入流的地址或文件名 , 文件路径 或 网络流的 URL ;
    • AVInputFormat *fmt : 设置输入格式 , 一般都是 NULL , FFmpeg 自动选择输入格式 ;
    • AVDictionary **options : 附加参数 , 设置解码器 , 网络连接 等参数 ;
  • 函数返回值 : 关闭成功 返回 0 , 关闭失败 返回 负值错误码 ;

注意 : avformat_open_input 函数 要与 avformat_close_input 函数 成对使用 ;


4、avformat_close_input 函数


avformat_close_input 函数 用于 关闭 " 解复用器 " , 该函数 在内部会调用 avformat_free_context 函数 ;


avformat_close_input 函数原型如下 :

int avformat_close_input(AVFormatContext **ps);
  • 函数参数 : 其中的参数 ps 是 指向 AVFormatContext 指针的指针 ;
  • 函数返回值 : 关闭成功 返回 0 , 关闭失败 返回 负值错误码 ;

注意 : avformat_open_input 函数 要与 avformat_close_input 函数 成对使用 ;


5、avformat_find_stream_info 函数


avformat_find_stream_info 函数 用于获取 媒体流 信息 ;

一般情况下 , 调用 avformat_open_input 函数 就可以获取到 视频文件的 媒体流信息 ;

如果调用 avformat_open_input 函数 无法获取 媒体流信息 , 此时 需要 开发者 手动调用 avformat_find_stream_info 函数 用于获取媒体流信息 ;


函数原型如下 :

int avformat_find_stream_info(AVFormatContext *ic, AVDictionary **options);
  • 函数参数 :
    • AVFormatContext *ic : 指向 AVFormatContext 的指针 ;
    • AVDictionary **options : 可选附加参数 , 设置解码器 , 网络连接 等参数 ;
  • 函数返回值 : 关闭成功 返回 0 , 关闭失败 返回 负值错误码 ;

6、av_read_frame 函数


av_read_frame 函数 用于 读取 音视频流 中的 数据包 , 这是压缩后的数据 , 不能直接播放 , 需要经过解码后才能播放 ;

AAC 格式的 音频流 数据包 , 需要转为 PCM 格式 才能播放 ;

H.264 格式的 视频流 数据包 , 需要转为 YUV 或 RGB 格式 才能播放 ;


av_read_frame 函数 原型 :

int av_read_frame(AVFormatContext *s, AVPacket *pkt);
  • 函数参数 :
    • AVFormatContext *s : 指向 AVFormatContext 的指针 , 这是已经打开的 多媒体流 的格式上下文 ;
    • AVPacket *pkt : 指向 AVPacket 的指针 , 用于存储读取的 一帧 音视频数据 ;
  • 函数返回值 : 关闭成功 返回 0 , 关闭失败 返回 负值错误码 ;

7、avformat_seek_file 函数


avformat_seek_file 函数 参考 【FFmpeg】FFmpeg 函数简介 ② ( 封装格式相关函数解析 | 封装格式与解复用器 | avformat_alloc_context 函数 | avformat_open_input函数 ) 一、FFmpeg 音视频文件 封装格式相关函数 8、avformat_seek_file 函数 博客章节 ;


8、av_seek_frame 函数


av_seek_frame 函数 参考 【FFmpeg】FFmpeg 函数简介 ② ( 封装格式相关函数解析 | 封装格式与解复用器 | avformat_alloc_context 函数 | avformat_open_input函数 ) 一、FFmpeg 音视频文件 封装格式相关函数 9、av_seek_frame 函数 博客章节 ;


avformat_seek_file 函数 与 av_seek_frame 函数 对比 :

  • 跳转粒度 :
    • avformat_seek_file : 支持 视频文件 跨多个媒体流 定位跳转 到 指定时间戳 , 并且 可以控制最小、最大时间戳范围 ;
    • av_seek_frame : 跳转到 特定流 的 指定时间戳 ;
  • 跳转控制 :
    • avformat_seek_file : 可以 精细控制时间戳范围 , 设置最小时间戳和最大时间戳 ;
    • av_seek_frame : 跳转到关键帧 , 灵活性较低 ;
  • 常用场景 :
    • avformat_seek_file : 适用于 跨多个媒体流 的文件 的 精准跳转 ;
    • av_seek_frame : 适用于 单个媒体流操作 , 通常用于快速定位到 视频流、音频流 或 字幕流 的 关键帧 ;




三、查找码流标号和参数信息




1、码流标号


在 FFmpeg 中 , 每个 多媒体文件 可能 包含 多个多媒体流 , 如 : 视频流、音频流、字幕流 等 ;

这些 媒体流都 会 被分配 一个 唯一的索引号 来标识 , 称为 " Stream index " , 用于区分文件中的不同流 ;

上述 流索引号 可以称为 " 码流标号 " , 从 0 开始进行递增编号 , 其中 标号为 0 的码流 可能是 视频流 / 音频流 / 字幕流 ;


2、查找码流标号 - av_find_best_stream 函数


av_find_best_stream 函数 用于查找 媒体文件 中的 最佳流 ;

int av_find_best_stream(AVFormatContext *ic, enum AVMediaType type, int wanted_stream, int related_stream, AVCodec **decoder_ret, int flags);
  • 函数参数 :
    • AVFormatContext *ic : 指向已打开媒体文件的 AVFormatContext 结构体的指针 , 其中封装了 媒体信息 包括 流的数量 以及 每个流的详细信息 ;
    • enum AVMediaType type : 要查找的 媒体流的类型 , 可选的媒体流类型如下 :
      • AVMEDIA_TYPE_VIDEO : 视频流类型 ;
      • AVMEDIA_TYPE_AUDIO : 音频流类型 ;
      • AVMEDIA_TYPE_DATA : 数据流类型 ;
      • AVMEDIA_TYPE_SUBTITLE : 字幕流类型 ;
      • AVMEDIA_TYPE_UNKNOWN : 未知类型 ;
      • AVMEDIA_TYPE_ATTACHMENT : 附件类型 ;
    • int wanted_stream : 用户期望的流索引 , 默认设置 -1 ;
    • int related_stream : 与之相关的最佳流的索引 , 默认设置 -1 ;
    • AVCodec **decoder_ret : 指向找到的流的对应解码器 , 默认设置 NULL ;
    • int flags : 指定额外的查找选项 , 默认设置 0 ;
  • 函数返回值 : 查找成功返回流索引 , 查找失败返回 AVERROR_STREAM_NOT_FOUND 或 错误码 ;

查找视频流示例 :

int video_index = av_find_best_stream(ic, AVMEDIA_TYPE_VIDEO, -1, -1, NULL, 0)

查找音频流示例 :

int audio_index = av_find_best_stream(ic, AVMEDIA_TYPE_AUDIO, -1, -1, NULL, 0)

3、查找码流参数信息 - avformat_find_stream_info 函数


视频文件 在 播放前 , 必须要进行解码 , 解码的前提就是要知道 文件中的如下信息 :

  • 媒体流数量
  • 媒体流类型 : 视频流、音频流、字幕流 等 ;
  • 每个流的详细信息 : 编码格式、比特率、分辨率 等 ;

获取到这些信息后 , 都设置到 AVFormatContext 结构体中 ;


avformat_open_input 函数 在 打开 输入媒体文件 后 , 会读取 文件的头部信息 , 函数执行过程中会 初始化 AVFormatContext 结构体 , 并将读取到的文件流信息填充到该结构体中 ;


有些类型的文件 , 如 : FLV 文件 / H.264 文件 / 网络直播流 , 文件的 头部信息 中并没有完整的流信息 , 甚至就没有头部信息 ;

此时就需要 调用 avformat_find_stream_info 函数 , 获取每个媒体流的完整流信息 , 包括流的 编码参数、比特率、分辨率 等信息 ;

avformat_find_stream_info 函数 可以 在 信息缺失的情况下 , 通过分析 数据包 格式 , 探测并分析 流 的 缺失参数信息 ;


4、查找码流参数信息延迟分析


avformat_find_stream_info 函数会尝试读取足够的数据 , 来确定每个流的参数 , 如 : 编解码器、比特率、采样率 等 ;

读取数据 , 分析数据 , 然后获取流的参数信息 , 这个过程 需要花费一定的时间 , 这就会造成延迟 , 设置的 读取数据越多 , 造成的延迟越大 ;

开发者 通过 AVFormatContext 相关结构设置的一些参数 , 设置 avformat_find_stream_info 函数 读取数据的多少 ;





四、视频文件解封装示例



视频文件 封装在 文件容器中 , 将容器中的数据提取出来 , 就是解封装过程 ;

在本章节中 使用 MediaInfo 分析视频文件 提取视频文件的信息 , 之后在下一篇博客中自己编写代码提取视频文件中的数据 , 并在 输出日志 中展示出来 ;


1、使用 MediaInfo 分析视频文件


MediaInfo 软件 可 用于 提取 视频文件 的 技术信息和元数据 , 支持多种格式和编码 , 可以快速显示文件的详细信息 ;

下面我们使用 MediaInfo 软件 分析 mp4 格式的 视频文件 ;

MediaInfo 软件 默认显示的 文件内容细节是 Details - 0 级别 , 在 " 菜单栏 / 调试 " 选项中可以查看当前的 调试级别 ;

在这里插入图片描述

在 Details - 0 调试级别下 , 只能看到 文件的 容器格式 一般信息 , 有几个文件流 , 每个文件流都是什么格式的 , 具体的文件流的内容是无法看到的 ;

下图就是 mp4 文件的 Details - 0 调试级别 显示的文件的容器信息 , 很简略 ;

在这里插入图片描述


2、使用 MediaInfo 分析视频文件的每个字节的信息


在 " 菜单栏 / 调试 " 选项中 , 设置 调试级别为 Details - 10 级别 , 这样就可以分析文件中每个字节的信息 ;

在这里插入图片描述

此时再打开上个章节中的 mp4 文件 , 就会显示如下信息 , MediaInfo 会将文件的每个字节的数据都解析出来 , 同时将每个字节的含义也展出出来 ;

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/64569.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

windows 自旋锁的实现

VOID KxAcquireSpinLock ( __inout PKSPIN_LOCK SpinLock) {//设置SpinLock指定位,并返回原值//如果原值为0,表示没有上锁,直接返回//如果原值为1,表示已经上锁,进入函数if (InterlockedBitTestAndSet64((LONG64 *)SpinLock, 0)){KxWaitForSpinLockAndAcquire(SpinLock);}retur…

YOLOv8目标检测——详细记录使用ONNX Runtime进行推理部署C++/Python实现

概述 在之前博客中有介绍YOLOv8从环境安装到训练的完整过程,本节主要介绍ONNX Runtime的原理以及使用其进行推理加速,使用Python、C两种编程语言来实现。 https://blog.csdn.net/MariLN/article/details/143924548?spm1001.2014.3001.5501 1. ONNX Ru…

python学opencv|读取图像(十六)修改HSV图像HSV值

【1】引言 前序学习进程中,我们已经掌握了对HSV通道和BGR通道的拆分和合并,并通过自由组合的形式,获得了和初始图像完全不一样的新图像,相关文章可以参考下述链接: python学opencv|读取图像(十四&#xf…

【进阶编程】MVC和MVVM实现前后端分离的实现

在 WPF 开发中,通常使用 MVVM(Model-View-ViewModel)架构来分离视图和业务逻辑,但在某些情况下,你可能希望将 MVC(Model-View-Controller)模式与 MVVM 结合使用。这种结合有时是为了兼顾不同的架…

CEF127 编译指南 MacOS 篇 - 编译 CEF(六)

1. 引言 经过前面的准备工作,我们已经完成了所有必要的环境配置。本文将详细介绍如何在 macOS 系统上编译 CEF127。通过正确的编译命令和参数配置,我们将完成 CEF 的构建工作,最终生成可用的二进制文件。 2. 编译前准备 2.1 确认环境变量 …

关于小程序内嵌h5打开新的小程序

关于小程序内嵌h5打开新的小程序 三种方式 https://juejin.cn/post/7055551463489011749 只依赖于h5本身的就是 https://huaweicloud.csdn.net/64f97ebb6b896f66024ca16c.html https://juejin.cn/post/7055551463489011749 navigateToMiniProgram 故小程序webview里的h5无法…

网络安全技术深度解析与实践案例

网络安全技术深度解析与实践案例 随着信息技术的飞速发展,计算机网络已经成为现代社会不可或缺的一部分。无论是个人生活、企业运营还是国家安全,网络都扮演着至关重要的角色。然而,网络空间的开放性和匿名性也带来了诸多安全隐患。因此&…

[一招过] Python的正则表达式篇

Python 正则表达式(re模块) 正则表达式(regular expression)是用于匹配字符串的一种强大工具。Python 提供了 re 模块来处理正则表达式。通过正则表达式,可以快速匹配、查找、替换、分割字符串等。 1. re 模块基础 …

Zerotier + VSCode远程连接实验室的服务器、Xshell连接远程服务器

目录 1. 本地安装 Zerotier2. 使用本地CMD或者Xshell连接服务器:3. VSCode连接服务器 1. 本地安装 Zerotier Zerotier用来创建一个虚拟网络,可以将服务器和本机都加入该虚拟网络中。本地将会拥有一个内网ip地址,和服务器在一个网络下&#x…

gcd 生成4d

目录 推理示例: 开源地址 https://github.com/basilevh/gcd 推理示例: This section is for casually running our model on custom videos. For thorough quantitative evaluation on Kubric-4D or ParallelDomain-4D, or any command line inference outside of those t…

网安入门|前端基础之Html_css基础

Web1.0、Web2.0 和 Web3.0 是互联网发展的三个主要阶段,每个阶段有其独特的特征和技术进步。以下是对它们的介绍: Web 1.0(静态互联网) 时间:1990年代初到2000年代初 特点: 静态内容:网页主要…

开发平台接口规范:北斗终端->北斗三号卫星->指挥机(北斗终端)->北斗短报文融合平台->客户平台(上行)| 时空信息产品

文章目录 引言I 技术架构和业务流程技术架构北斗终端信息流II 渠道接口验证签名白名单IP渠道配置表设计III 其他辅助功能TCP 发送消息到消息中心nginx转发网关服务异常捕获日志采集IV 知识扩展对请求参数进行校验引言 开发平台的应用场景:平台需要开发能力给下游平台需要接收上…

知识分享第三十天-力扣343.(整数拆分)

343 整数拆分 给定一个正整数 n,将其拆分为至少两个正整数的和,并使这些整数的乘积最大化。 返回你可以获得的最大乘积。 示例 1: 输入: 2 输出: 1 解释: 2 1 1, 1 1 1。 示例 2: 输入: 10 输出: 36 解释: 10 3 3 4, 3 3 4 36。 说明: 你可…

C语言中回调函数的注册及使用

1&#xff0c;回调函数类型定义 #include <stdio.h>// 定义回调函数类型 typedef void (*CallbackFunction)(int); 2&#xff0c;定义注册和调用回调函数的函数 // 存储回调函数的数组 CallbackFunction callbacks[10]; int callback_count 0;// 注册回调函数 void r…

SQL Server 解决游标性能问题的替代方案

在 SQL Server 中&#xff0c;游标&#xff08;Cursor&#xff09;是一种用于逐行处理数据集的强大工具&#xff0c;但在某些情况下&#xff0c;它们可能会导致性能问题&#xff0c;尤其是在处理大量数据时。为了提高性能和可维护性&#xff0c;可以考虑使用其他替代方案。以下…

Vue3路由跳转动画引发页面抖动问题的解决方案

在现代Web应用中&#xff0c;动画不仅提升了视觉效果&#xff0c;还显著改善了用户体验。Vue3作为前端框架的佼佼者&#xff0c;以其强大的生态和灵活的API为开发者提供了丰富的动画实现方式。然而&#xff0c;在Vue3中为路由跳转增加动画效果时&#xff0c;开发者可能会遇到页…

【redis的使用、账号流程、游戏服Handler的反射调用】1.自增id 2.全局用户名这样子名字唯一 3.

一、web服 1)账号注册 // 用于唯一命名服务 com.xinyue.game.center.business.account.logic.AccountRegisterService#accountRegister public void accountRegister(AccountEntity account) {accountManager.checkUsername(account.getUsername());accountManager.checkPass…

搭建Tomcat(六)---Response的实现

目录 引入 一、前端项目容器的搭建 重建项目: 1.创建一个新的项目&#xff1a; 2.创建HTML文件 3.将先前编写的所有tomcatJava文件挪过来 二、配置java文件 1.重启一下MyTomcat 2.配置两个工具包 ①FileUtil ②ResponseUtil&#xff08;响应头&#xff09; 三、处理…

机械鹦鹉与真正的智能:大语言模型推理能力的迷思

编者按&#xff1a; 大语言模型真的具备推理能力吗&#xff1f;我们是否误解了"智能"的本质&#xff0c;将模式匹配误认为是真正的推理&#xff1f; 本文深入探讨了大语言模型&#xff08;LLMs&#xff09;是否真正具备推理能力这一前沿科学问题&#xff0c;作者的核…

.net winform 实现CSS3.0 泼墨画效果

效果图 代码 private unsafe void BlendImages1(Bitmap img1, Bitmap img2) {// 确定两个图像的重叠区域Rectangle rect new Rectangle(0, 0,Math.Min(img1.Width, img2.Width),Math.Min(img1.Height, img2.Height));// 创建输出图像&#xff0c;尺寸为重叠区域大小Bitmap b…