FFmpeg源码:compute_frame_duration函数分析

一、compute_frame_duration函数的定义

compute_frame_duration函数定义在FFmpeg源码(本文演示用的FFmpeg源码版本为7.0.1)的源文件libavformat/demux.c中:

/*** Return the frame duration in seconds. Return 0 if not available.*/
static void compute_frame_duration(AVFormatContext *s, int *pnum, int *pden,AVStream *st, AVCodecParserContext *pc,AVPacket *pkt)
{FFStream *const sti = ffstream(st);AVRational codec_framerate = sti->avctx->framerate;int frame_size, sample_rate;*pnum = 0;*pden = 0;switch (st->codecpar->codec_type) {case AVMEDIA_TYPE_VIDEO:if (st->r_frame_rate.num && (!pc || !codec_framerate.num)) {*pnum = st->r_frame_rate.den;*pden = st->r_frame_rate.num;} else if ((s->iformat->flags & AVFMT_NOTIMESTAMPS) &&!codec_framerate.num &&st->avg_frame_rate.num && st->avg_frame_rate.den) {*pnum = st->avg_frame_rate.den;*pden = st->avg_frame_rate.num;} else if (st->time_base.num * 1000LL > st->time_base.den) {*pnum = st->time_base.num;*pden = st->time_base.den;} else if (codec_framerate.den * 1000LL > codec_framerate.num) {int ticks_per_frame = (sti->codec_desc &&(sti->codec_desc->props & AV_CODEC_PROP_FIELDS)) ? 2 : 1;av_reduce(pnum, pden,codec_framerate.den,codec_framerate.num * (int64_t)ticks_per_frame,INT_MAX);if (pc && pc->repeat_pict) {av_reduce(pnum, pden,(*pnum) * (1LL + pc->repeat_pict),(*pden),INT_MAX);}/* If this codec can be interlaced or progressive then we need* a parser to compute duration of a packet. Thus if we have* no parser in such case leave duration undefined. */if (sti->codec_desc &&(sti->codec_desc->props & AV_CODEC_PROP_FIELDS) && !pc)*pnum = *pden = 0;}break;case AVMEDIA_TYPE_AUDIO:if (sti->avctx_inited) {frame_size  = av_get_audio_frame_duration(sti->avctx, pkt->size);sample_rate = sti->avctx->sample_rate;} else {frame_size  = av_get_audio_frame_duration2(st->codecpar, pkt->size);sample_rate = st->codecpar->sample_rate;}if (frame_size <= 0 || sample_rate <= 0)break;*pnum = frame_size;*pden = sample_rate;break;default:break;}
}

该函数的作用是:计算某路视频流或音频流的packet占用的时间值。

形参s:输入型参数。指向一个AVFormatContext结构体。

形参pnum:输出型参数。执行compute_frame_duration函数后,如果该路流为视频,(*pnum)÷(*pden)会变为一帧视频pakcet占用的时间,单位为秒;如果该路流为音频,*pnum会变为该音频packet(形参pkt指向的packet)占用的以AVStream的time_base为单位的时间值,(*pnum)÷(*pden)会变为该音频packet占用的以秒为单位的时间值。

形参pden:输出型参数。执行compute_frame_duration函数后,如果该路流为视频,(*pnum)÷(*pden)会变为一帧视频pakcet占用的时间,单位为秒;如果该路流为音频,*pden会变为该音频的采样频率(单位为Hz),(*pnum)÷(*pden)会变为该音频packet占用的以秒为单位的时间值。

形参st:输入型参数。指向一个AVStream结构体。

形参pc:输入型参数。指向一个AVCodecParserContext结构体。

形参pkt:输入型参数。指向一个AVPacket结构体。

返回值:无。

二、compute_frame_duration函数的内部实现分析

compute_frame_duration函数内部首先会通过switch、case语句判断该路流是视频还是音频:

switch (st->codecpar->codec_type) {

(一)情况一:该路流为视频

该路流为视频时,以视频压缩编码格式为H.264为例子,相当于执行了下面代码:

case AVMEDIA_TYPE_VIDEO:int ticks_per_frame = (sti->codec_desc &&(sti->codec_desc->props & AV_CODEC_PROP_FIELDS)) ? 2 : 1;av_reduce(pnum, pden,    codec_framerate.den,codec_framerate.num * (int64_t)ticks_per_frame,INT_MAX);if (pc && pc->repeat_pict) {av_reduce(pnum, pden,(*pnum) * (1LL + pc->repeat_pict),(*pden),INT_MAX);}

sti->codec_desc和sti->codec_desc->props是通过avformat_open_input函数中的avcodec_descriptor_get函数得到的,具体可以参考:《FFmpeg源码:avcodec_descriptor_get函数分析》。

int ticks_per_frame = (sti->codec_desc && (sti->codec_desc->props & AV_CODEC_PROP_FIELDS)) ? 2 : 1;

比如对于H.264,通过语句:avcodec_descriptor_get(AV_CODEC_ID_H264)得到的AVCodecDescriptor结构为:

    {.id        = AV_CODEC_ID_H264,.type      = AVMEDIA_TYPE_VIDEO,.name      = "h264",.long_name = "H.264 / AVC / MPEG-4 AVC / MPEG-4 part 10",.props     = 30,.profiles  = ff_h264_profiles,},

所以对于H.264,sti->codec_desc为true,sti->codec_desc->props为30。而宏定义AV_CODEC_PROP_FIELDS为:

/*** Video codec supports separate coding of fields in interlaced frames.*/
#define AV_CODEC_PROP_FIELDS        (1 << 4)

所以满足条件:sti->codec_desc && (sti->codec_desc->props & AV_CODEC_PROP_FIELDS)为true。所以对于H.264,变量ticks_per_frame值为2。

av_reduce函数的用法可以参考:《FFmpeg源码:av_reduce函数分析》。codec_framerate.den为视频帧率的分母,codec_framerate.num为视频帧率的分子,所以对于H.264,执行下面的av_reduce函数后,(*pden) ÷ (*pnum)会变为视频帧率的两倍:

av_reduce(pnum, pden,codec_framerate.den,codec_framerate.num * (int64_t)ticks_per_frame,INT_MAX);

对于H.264,满足条件pc && pc->repeat_pict为true,所以会继续执行av_reduce函数。对于H.264下面语句相当于执行了语句:av_reduce(pnum, pden ,(*pnum) * (2), (*pden), INT_MAX);执行完后(*pden) ÷ (*pnum)会变为视频帧率:

            if (pc && pc->repeat_pict) {av_reduce(pnum, pden,(*pnum) * (1LL + pc->repeat_pict),(*pden),INT_MAX);}

我们都知道视频帧率是视频每秒钟播放的帧数,所以视频帧率的倒数即(*pnum)÷(*pden)就是一帧视频pakcet占用的时间,单位为秒。

(二)情况二:该路流为音频

该路流为音频时,相当于执行了下面代码:

case AVMEDIA_TYPE_AUDIO:frame_size  = av_get_audio_frame_duration2(st->codecpar, pkt->size);sample_rate = st->codecpar->sample_rate;*pnum = frame_size;*pden = sample_rate;

 通过av_get_audio_frame_duration2函数得到该音频packet占用的时间值(关于该函数可以参考:《FFmpeg源码:get_audio_frame_duration、av_get_audio_frame_duration2函数分析》)。通过语句:sample_rate = st->codecpar->sample_rate得到该路音频的采样频率:

frame_size  = av_get_audio_frame_duration2(st->codecpar, pkt->size);
sample_rate = st->codecpar->sample_rate;

让*pnum变为该音频packet(形参pkt指向的packet)占用的以AVStream的time_base为单位的时间值,让*pden变为该音频的采样频率(单位为Hz)。(*pnum)÷(*pden)就是该音频packet占用的以秒为单位的时间值:

    *pnum = frame_size;*pden = sample_rate;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/878985.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025秋招NLP算法面试真题(十八)-大模型训练数据格式常见问题

目录: SFT(有监督微调)的数据集格式RM(奖励模型)的数据格式PPO(强化学习)的数据格式找数据集哪里找微调需要多少条数据有哪些大模型的训练集进行领域大模型预训练应用哪些数据集比较好1.SFT(有监督微调)的数据集格式? 对于大语言模型的训练中,SFT(Supervised Fine…

pycharm如何安装selenium

在pycharm中打开一个项目后,点击Setting(ALTCtrlS快捷键) 然后点击install package完成后点击关闭这个窗口,就可以在代码中使用selenium了 成功后出现如下界面 编写一段正常可以运行操作chorme浏览器的 from selenium import webdriver # 指定ChromeDriver的路径driver we…

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中…

SQL 编程基础

SQL&#xff08;结构化查询语言&#xff09;广泛应用于数据库操作&#xff0c;是每个程序员都需要掌握的技能之一。这篇文章将带你从基础入门&#xff0c;了解SQL编程中的常量、变量及流程控制语句。我们将采用简单易懂的语言&#xff0c;结合实际示例&#xff0c;帮助你轻松理…

Android 调试桥——ADB

文章目录 前言ADB 的主要功能设备连接与管理应用安装与卸载文件传输日志查看设备重启 常用命令连接方式有线无线注意点 前言 ADB&#xff08;Android Debug Bridge&#xff0c;安卓调试桥&#xff09;是 Android SDK 提供的一种命令行工具&#xff0c;用于在开发者的计算机和 …

Stable Diffusion训练LoRA模型参数详细说明(阿里巴巴堆友AI)

工具&#xff1a;线上模型训练堆友AI 一、训练参数 批量大小 (Batch Size) 作用&#xff1a;每次训练中使用的样本数量。参考值&#xff1a;可以从 8 到 64&#xff0c;取决于显存大小。 训练轮数 (Epochs) 作用&#xff1a;完整遍历训练数据的次数。参考值&#xff1a;通…

骨传导耳机推荐排名,精选五款热门好用不踩雷推荐

近两年来&#xff0c;骨传导运动蓝牙耳机在运动领域内日益流行。与传统耳机相比&#xff0c;它的显著优势是能够保持双耳开放&#xff0c;不会堵塞耳道&#xff0c;消除了入耳式耳机可能引起的不适感。此外还能避免运动时耳内出汗可能导致的各种卫生和健康问题。很多人就问了&a…

C# 使用阿里DOH

阿里公共DNS 1. DNS over HTTPs(DoH) 阿里公共DNS通过RFC 8484指定的经过TLS加密的HTTP连接提供DNS解析 DNS over HTTPs&#xff08;DoH&#xff09;的URI接口 &#xff1a;&#xff08;仅提供TLS API&#xff09; https://dns.alidns.com/dns-query?https://alidns_ip/dn…

Python 调用手机摄像头

Python 调用手机摄像头 在手机上安装软件 这里以安卓手机作为演示&#xff0c;ISO也是差不多的 软件下载地址 注意&#xff1a;要想在电脑上查看手机摄像头拍摄的内容的在一个局域网里面(没有 WIFI 可以使用 热点 ) 安装完打开IP摄像头服务器 点击分享查看IP 查看局域网的I…

谷粒商城のNginx

文章目录 前言一、Nginx1、安装Nginx2、相关配置2.1、配置host2.2、配置Nginx2.3、配置网关 前言 本篇重点介绍项目中的Nginx配置。 一、Nginx 1、安装Nginx 首先需要在本地虚拟机执行&#xff1a; mkdir -p /mydata/nginx/html /mydata/nginx/logs /mydata/nginx/conf在项目…

数学建模笔记——TOPSIS[优劣解距离]法

数学建模笔记——TOPSIS[优劣解距离法] TOPSIS(优劣解距离)法1. 基本概念2. 模型原理3. 基本步骤4. 典型例题4.1 矩阵正向化4.2 正向矩阵标准化4.3 计算得分并归一化4.4 python代码实现 TOPSIS(优劣解距离)法 1. 基本概念 C. L.Hwang和 K.Yoon于1981年首次提出 TOPSIS(Techni…

Windows操作系统sid系统唯一标识符查看和修改

1、sid介绍 sid 作为windows系统唯一的标识&#xff0c;对某些集群业务有依赖关系&#xff0c;如果重复可能导致集群部署异常。 如&#xff1a;域控AD 就依赖 sid 功能。 但是某个云主机或虚拟机使用同一个ghost进行操作系统部署&#xff0c;就可能会导致重复的情况&#xf…

java-在idea中antrl的hello world

java-在idea中antrl的hello world 1. 在idea中安装ANTLR V4的插件2. 下载ANTLR的jar包3. idea中创建普通的java项目4. 创建一个Hello.g4的文件5. 使用idea生产接口文件6. java创建一个类和main方法7. 调试输出8. 参考链接 1. 在idea中安装ANTLR V4的插件 路径如下&#xff0c;…

为什么现在都流行开放式耳机?平价高品质蓝牙耳机推荐大赏

现在开放式耳机流行&#xff0c;是因为相比入耳式&#xff0c;它具有以下的优势&#xff1a; 一、佩戴舒适 开放式耳机通常设计轻盈&#xff0c;不直接刺激耳膜&#xff0c;长时间使用也不会给耳膜带来压迫感。而且其不入耳的设计不会堵塞耳道&#xff0c;使用较长时间后&…

Notepad++ 修改 About

1. 用这个工具&#xff0c;看标题&#xff0c;修改 1700 里的 Caption, 保存为 xx.exe, 2.修改链接&#xff0c;先准备如上。 2.1 使用插件 Hex Editor&#xff0c;拖入刚保存的 Notepad.exe 到 Notepad.exe, 按 c..S..H 2.2 按 ctrlf 查找 68 00 74 00 74 00 70 00 73 00 3…

gitlab+habor+jenkins+k8s 安装流程及配置实现CICD

以下是基本的安装流程及配置实现CICD的步骤&#xff1a; 安装GitLab&#xff1a; 安装依赖项&#xff1a;yum install curl policycoreutils-python openssh-server启动和设置SSH&#xff1a;systemctl enable sshd && systemctl start sshd安装Postfix&#xff1a;yum…

深入理解数据库的 4NF:多值依赖与消除数据异常

在数据库设计中&#xff0c; "范式" 是一个常常被提到的重要概念。许多初学者在学习数据库设计时&#xff0c;经常听到第一范式&#xff08;1NF&#xff09;、第二范式&#xff08;2NF&#xff09;、第三范式&#xff08;3NF&#xff09;以及 BCNF&#xff08;Boyce-…

线程的四种操作

所属专栏&#xff1a;Java学习 1. 线程的开启 start和run的区别&#xff1a; run&#xff1a;描述了线程要执行的任务&#xff0c;也可以称为线程的入口 start&#xff1a;调用系统函数&#xff0c;真正的在系统内核中创建线程&#xff08;创建PCB&#xff0c;加入到链…

利士策分享,从零开始创业:一场勇敢而精彩的旅程

利士策分享&#xff0c;从零开始创业&#xff1a;一场勇敢而精彩的旅程 附上可落地执行的策略&#xff1a; 在创业的征途中&#xff0c;理论固然重要&#xff0c;但可落地执行的策略才是推动我们前进的实际动力。 以下是一些具体且可操作的策略&#xff0c;希望可以帮助你从零…

Linux grep筛选命令及管道符|详解

grep grep命令的全称为 global regular expression print&#xff0c;regular expression也就是正则表达式&#xff0c;这里是指通过正则表达式进行匹配检索 grep的用法为 grep 关键字 文件或目录路径 常用的option选项为-n&#xff0c;作用为显示检索出的内容所在行&#…