FFmpeg5.0源码阅读——格式检测

  摘要:在拿到一个新的格式后,FFmpeg总是能够足够正确的判断格式的内容并进行相应的处理。本文在描述FFmpeg如何进行格式检测来确认正在处理的媒体格式类型,并进行相应的处理。
  关键字:FFmpeg,format,probe

  在调用FFmpeg的APIavformat_open_input之后就能在对应的AVFormatContext看到具体的媒体信息。为了获取媒体信息,首先需要打开流文件,然后读取HEAD检测媒体格式。

//打开文件
if ((ret = s->io_open(s, &s->pb, filename, AVIO_FLAG_READ | s->avio_flags, options)) < 0)return ret;if (s->iformat)return 0;
//探测文件格式
return av_probe_input_buffer2(s->pb, &s->iformat, filename,s, 0, s->format_probesize);

1 打开文件

流协议
  为了打开文件首先需要确认输入的流协议。由于FFMpeg支持很多种协议,比如文件、RTMP、HTTP等,为了正确的读取数据首先需要确认输入的流是哪一种协议。对于输入文件,FFMpeg中确认具体是那种流协议,需要使用哪种protcol打开文件读取数据。
  FFmpeg中很多场景对于支持格式的检测都是对当前支持的格式列表的遍历来选择最匹配的那一个作为最终匹配的结果。协议选择也是一样。如果外界调用API时指定了打开的协议的类型则不会进行检测,没有的花会按照下面的调用链进行匹配。

init_input->io_open_default->ffio_open_whitelist->ffurl_open_whitelist->ffurl_alloc->url_find_protocol

  Protcol的核心代码如下,通过遍历内部维护的全局静态url表格匹配每一个url的name,最终选择能够匹配到的URLProtocol作为最终的流协议。一旦确认了流协议后续就是调用对应的open和read函数指针打开和读文件。

protocols = ffurl_get_protocols(NULL, NULL);
if (!protocols)return NULL;
for (i = 0; protocols[i]; i++) {const URLProtocol *up = protocols[i];if (!strcmp(proto_str, up->name)) {av_freep(&protocols);return up;}if (up->flags & URL_PROTOCOL_FLAG_NESTED_SCHEME &&!strcmp(proto_nested, up->name)) {av_freep(&protocols);return up;}
}

2 检测媒体格式

确认iformat
  媒体格式探测其实就是确认使用哪种AVInputFormat解析(该成员是AVFormatContext->iformat字段)。如上面的代码所示这里的流协议检测是调用av_probe_input_format2来实现的,而该函数也只是转调了av_probe_input_format3而已。

  av_probe_input_format3检测文件格式的方式就是遍历FFmpeg内部的iformat静态表格,选择匹配度个最高的那个作为最终的格式。核心代码如下。

while ((fmt1 = av_demuxer_iterate(&i))) {if (fmt1->flags & AVFMT_EXPERIMENTAL)continue;if (!is_opened == !(fmt1->flags & AVFMT_NOFILE) && strcmp(fmt1->name, "image2"))continue;score = 0;if (ffifmt(fmt1)->read_probe) {score = ffifmt(fmt1)->read_probe(&lpd);if (score)av_log(NULL, AV_LOG_TRACE, "Probing %s score:%d size:%d\n", fmt1->name, score, lpd.buf_size);if (fmt1->extensions && av_match_ext(lpd.filename, fmt1->extensions)) {switch (nodat) {case NO_ID3:score = FFMAX(score, 1);break;case ID3_GREATER_PROBE:case ID3_ALMOST_GREATER_PROBE:score = FFMAX(score, AVPROBE_SCORE_EXTENSION / 2 - 1);break;case ID3_GREATER_MAX_PROBE:score = FFMAX(score, AVPROBE_SCORE_EXTENSION);break;}}} else if (fmt1->extensions) {if (av_match_ext(lpd.filename, fmt1->extensions))score = AVPROBE_SCORE_EXTENSION;}if (av_match_name(lpd.mime_type, fmt1->mime_type)) {if (AVPROBE_SCORE_MIME > score) {av_log(NULL, AV_LOG_DEBUG, "Probing %s score:%d increased to %d due to MIME type\n", fmt1->name, score, AVPROBE_SCORE_MIME);score = AVPROBE_SCORE_MIME;}}if (score > score_max) {score_max = score;fmt       = fmt1;} else if (score == score_max)fmt = NULL;
}

  从上面的流程中可以看到FFmpeg媒体信息探测会给每个格式一个分数,将根据输入流和对应的格式确认当前的分数,分数越高则匹配度越高,最后选择分数最高的格式作为选中的格式。而分数计算主要参考read_probe返回的分数值、后缀名和ID3元数据。
  从代码中也能够看到read_probe给的分数相比比较优先,而输入路径的后缀名会作为兜底策略,最低50分。这样是为什么对于一个不是媒体文件的格式个更改后缀名后却有可能检测成功的原因。那为什么需要保留后缀名检测呢?原因是并不是所有格式都能够通过文件内容判断其格式,比如相机的raw格式往往更改后缀名后就无法正常解析,这是因为raw格式只包含数据不包含任何其他多余的信息。

read_probe
  FFmpeg内部read_probe其实就是就是调用对应AVFormatInputread_probe函数,每个格式都有自己的实现。一般情况下分为两种,一种是文件开头有tag直接表明当前文件类型的,比如GIF等;另一种是需要读取部分文件内容来确认格式信息的,比如mov、mp4格式。

  第一种比较简单直接读取文件内容然后匹配tag即可,比如gif的格式检测:

static int gif_probe(const AVProbeData *p){/* check magick */if (memcmp(p->buf, gif87a_sig, 6) && memcmp(p->buf, gif89a_sig, 6))return 0;/* width or height contains zero? */if (!AV_RL16(&p->buf[6]) || !AV_RL16(&p->buf[8]))return 0;return AVPROBE_SCORE_MAX;
}

  另一种需要度却文件内容,比如mp4格式检测需要读取其中的box来确认部分文件信息。

static int mov_probe(const AVProbeData *p)
{int64_t offset;uint32_t tag;int score = 0;int moov_offset = -1;/* check file header */offset = 0;for (;;) {int64_t size;int minsize = 8;/* ignore invalid offset */if ((offset + 8ULL) > (unsigned int)p->buf_size)break;size = AV_RB32(p->buf + offset);if (size == 1 && offset + 16 <= (unsigned int)p->buf_size) {size = AV_RB64(p->buf+offset + 8);minsize = 16;} else if (size == 0) {size = p->buf_size - offset;}if (size < minsize) {offset += 4;continue;}tag = AV_RL32(p->buf + offset + 4);switch(tag) {/* check for obvious tags */case MKTAG('m','o','o','v'):moov_offset = offset + 4;case MKTAG('m','d','a','t'):case MKTAG('p','n','o','t'): /* detect movs with preview pics like ew.mov and april.mov */case MKTAG('u','d','t','a'): /* Packet Video PVAuthor adds this and a lot of more junk */case MKTAG('f','t','y','p'):if (tag == MKTAG('f','t','y','p') &&(   AV_RL32(p->buf + offset + 8) == MKTAG('j','p','2',' ')|| AV_RL32(p->buf + offset + 8) == MKTAG('j','p','x',' ')|| AV_RL32(p->buf + offset + 8) == MKTAG('j','x','l',' '))) {score = FFMAX(score, 5);} else {score = AVPROBE_SCORE_MAX;}break;/* those are more common words, so rate then a bit less */case MKTAG('e','d','i','w'): /* xdcam files have reverted first tags */case MKTAG('w','i','d','e'):case MKTAG('f','r','e','e'):case MKTAG('j','u','n','k'):case MKTAG('p','i','c','t'):score  = FFMAX(score, AVPROBE_SCORE_MAX - 5);break;case MKTAG(0x82,0x82,0x7f,0x7d):score  = FFMAX(score, AVPROBE_SCORE_EXTENSION - 5);break;case MKTAG('s','k','i','p'):case MKTAG('u','u','i','d'):case MKTAG('p','r','f','l'):/* if we only find those cause probedata is too small at least rate them */score  = FFMAX(score, AVPROBE_SCORE_EXTENSION);break;}if (size > INT64_MAX - offset)break;offset += size;}if (score > AVPROBE_SCORE_MAX - 50 && moov_offset != -1) {/* moov atom in the header - we should make sure that this is not a* MOV-packed MPEG-PS */offset = moov_offset;while (offset < (p->buf_size - 16)) { /* Sufficient space *//* We found an actual hdlr atom */if (AV_RL32(p->buf + offset     ) == MKTAG('h','d','l','r') &&AV_RL32(p->buf + offset +  8) == MKTAG('m','h','l','r') &&AV_RL32(p->buf + offset + 12) == MKTAG('M','P','E','G')) {av_log(NULL, AV_LOG_WARNING, "Found media data tag MPEG indicating this is a MOV-packed MPEG-PS.\n");/* We found a media handler reference atom describing an* MPEG-PS-in-MOV, return a* low score to force expanding the probe window until* mpegps_probe finds what it needs */return 5;} else {/* Keep looking */offset += 2;}}}return score;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/39747.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

变量的定义和使用

1.定义 变量&#xff0c;就是用来表示数据的名字 Python 中定义变量非常简单&#xff0c;只需将数据通过等号()赋值给一个符合命名规范的标识符即可 name"Camille" name 123 变量的使用 变量的使用是指在程序中引用一个已经定义的变量。 例如&#xff0c;如果…

LeetCode 196, 73, 105

目录 196. 删除重复的电子邮箱题目链接表要求知识点思路代码 73. 矩阵置零题目链接标签简单版思路代码 优化版思路代码 105. 从前序与中序遍历序列构造二叉树题目链接标签思路代码 196. 删除重复的电子邮箱 题目链接 196. 删除重复的电子邮箱 表 表Person的字段为id和email…

昇思MindSpore学习总结七——模型训练

1、模型训练 模型训练一般分为四个步骤&#xff1a; 构建数据集。定义神经网络模型。定义超参、损失函数及优化器。输入数据集进行训练与评估。 现在我们有了数据集和模型后&#xff0c;可以进行模型的训练与评估。 2、构建数据集 首先从数据集 Dataset加载代码&#xff0…

检测站机动车授权签字人试题附答案

16、___的轮胎胎冠上花纹深度不得小于3.2mm。( ) A、乘用车 B、摩托车 C、货车的转向轮&#xff08;正确答案&#xff09; D、挂车 17、最大设计时速≥100km/h的机动车其转向盘自由转动量不大于__。( ) A、30 度 B、20 度&#xff08;正确答案&#xff09; C、45 度 D、40度…

在windows上安装objection

安装命令pip install objection -i https://mirrors.aliyun.com/pypi/simple hook指定进程 objection -g 测试 explore 进程名不定是包名&#xff0c;也可能是app名字&#xff0c;如“测试”就是app的名字 若出现如下错误&#xff0c;说明python 缺少setuptools 直接安装setu…

掷骰子游戏 、 求绝对值,平方根,对数,正弦值 题目

题目 JAVA33 掷骰子游戏分析&#xff1a;代码&#xff1a; JAVA34 求绝对值&#xff0c;平方根&#xff0c;对数&#xff0c;正弦值分析&#xff1a;代码&#xff1a; JAVA33 掷骰子游戏 描述开发一个掷骰子游戏&#xff0c;即每次运行程序时&#xff0c;产生一个[1,6]之间的随…

秋招突击——设计模式补充——单例模式、依赖倒转原则、工厂方法模式

文章目录 引言正文依赖倒转原则工厂方法模式工厂模式的实现简单工厂和工厂方法的对比 抽线工厂模式最基本的数据访问程序使用工厂模式实现数据库的访问使用抽象工厂模式的数据访问程序抽象工厂模式的优点和缺点使用反射抽象工厂的数据访问程序使用反射配置文件实现数据访问程序…

检索增强生成RAG系列6--RAG提升之查询结构化(Query Construction)

系列5中讲到会讲解3个方面RAG的提升&#xff0c;它们可能与RAG的准确率有关系&#xff0c;但是更多的它们是有其它用途。本期来讲解第二部分&#xff1a;查询结构化&#xff08;Query Construction&#xff09;。在系列3文档处理中&#xff0c;我们着重讲解了文档解析&#xff…

C++ dll导出类的方法

要在C动态库中导出类&#xff0c;可以使用以下步骤&#xff1a; 定义一个类并实现其成员函数。在类的声明前加上__declspec(dllexport)标记&#xff08;Windows平台&#xff09;或__attribute__((visibility("default")))标记&#xff08;Linux平台&#xff09;&…

C语言学习笔记--第一个程序

第一个C语言程序 #include<stdio.h> //引用输入输出头文件&#xff0c;每一次都需要引用这个文件 //.h是头文件 // .c是源文件 // .cpp是C源文件&#xff0c;兼容C //C的第一个程序 // 行注释&#xff08;只能注释这一行&#xff09; /*块注释 */ int main() {printf(&…

能保存到相册的风景视频在哪下载?下载风景视频网站分享

在当今以视觉为核心的时代&#xff0c;高清美丽的风景视频不仅能够丰富我们的日常生活&#xff0c;还能提供心灵上的慰藉。无论是为了制作视频项目&#xff0c;还是仅仅想要珍藏一些精美的风景画面&#xff0c;获取高质量的风景视频素材显得尤为重要。许多人可能会问&#xff1…

PTrade量化软件常见问题整理系列2

一、研究界面使用get_fundamentals函数报错&#xff1a;error_info:获取token失败&#xff1f; 研究界面使用get_fundamentals函数报错&#xff1a;error_info:获取token失败&#xff1f; 1、测试版本202202.01.052&#xff0c;升级202202.01.051版本后&#xff0c;为了解决不…

在虚拟仿真中学习人工智能,可以达到什么目标?

人工智能已经成为引领社会创新的关键力量&#xff0c;想要在这个充满机遇的领域中脱颖而出&#xff0c;掌握扎实的专业技能和积累丰富的实践经验至关重要。然而&#xff0c;许多学习者在追求这一目标的过程中面临着几个主要问题&#xff1a;专业技术掌握有难度、实践经验积累存…

linux中awk,sed, grep使用

《linux私房菜》这本书中将sed和awk一同归为行的修改这一点&#xff0c;虽然对&#xff0c;但不利于实际处理问题时的思考。因为这样的话&#xff0c;当我们实际处理问题时&#xff0c;遇到比如说统计文本打印内容时&#xff0c;我们选择sed还是awk进行处理呢&#xff1f; 也因…

​香橙派AIpro测评:usb鱼眼摄像头的Camera图像获取

一、前言 近期收到了一块受到业界人士关注的开发板"香橙派AIpro",因为这块板子具有极高的性价比&#xff0c;同时还可以兼容ubuntu、安卓等多种操作系统&#xff0c;今天博主便要在一块832g的香橙派AI香橙派AIpro进行YoloV5s算法的部署并使用一个外接的鱼眼USB摄像头…

React 中如何使用 Monaco

Monaco 是微软开源的一个编辑器&#xff0c;VSCode 也是基于 Monaco 进行开发的。如果在 React 中如何使用 Monaco&#xff0c;本文将介绍如何在 React 中引入 Monaco。 安装 React 依赖 yarn add react-app-rewired --dev yarn add monaco-editor-webpack-plugin --dev yarn…

学习和发展人工智能:新兴趋势和成功秘诀

人工智能(AI)继续吸引组织&#xff0c;因为它似乎无穷无尽地提高生产力和业务成果。在本博客中&#xff0c;了解学习和发展(L&D)部门如何利用人工智能改进流程&#xff0c;简化工作流程&#xff1f; 学习与发展(L&D)部门领导开始探索如何提高和支持人工智能能力的劳动…

1-认识网络爬虫

1.什么是网络爬虫 ​ 网络爬虫&#xff08;Web Crawler&#xff09;又称网络蜘蛛、网络机器人&#xff0c;它是一种按照一定规则&#xff0c;自动浏览万维网的程序或脚本。通俗地讲&#xff0c;网络爬虫就是一个模拟真人浏览万维网行为的程序&#xff0c;这个程序可以代替真人…

工业智能网关在现代工业生产中的重要性-天拓四方

工业智能网关是一款具备挖掘工业设备数据并接入到自主开发的云平台的智能嵌入式网络设备。它具备数据采集、协议解析、边缘计算&#xff0c;以及4G/5G/WiFi数据传输等功能&#xff0c;并能接入工业云平台。这种网关不仅支持采集PLC、传感器、仪器仪表和各种控制器&#xff0c;还…

iss文件本机可以访问,其他电脑无法访问解决

1.搜索的时候有很多答案&#xff0c;总结就是2种 引用来自这位大佬的博客跳转 2.我实际解决了的方法 将这里的ip地址修改为你局域网wifi的ip 如何看自己wifi的ip&#xff0c;大家自行百度&#xff01;