【FFmpeg】AVCodec结构体

【FFmpeg】AVCodec结构体

  • 1. AVCodec的定义
  • 2. AVCodec内结构体嵌套
    • 2.1 enum AVMediaType type
    • 2.2 enum AVCodecID id
    • 2.3 const AVRational *supported_framerates
    • 2.4 const enum AVPixelFormat *pix_fmts
    • 2.5 const AVClass *priv_class
    • 2.6 const AVProfile *profiles

参考:
FFMPEG结构体分析:AVCodec

示例工程:
【FFmpeg】调用ffmpeg库实现264软编
【FFmpeg】调用ffmpeg库实现264软解
【FFmpeg】调用ffmpeg库进行RTMP推流和拉流
【FFmpeg】调用ffmpeg库进行SDL2解码后渲染

流程分析:
【FFmpeg】编码链路上主要函数的简单分析
【FFmpeg】解码链路上主要函数的简单分析

本文参考了雷博士的文章,但不同之处在于记录的FFmpeg版本为7.0,由于FFmpeg有些更新,所以部分内容有些不太一样

1. AVCodec的定义

AVCodec是FFmpeg中最重要的结构体之一,它记录了编解码器中的重要信息,其定义位于libavcodec\codec.h中,如下所示

/*** AVCodec.*/
typedef struct AVCodec {/*** Name of the codec implementation.* The name is globally unique among encoders and among decoders (but an* encoder and a decoder can share the same name).* This is the primary way to find a codec from the user perspective.*/const char *name;				// 编解码器的名称/*** Descriptive name for the codec, meant to be more human readable than name.* You should use the NULL_IF_CONFIG_SMALL() macro to define it.*/const char *long_name;			// 编解码器的全称enum AVMediaType type;			// 类型,指明是视频、音频还是字幕(如AVMEDIA_TYPE_VIDEO)enum AVCodecID id;				// Codec的ID(如AV_CODEC_ID_H264)/*** Codec capabilities.* see AV_CODEC_CAP_**/// capabilities表示了codec的能力,例如配置为AV_CODEC_CAP_ENCODER_RECON_FRAME// 编码器能够输出重构的帧数据,即通过解码编码的比特流产生的原始帧。重构帧输出由AV_CODEC_FLAG_RECON_FRAME标志启用int capabilities;						// 解码器支持的最大的低分辨率uint8_t max_lowres;                     ///< maximum value for lowres supported by the decoder// 【视频】支持的帧率,有多个支持的帧率,则为数组 AVRational = {int num, int den}const AVRational *supported_framerates; ///< array of supported framerates, or NULL if any, array is terminated by {0,0}// 【视频】支持的像素格式,有多个支持的格式,则为数组(如AV_PIX_FMT_YUV420P)const enum AVPixelFormat *pix_fmts;     ///< array of supported pixel formats, or NULL if unknown, array is terminated by -1// 【音频】支持的采样率,有多个支持的采样率,则为数组const int *supported_samplerates;       ///< array of supported audio samplerates, or NULL if unknown, array is terminated by 0// 【音频】支持的采样格式,有多个支持的采样格式,则为数组const enum AVSampleFormat *sample_fmts; ///< array of supported sample formats, or NULL if unknown, array is terminated by -1// 描述AVClass上下文结构的类。这是一个任意结构体,其第一个字段是指向AVClass结构体的指针(例如AVCodecContext, AVFormatContext等)// 这里应该是替代了早期的priv_data_sizeconst AVClass *priv_class;              ///< AVClass for the private context// 被识别的配置文件数组,如果未知则为NULL,数组以{AV_PROFILE_UNKNOWN}终止const AVProfile *profiles;              ///< array of recognized profiles, or NULL if unknown, array is terminated by {AV_PROFILE_UNKNOWN}/*** Group name of the codec implementation.* This is a short symbolic name of the wrapper backing this codec. A* wrapper uses some kind of external implementation for the codec, such* as an external library, or a codec implementation provided by the OS or* the hardware.* If this field is NULL, this is a builtin, libavcodec native codec.* If non-NULL, this will be the suffix in AVCodec.name in most cases* (usually AVCodec.name will be of the form "<codec_name>_<wrapper_name>").*/// 编解码器实现的组名称// 这是支持此编解码器的包装器的简短符号名称。包装器为编解码器使用某种外部实现,// 例如外部库,或者由操作系统或硬件提供的编解码器实现。如果该字段为NULL,// 则这是一个内置的libavcodec本机编解码器。如果非null,在大多数情况下,// 这将是AVCodec.name中的后缀(通常AVCodec.name将具有“<codec_name>_<wrapper_name>”的形式)const char *wrapper_name;/*** Array of supported channel layouts, terminated with a zeroed layout.*/// 【音频】支持的声道数,如果有多个,则维数组const AVChannelLayout *ch_layouts;
} AVCodec;

2. AVCodec内结构体嵌套

2.1 enum AVMediaType type

AVMediaType的声明位于libavutil/avutil.h,定义了媒体的类型,例如视频、音频,其余的不太理解,如下所示

/*** @addtogroup lavu_media Media Type* @brief Media Type*/enum AVMediaType {AVMEDIA_TYPE_UNKNOWN = -1,  ///< Usually treated as AVMEDIA_TYPE_DATAAVMEDIA_TYPE_VIDEO,AVMEDIA_TYPE_AUDIO,AVMEDIA_TYPE_DATA,          ///< Opaque data information usually continuousAVMEDIA_TYPE_SUBTITLE,AVMEDIA_TYPE_ATTACHMENT,    ///< Opaque data information usually sparseAVMEDIA_TYPE_NB
};

2.2 enum AVCodecID id

AVCodecID的声明位于libavcodec\codec_id.h,标识了codec使用的类型

/*** Identify the syntax and semantics of the bitstream.* The principle is roughly:* Two decoders with the same ID can decode the same streams.* Two encoders with the same ID can encode compatible streams.* There may be slight deviations from the principle due to implementation* details.** If you add a codec ID to this list, add it so that* 1. no value of an existing codec ID changes (that would break ABI),* 2. it is as close as possible to similar codecs** After adding new codec IDs, do not forget to add an entry to the codec* descriptor list and bump libavcodec minor version.*/
// 确定位流的语法和语义
// 原则大致为:
// (1)两个具有相同ID的解码器能够解码出来相同的码流
// (2)两个具有相同ID的编码器能够编码出来兼容的码流
// 由于实现细节的原因,可能会与原则有轻微的偏差
// 如果将编解码器ID添加到此列表中,则添加它以便
// (1)现有编解码器ID的值不会改变(这会破坏ABI),
// (2)它尽可能接近类似的编解码器
// 在添加新的编解码器id之后,不要忘记在编解码器描述符列表中添加一个条目,并将libavcodec的次要版本升级
enum AVCodecID {AV_CODEC_ID_NONE,/* video codecs */AV_CODEC_ID_MPEG1VIDEO,AV_CODEC_ID_MPEG2VIDEO, ///< preferred ID for MPEG-1/2 video decodingAV_CODEC_ID_H261,AV_CODEC_ID_H263,AV_CODEC_ID_RV10,AV_CODEC_ID_RV20,AV_CODEC_ID_MJPEG,AV_CODEC_ID_MJPEGB,AV_CODEC_ID_LJPEG,AV_CODEC_ID_SP5X,AV_CODEC_ID_JPEGLS,AV_CODEC_ID_MPEG4,AV_CODEC_ID_RAWVIDEO,AV_CODEC_ID_MSMPEG4V1,AV_CODEC_ID_MSMPEG4V2,AV_CODEC_ID_MSMPEG4V3,AV_CODEC_ID_WMV1,AV_CODEC_ID_WMV2,AV_CODEC_ID_H263P,AV_CODEC_ID_H263I,AV_CODEC_ID_FLV1,AV_CODEC_ID_SVQ1,AV_CODEC_ID_SVQ3,AV_CODEC_ID_DVVIDEO,AV_CODEC_ID_HUFFYUV,AV_CODEC_ID_CYUV,AV_CODEC_ID_H264,	// H264标准// ...

2.3 const AVRational *supported_framerates

AVRational的声明位于libavutil\avutil.c中,常用于表示一些计数

/*** Rational number (pair of numerator and denominator).*/
typedef struct AVRational{// 分子int num; ///< Numerator// 分母int den; ///< Denominator
} AVRational;

2.4 const enum AVPixelFormat *pix_fmts

AVPixelFormat的定义位于libavutil\pixfmt.h中,描述了pixel的格式,其中最为常见的应该是YUV420P

/*** Pixel format.** @note* AV_PIX_FMT_RGB32 is handled in an endian-specific manner. An RGBA* color is put together as:*  (A << 24) | (R << 16) | (G << 8) | B* This is stored as BGRA on little-endian CPU architectures and ARGB on* big-endian CPUs.** @note* If the resolution is not a multiple of the chroma subsampling factor* then the chroma plane resolution must be rounded up.** @par* When the pixel format is palettized RGB32 (AV_PIX_FMT_PAL8), the palettized* image data is stored in AVFrame.data[0]. The palette is transported in* AVFrame.data[1], is 1024 bytes long (256 4-byte entries) and is* formatted the same as in AV_PIX_FMT_RGB32 described above (i.e., it is* also endian-specific). Note also that the individual RGB32 palette* components stored in AVFrame.data[1] should be in the range 0..255.* This is important as many custom PAL8 video codecs that were designed* to run on the IBM VGA graphics adapter use 6-bit palette components.** @par* For all the 8 bits per pixel formats, an RGB32 palette is in data[1] like* for pal8. This palette is filled in automatically by the function* allocating the picture.*/
enum AVPixelFormat {AV_PIX_FMT_NONE = -1,AV_PIX_FMT_YUV420P,   ///< planar YUV 4:2:0, 12bpp, (1 Cr & Cb sample per 2x2 Y samples)AV_PIX_FMT_YUYV422,   ///< packed YUV 4:2:2, 16bpp, Y0 Cb Y1 CrAV_PIX_FMT_RGB24,     ///< packed RGB 8:8:8, 24bpp, RGBRGB...AV_PIX_FMT_BGR24,     ///< packed RGB 8:8:8, 24bpp, BGRBGR...AV_PIX_FMT_YUV422P,   ///< planar YUV 4:2:2, 16bpp, (1 Cr & Cb sample per 2x1 Y samples)AV_PIX_FMT_YUV444P,   ///< planar YUV 4:4:4, 24bpp, (1 Cr & Cb sample per 1x1 Y samples)AV_PIX_FMT_YUV410P,   ///< planar YUV 4:1:0,  9bpp, (1 Cr & Cb sample per 4x4 Y samples)AV_PIX_FMT_YUV411P,   ///< planar YUV 4:1:1, 12bpp, (1 Cr & Cb sample per 4x1 Y samples)AV_PIX_FMT_GRAY8,     ///<        Y        ,  8bppAV_PIX_FMT_MONOWHITE, ///<        Y        ,  1bpp, 0 is white, 1 is black, in each byte pixels are ordered from the msb to the lsbAV_PIX_FMT_MONOBLACK, ///<        Y        ,  1bpp, 0 is black, 1 is white, in each byte pixels are ordered from the msb to the lsbAV_PIX_FMT_PAL8,      ///< 8 bits with AV_PIX_FMT_RGB32 palette// ...

2.5 const AVClass *priv_class

结构体的定义位于libavutil\log.h

/*** Describe the class of an AVClass context structure. That is an* arbitrary struct of which the first field is a pointer to an* AVClass struct (e.g. AVCodecContext, AVFormatContext etc.).*/
// 描述AVClass上下文结构的类。这是一个任意结构体,
// 其第一个字段是指向AVClass结构体的指针(例如AVCodecContext, AVFormatContext等)
typedef struct AVClass {/*** The name of the class; usually it is the same name as the* context structure type to which the AVClass is associated.*/// 类的名称;通常它与AVClass所关联的上下文结构类型相同const char* class_name;/*** A pointer to a function which returns the name of a context* instance ctx associated with the class.*/// 指向一个函数的指针,该函数返回与类关联的上下文实例ctx的名称const char* (*item_name)(void* ctx);/*** a pointer to the first option specified in the class if any or NULL** @see av_set_default_options()*/// 指向类中指定的第一个选项的指针(如果有的话)或NULLconst struct AVOption *option;/*** LIBAVUTIL_VERSION with which this structure was created.* This is used to allow fields to be added without requiring major* version bumps everywhere.*/// LIBAVUTIL_VERSION,用来创建这个结构// 这是为了允许添加字段,而不需要到处出现重大版本颠簸。int version;/*** Offset in the structure where log_level_offset is stored.* 0 means there is no such variable*/// 存储log_level_offset的结构中的偏移量// 0表示没有这样的变量int log_level_offset_offset;/*** Offset in the structure where a pointer to the parent context for* logging is stored. For example a decoder could pass its AVCodecContext* to eval as such a parent context, which an av_log() implementation* could then leverage to display the parent context.* The offset can be NULL.*/// 结构中的偏移量,其中存储指向用于日志记录的父上下文的指针// 例如,解码器可以将其AVCodecContext作为父上下文传递给eval,然后av_log()实现可以利用它来显示父上下文// 偏移量可以为NULLint parent_log_context_offset;/*** Category used for visualization (like color)* This is only set if the category is equal for all objects using this class.* available since version (51 << 16 | 56 << 8 | 100)*/// 用于可视化的类别(如颜色)// 只有当使用该类的所有对象的类别相等时,才会设置此属性。版本(51 << 16 | 56 << 8 | 100)AVClassCategory category;/*** Callback to return the category.* available since version (51 << 16 | 59 << 8 | 100)*/// 回调返回类别。版本(51 << 16 | 59 << 8 | 100)AVClassCategory (*get_category)(void* ctx);/*** Callback to return the supported/allowed ranges.* available since version (52.12)*/// 回调返回支持/允许的范围。从版本(52.12)开始可用int (*query_ranges)(struct AVOptionRanges **, void *obj, const char *key, int flags);/*** Return next AVOptions-enabled child or NULL*/// 返回下一个启用avoptions的子节点或NULLvoid* (*child_next)(void *obj, void *prev);/*** Iterate over the AVClasses corresponding to potential AVOptions-enabled* children.** @param iter pointer to opaque iteration state. The caller must initialize*             *iter to NULL before the first call.* @return AVClass for the next AVOptions-enabled child or NULL if there are*         no more such children.** @note The difference between child_next and this is that child_next*       iterates over _already existing_ objects, while child_class_iterate*       iterates over _all possible_ children.*/// 迭代AVClasses对应于潜在的avoptions启用子类// @param Iter指针指向不透明的迭代状态。调用者必须在第一次调用之前将*iter初始化为NULL// @return AVClass用于下一个AVOptions-enabled的子节点,如果没有这样的子节点,则为NULL// @note child_next和this的区别在于,child_next迭代的是已经存在的对象,而child_class_iterate迭代的是所有可能的子对象const struct AVClass* (*child_class_iterate)(void **iter);
} AVClass;

2.6 const AVProfile *profiles

profile表示了视频编码的复杂度与压缩效率的等级,例如Baseline、Main Profile、High Profile等,不同的profile会使用不同的编码工具

/*** AVProfile.*/
typedef struct AVProfile {// profile levelint profile;// profile nameconst char *name; ///< short name for the profile
} AVProfile;

CSDN : https://blog.csdn.net/weixin_42877471
Github : https://github.com/DoFulangChen

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/29998.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[240619] 2024年 curl 用户调研和分析 | 英伟达成为全球市值第一的公司

目录 2024年 curl 用户调研和分析调研说明调研概述调查数据结果 英伟达成为市值第一的公司 2024年 curl 用户调研和分析 调研说明 关于 curl : curl 是一个成熟的开源项目&#xff0c;提供 curl 工具和 libcurl 库。是世界上使用最广泛的命令行软件之一。调查背景 : 本次为11…

天翼云8080、80端口用不了的问题

天翼云8080、80端口用不了的问题 前言&#xff1a;前段时间天翼云搞了活动&#xff0c;原来公司用的华为云老板说太贵了也快到期了&#xff0c;就换了天翼云的服务器。 排查&#xff1a; 安全组开放 80 8080 防火墙查看 没有问题 nginx nacos dcoker等停了 查看监听端口 发现…

YOLOv10改进 | 注意力篇 | YOLOv10引入HAttention(HAT)注意力

1. HAT介绍 1.1 摘要:基于 Transformer 的方法在低级视觉任务(例如图像超分辨率)中表现出了令人印象深刻的性能。 然而,我们发现这些网络通过归因分析只能利用有限的输入信息空间范围。 这意味着 Transformer 的潜力在现有网络中仍未得到充分发挥。 为了激活更多的输入像素…

国际现货黄金的交易方式:二次入场机会识别

近期受地缘局势以及通胀因素的影响&#xff0c;国际现货黄金投资又重新受到市场的青睐。虽然近期金价出现大跌&#xff0c;但投资者反而认为这是低价买金的好机会。为了方便投资者做出决策&#xff0c;下面我们就介绍一些国际现货黄金的交易方式——二次入场点进场。 在国际现货…

探索高效和轻量级多模态大语言模型的奥秘

过去一年&#xff0c;多模态大语言模型(MLLM)在视觉问答、视觉理解和推理等任务中表现出色。然而&#xff0c;模型的庞大尺寸和训练推理的高成本限制了其在学术界和工业界的广泛应用。因此&#xff0c;研究高效和轻量级的MLLM具有重要意义&#xff0c;尤其是在边缘计算场景中。…

Graphviz——实现动态更新协议状态机

1、描述 为了实现动态更新协议状态机&#xff0c;首先需要定义类来表示协议状态机。初始化该类后&#xff0c;保存状态机对象。在后续更新过程中&#xff0c;就可以加载保存的状态机对象&#xff0c;添加新的状态或事件。Graphviz的安装过程参考&#xff1a;Graphviz——安装、…

ECharts 雷达图案例002 - 诈骗性质分析

ECharts 雷达图案例002 - 诈骗性质分析 &#x1f4ca; ECharts 雷达图案例002 - 诈骗性质分析 深入挖掘数据背后的故事&#xff0c;用可视化手段揭示诈骗行为的模式和趋势。 &#x1f50d; 案例亮点 创新的数据展示方式&#xff0c;让复杂的诈骗数据一目了然。定制化的雷达图…

一文带你入门【论文排版】利器·LaTeX |Macos

小罗碎碎念 我在刚开始写公众号的时候&#xff0c;写过一期推文&#xff0c;详细的讲解过如何使用LaTeX快速的进行论文排版。不过当时用的是windows的系统&#xff0c;这一次把Mac端的教程补上。 windows系统教程 https://zhuanlan.zhihu.com/p/677481269 LaTeX是一种流行的排…

「AIGC」 华为CodeArts Snap详解

华为的 CodeArts Snap 是一款集成了人工智能技术的编程辅助工具,旨在帮助开发者提高编码效率和代码质量。以下是对 CodeArts Snap 技术详解,以及一个简单的代码案例,帮助初学者更好地理解其功能。 技术详解 CodeArts Snap 主要功能包括: 代码生成:根据开发者的自然语言描…

Python10 python多线程

1.什么是python多线程 Python的多线程指的是在一个Python程序中同时运行多个线程&#xff0c;以达到并发执行多个任务的目的。线程是操作系统能够进行运算调度的最小单位&#xff0c;它被包含在进程之中&#xff0c;是进程中的实际运作单位。 在Python中&#xff0c;多线程的…

将xlsx电子表格中所有sheet合并在一起

import pandas as pd # 打开xlsx文件 xlsx pd.ExcelFile(path_to_your_file.xlsx) # 读取所有sheets到一个list中 sheets [] for sheet in xlsx.sheet_names: sheets.append(xlsx.parse(sheet)) # 合并所有sheets combined pd.concat(sheets) # 将合并后的数据写入新…

昇思25天学习打卡营第1天 | 快速入门

内容介绍&#xff1a;通过MindSpore的API来快速实现一个简单的深度学习模型。 具体内容&#xff1a; 1. 导包 import mindspore from mindspore import nn from mindspore.dataset import vision, transforms from mindspore.dataset import MnistDataset 2. 处理数据 fro…

如何快速使用向量检索服务DashVector?

免费体验阿里云高性能向量检索服务&#xff1a;https://www.aliyun.com/product/ai/dashvector 本文将介绍如何快速上手使用向量检索服务DashVector。 前提条件 已创建Cluster&#xff1a;创建Cluster。 已获得API-KEY&#xff1a;API-KEY管理。 已安装最新版SDK&#xff1a…

【网络安全学习】漏洞扫描:-01- 漏洞数据库searchsploit的使用

漏洞数据库是收集和存储各种软件漏洞信息的资源库。 漏洞数据库通常包含漏洞的名称、编号、描述、影响范围、危害等级、解决方案等信息&#xff0c;有些还提供漏洞的分析报告、演示视频、利用代码等内容。 1.常用的在线漏洞库&#xff1a; 国家信息安全漏洞共享平台 https:/…

Spring Cloud Bus——进阶配置与事件传播

Spring Cloud 常用组件&#xff08;下&#xff09;——Spring Cloud Bus 进阶配置与事件传播 在上篇文章中&#xff0c;我们介绍了 Spring Cloud Bus 的基本概念和配置方法。在这篇文章中&#xff0c;我们将进一步探讨 Spring Cloud Bus 的进阶配置和高级功能&#xff0c;包括…

Unity 天空盒制作使用教程

文章目录 1.概念2.制作天空盒3.使用天空盒3.1 为场景添加3.2 为相机添加 1.概念 天空盒是包裹整个场景的环境效果。 2.制作天空盒 1、创建材质球。 2、设置材质球Shader为SkyBox/6 Sided&#xff0c;将六张贴图放到对应位置。 3.使用天空盒 3.1 为场景添加 方法一、直接…

大学生课堂笔记

微信小程序是一种通过微信平台进行开发和发布的轻量级应用程序&#xff0c;用户无需下载安装即可快速使用。自定义事件是微信小程序开发中非常重要的一部分&#xff0c;它可以让开发者根据自己的需求&#xff0c;定义和触发各种事件&#xff0c;实现更加灵活和定制化的功能。 …

STM32F103ZET6_移植uC/OS_HAL

1下载源码 网址 GitHub - weston-embedded/uC-OS2: C/OS-II is a preemptive, highly portable, and scalable real-time kernels. Designed for ease of use on a huge number of CPU architectures. 需要下载三个文件 1看你使用是ucos2还是3&#xff08;第一个文件&#…

Linux中常用的压缩与解压文件

天行健&#xff0c;君子以自强不息&#xff1b;地势坤&#xff0c;君子以厚德载物。 每个人都有惰性&#xff0c;但不断学习是好好生活的根本&#xff0c;共勉&#xff01; 文章均为学习整理笔记&#xff0c;分享记录为主&#xff0c;如有错误请指正&#xff0c;共同学习进步。…

力扣第206题“反转链表”

在本篇文章中&#xff0c;我们将详细解读力扣第206题“反转链表”。通过学习本篇文章&#xff0c;读者将掌握如何使用迭代和递归的方法来解决这一问题&#xff0c;并了解相关的复杂度分析和模拟面试问答。每种方法都将配以详细的解释&#xff0c;以便于理解。 问题描述 力扣第…