音视频 五 看书的笔记 MediaCodec

MediaCodec

用于访问底层媒体编解码器框架,编解码组件。通常与MediaExtractor(解封装,例如Mp4文件分解成 video和audio)、MediaSync、MediaMuxer(封装 例如音视频合成Mp4文件)、MediaCrypto、Image(cameraX 回调的ImageReader对象可以获取到Image帧图像,可转换成YUV420数组,传递给编码器编码),Surface(camera的预览回调)、Audio一起使用。
在这里插入图片描述

创建MediaCodec

    public static MediaCodec createEncoderByType(@NonNull String type)  //创建编码器public static MediaCodec createDecoderByType(@NonNull String type) //创建解码器

一般type是:

  • h264 MediaFormat.MIMETYPE_VIDEO_AVC(video/avc)
  • h265 MediaFormat.MIMETYPE_VIDEO_HEVC(video/hevc)
   public static MediaCodec createByCodecName(@NonNull String name) //通过名称创建

一般name是:

  • OMX.google.h264.encoder 软编码
  • OMX.google.h264.decoder 软解码
  • OMX.MTK.VIDEO.DECODER.AVC 硬解码

  • 以下代码可以检测是否支持某编解码
MediaCodecList codecList = new MediaCodecList(MediaCodecList.ALL_CODECS);
for (MediaCodecInfo codecInfo : codecList.getCodecInfos()) {if (codecInfo.isEncoder()) {continue; // 只检查解码器}String[] types = codecInfo.getSupportedTypes();for (String type : types) {if (type.equalsIgnoreCase("video/hevc")) {Log.d("MediaCodec", "Device supports H265 decoding");return; // 找到支持的解码器,可以退出}}
}
Log.d("MediaCodec", "Device does not support H265 decoding");

工作方式

以以下代码为例

// 假设你已经有了ByteBuffer data和BufferInfo info
codec.queueInputBuffer(inputBufferIndex, 0, data.limit(), presentationTimeUs, 0);
MediaCodec.BufferInfo bufferInfo = new MediaCodec.BufferInfo();
int outputBufferIndex = codec.dequeueOutputBuffer(bufferInfo, 10000);
while (outputBufferIndex >= 0) {// 处理输出帧,例如绘制到Surface或保存到文件等codec.releaseOutputBuffer(outputBufferIndex, true); // true表示将输出帧渲染到Surface中(如果有的话)outputBufferIndex = codec.dequeueOutputBuffer(bufferInfo, 0); // 再次尝试获取下一个输出帧
}
  • queueInputBuffer 处理输入数据(如:camera/cameraX回调的视频帧数据)
  • dequeueOutputBuffer 输出数据 编码后的数据(如:使用H264编码则 可直接将数据保存为H264文件)
    分析:
  • MediaCodeC使用一组输入和输出Buffer队列。
  • 数据填入设定的空输入缓冲区 ( inputBuffers = mediaCodec.getInputBuffers();),填满数据后传递给MediaCodec进行编解码
  • 编解码后数据填充到一个输出Buffer中。

状态

  • MediaCodec 有三种状态 Stopped Executing Released
    – Stopped 包括 三种状态 Uninitialized Configured Error
    – Executing 包括三种状态 Flushed Running End-of-Stream

状态

  • 通过以上create工厂方法创建一个MediaCodec ,MediaCodec 处于未初始化状态
  • 需要通过MediaCodec对象的configure方法配置,配置后 处于配置状态
String mimeType = "video/hevc"; // H265 MIME类型
MediaCodec codec = MediaCodec.createDecoderByType(mimeType);
MediaFormat format = MediaFormat.createVideoFormat(mimeType, width, height);
format.setInteger(MediaFormat.KEY_COLOR_FORMAT, MediaCodecInfo.CodecCapabilities.COLOR_FormatSurface); // 使用Surface作为输出类型,如果是预览或显示使用
format.setInteger(MediaFormat.KEY_BIT_RATE, bitRate); // 设置比特率,如果需要的话
format.setInteger(MediaFormat.KEY_FRAME_RATE, frameRate); // 设置帧率,如果需要的话
format.setInteger(MediaFormat.KEY_I_FRAME_INTERVAL, 1); // 设置I帧间隔,通常设置为1或2codec.configure(format, null, null, 0); // 使用null作为输出Surface,因为我们不直接处理输出数据
codec.start();
  • 调用start之后 处于 Executing状态
  • 调用start后,MediaCodec 会立刻刷新子状态(Flushed ) 并拥有所有的Buffer
  • 第一个输入Buffer从队列中移除 MediaCodec 会花较长时间转换为 正在运行的子状态 (Running )
  • 当队列输入Buffer携带End-of-Stream标记 则转换为 End-of-Stream子状态 这种状态MediaCodec不再接收输入Buffer,但是仍然会产生输出Buffer
  • Executing状态下,调用flush函数可以回到 Flushed子状态
  • 调用stop,MediaCodec 处于Uninitialized 状态 等待再次配置和使用
  • 再次创建MediaCodec 时,上个MediaCodec 对象必须调用release函数
  • 极少数情况会出现Error状态,此时需要调用reset函数让MediaCodec 再次可用

MediaCodec 从创建到start的过程

  • 需要经历JNI
  • 与MediaPlayer有很多相似的地方
  • 我帮大家看了 想看的花去点这里

就是MediaCodec 会对应到 c++层的JMediaCodec方法
release -> native_release
reset -> native_reset
setup -> native_setup
finalize -> native_finalize
config -> native_configure

  • setup -> 调用 JMediaCodec 构造方法创建JMediaCodec
  • JMediaCodec的构造方法 -> createByType/CreateByComponentName 创建JMediaCodec
  • 接着java 调用config -> native_configure
  • native_configure -> 获取前边创建的JMediaCodec 对象 调用其configure方法 构建编解码器
  • java 层调用 start -> 最终使用的还是JMediaCodec 对象 的 start方法 会直行ACodec.cpp 的start 函数

MediaCodec 到OMX过程

OpenMAX Integration Layer(OMX IL,集成层)是由Khronos Group开发的一套低层级标准接口,旨在为编解码器提供一定程度的抽象,使得嵌入式或移动设备能够统一调用音频、视频和图像编解码器,从而实现编解码器实现代码和调用代码的跨平台性。
OMX IL API由两大主要部分组成,分别是Core API和Component API。
OMX IL Component:在OMX IL中组件表示独立的功能模块,组件可能是source(源)、sinks(接收器)、codecs(编解码器)、filters(过滤器)或任何其他数据处理模块,组件需要依据Component API来实现。与组件之间的数据通信是通过称为端口的接口进行的,用户可以通过输入端口向组件发送数据,也可以通过输出端口接收数据。
OMX IL Core:Core API主要用于动态加载卸载组件,调用组件方法;
将OMX IL API封装并向上层提供高层级接口的部分被称为IL Client(客户端),IL Client使用OMX Core来加载组件,卸载组件,调用组件的方法。

  • MediaCodec::init 函数
    – 创建Acodec Acodec继承AHander(消息机制有了)
    – 初始化ALooper AMessage
    – 发送kWhatInit消息
    – ACodec收到消息 调用initiateAllocateComponent(format)函数
    – 发送kWhatAllocateComponent消息
  • 消息中心收到消息 调用onAllocateComponent回调函数
    – 通过ACodec::AllocateComponent函数判断OMXClient和Server是否正常建立连接
    – 通过IOMX进行IPC通信
    – 调用omx->allocateNode分配Node节点
  • onConfigureComponent 函数
    – 调用ACodec的configCodec函数 构建编解码器

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/75686.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

李宏毅NLP-3-语音识别part2-LAS

语音识别part2——LAS Listen Listen主要功能是提取内容信息,去除说话人差异和噪声 。编码器(Encoder)结构,输入是声学特征,经过 Encoder 处理后,输出为高级表示,这些高级表示可用于后续语音识别…

开源CMS的模块化设计和API接口如何具体影响其扩展性?

优秀的CMS系统都有自己主打的特点,开源CMS凭借其灵活性和低成本优势占据了市场主流地位,而模块化设计与API接口正是其扩展性的两大基石。本文将深入探讨这两大技术特性是如何影响cms的扩展性的。 一、模块化设计:功能解耦与生态繁荣的引擎 …

一文读懂WPF系列之常用控件以及样式

WPF控件 控件分类概览常用控件常用控件代码示例和效果 样式与模板应用样式定义​​方式行内样式​​页面/窗口级资源样式(Local Resource)应用程序全局资源独立资源字典(ResourceDictionary)控件模板(ControlTemplate&…

AndroidTV D贝桌面-v3.2.5-[支持文件传输]

AndroidTV D贝桌面 链接:https://pan.xunlei.com/s/VONXSBtgn8S_BsZxzjH_mHlAA1?pwdzet2# AndroidTV D贝桌面-v3.2.5[支持文件传输] 第一次使用的话,壁纸默认去掉的,不需要按遥控器上键,自己更换壁纸即可

XDocument和XmlDocument的区别及用法

因为这几天用到了不熟悉的xml统计数据,啃了网上的资料解决了问题,故总结下xml知识。 1.什么是XML?2.XDocument和XmlDocument的区别3.XDocument示例1示例2:示例3: 4.XmlDocument5.LINQ to XML6.XML序列化(Serialize)与反序列化(De…

从竞速到巡检:不同无人机如何匹配最佳PCB方案?

随着无人机技术的快速发展,高性能PCB(印刷电路板)成为无人机制造商的核心需求之一。无论是消费级无人机还是工业级应用,PCB的质量直接影响飞行控制、信号传输和整机稳定性。那么,无人机制造商在选型高端PCB时&#xff…

高支模自动化监测解决方案

1.行业现状 高大模板支撑系统在浇筑施工过程中,诸多重大安全风险点进行实时自动化安全监测的解决方案主要监测由于顶杆失稳、扣件失效、承压过大等引起的支撑轴力、模板沉降、相对位移、支撑体系倾斜等参数变化。系统采用无线自动组网、高频连续采样,实时…

python【标准库】multiprocessing

文章目录 介绍多进程Process 创建子进程共享内存数据多进程通信Pool创建子进程多进程案例多进程注意事项介绍 python3.10.17版本multiprocessing 是一个多进程标准模块,使用类似于threading模块的API创建子进程,充分利用多核CPU来并行处理任务。提供本地、远程的并发,高效避…

UniApp基于xe-upload实现文件上传组件

xe-upload地址:文件选择、文件上传组件(图片,视频,文件等) - DCloud 插件市场 致敬开发者!!! 感觉好用的话,给xe-upload的作者一个好评 背景:开发中经常会有…

STM32 HAL库之GPIO示例代码

LED灯不断闪烁 GPIO初始化,main文件中的 MX_GPIO_Init(); 也就是在 gpio.c文件中 void MX_GPIO_Init(void) {GPIO_InitTypeDef GPIO_InitStruct {0};/* GPIO Ports Clock Enable */__HAL_RCC_GPIOE_CLK_ENABLE();__HAL_RCC_GPIOC_CLK_ENABLE();__HAL_RCC_GPIOA_C…

二维数点 系列 题解

1.AT_dp_w Intervals 我的博客 2.CF377D Developing Games 我的博客 这两道题是比较经典的线段树区间 trick,希望自己可以在以后的比赛中手切。 3.洛谷 P10814 离线二维数点 题意 给你一个长为 n n n 的序列 a a a,有 m m m 次询问&#xff0c…

vulkanscenegraph显示倾斜模型(5.9)-vsg中vulkan资源的编译

前言 上一章深入剖析了GPU资源内存及其管理,vsg中为了提高设备内存的利用率,同时减少内存(GPU)碎片,采用GPU资源内存池机制(vsg::MemoryBufferPools)管理逻辑缓存(VkBuffer)与物理内存(VkDeviceMemory)。本章将深入vsg中vulkan资源的编译(包含…

探秘 Python 网络编程:构建简单聊天服务器

在计算机网络的世界里,网络编程是实现不同设备之间通信的关键技术。Python 凭借其简洁的语法和强大的库支持,在网络编程领域有着广泛的应用。无论是构建简单的聊天服务器,还是开发复杂的网络应用,Python 都能轻松胜任。 1 理论基础…

Go语言Slice切片底层

Go语言(Golang)中切片(slice)的相关知识、包括切片与数组的关系、底层结构、扩容机制、以及切片在函数传递、截取、增删元素、拷贝等操作中的特性。并给出了相关代码示例和一道面试题。关键要点包括: 数组特性&#xf…

vue3 ts 自定义指令 app.directive

在 Vue 3 中,app.directive 是一个全局 API,用于注册或获取全局自定义指令。以下是关于 app.directive 的详细说明和使用方法 app.directive 用于定义全局指令,这些指令可以用于直接操作 DOM 元素。自定义指令在 Vue 3 中非常强大&#xff0…

基于python的机器学习(五)—— 聚类(二)

一、k-medoids聚类算法 k-medoids是一种聚类算法,它是基于k-means聚类算法的一种改进。k-medoids算法也是一种迭代算法,但是它将中心点限定为数据集中的实际样本点,而不是任意的点。 具体来说,k-medoids算法从数据集中选择k个初…

解释:指数加权移动平均(EWMA)

指数加权移动平均(EWMA, Exponential Weighted Moving Average) 是一种常用于时间序列平滑、异常检测、过程控制等领域的统计方法。相比普通移动平均,它对最近的数据赋予更高权重,对旧数据逐渐“淡化”。 ✅ 一、通俗理解 想象你…

Spring Boot 项目基于责任链模式实现复杂接口的解耦和动态编排!

全文目录: 开篇语前言一、责任链模式概述责任链模式的组成部分: 二、责任链模式的核心优势三、使用责任链模式解耦复杂接口1. 定义 Handler 接口2. 实现具体的 Handler3. 创建订单对象4. 在 Spring Boot 中使用责任链模式5. 配置责任链6. 客户端调用 四、…

COMSOL仿真遇到的两个小问题

最近跑热仿真的时候跑出了两个问题,上网查发现也没什么解决方式,最后自己误打误撞的摸索着解决了,在这里分享一下。 问题一 我当时一准备跑仿真就弹出了这个东西,但在此之前从未遇到 然后我试着在它说的路径中建立recoveries文件…

如何在英文学术写作中正确使用标点符号?

标点符号看似微不足道,但它们是书面语言的无名英雄。就像熟练的指挥家指挥管弦乐队一样,标点符号可以确保您的写作流畅、传达正确的含义并引起读者的共鸣。正如放错位置的音符会在音乐中造成不和谐一样,放错位置的逗号或缺少分号也会使您的写…