HarmonyOS 音视频开发概述

在音视频开发指导中,将介绍各种涉及音频、视频播放或录制功能场景的开发方式,指导开发者如何使用系统提供的音视频 API 实现对应功能。比如使用 TonePlayer 实现简单的提示音,当设备接收到新消息时,会发出短促的“滴滴”声;使用 AVPlayer 实现音乐播放器,循环播放一首音乐。

在每个功能中,会介绍多种实现方式以应对不同的使用场景,以及该场景相关的子功能点。比如在音频播放功能内,会同时介绍音频的并发策略、音量管理和输出设备等在操作系统中的处理方式,帮助开发者能够开发出功能覆盖更全面的应用。

本开发指导仅针对音视频播放或录制本身,由@ohos.multimedia.audio(下文简称 audio 模块)和@ohos.multimedia.media(下文简称 media 模块)提供相关能力,不涉及 UI 界面、图形处理、媒体存储或其他相关领域功能。

开发说明

在开发音频功能之前,尤其是要实现处理音频数据的功能前,建议开发者先了解声学相关的知识,帮助理解操作系统提供的 API 是如何控制音频系统,从而开发出更易用、体验更好的音视频类应用。建议了解的相关概念包括但不限于:

● 音频量化的过程:采样 > 量化 > 编码

● 音频量化过程的相关概念:模拟信号和数字信号、采样率、声道、采样格式、位宽、码率、常见编码格式(如 AAC、MP3、PCM、WMA 等)、常见封装格式(如 WAV、MPA、FLAC、AAC、OGG 等)

在开发音乐、视频播放功能之前,建议了解流媒体播放的相关概念包括但不限于:

● 播放过程:网络协议 > 容器格式 > 音视频编解码 > 图形/音频渲染

● 网络协议:比如 HLS、HTTP/HTTPS;容器格式:比如 mp4,mkv,mpeg-ts,webm。

● 编码格式:比如 h263/h264/h265,MPEG4/MPEG2。

音频流介绍

在开发音频应用之前,还需要了解什么是音频流,它是 HarmonyOS 音频系统中的关键概念,在之后的章节中会多次提及。

音频流,是音频系统中对一个具备音频格式和音频使用场景信息的独立音频数据处理单元的定义,可以表示播放,也可以表示录制,并且具备独立音量调节和音频设备路由切换能力。

音频流基础信息通过AudioStreamInfo表示,包含采样、声道、位宽、编码信息,是创建音频播放或录制流的必要参数,描述了音频数据的基本属性。在配置时开发者需要保证基础信息与传输的音频数据是相匹配的,音频系统才能正确处理数据。

音频流使用场景信息

除了基本属性,音频流还需要具备使用场景信息。基础信息只能对音频数据进行描述,但在实际的使用过程中,不同的音频流,在音量大小,设备路由,并发策略上是有区别的。系统就是通过音频流所附带的使用场景信息,为不同的音频流制定合适的处理策略,以达到最佳的音频用户体验。

● 播放场景音频播放场景的信息,通过StreamUsage和ContentType进行描述。

StreamUsage 指音频流本身的用途类型,包括媒体、语音通信、语音播报、通知、铃声等。

ContentType 指音频流中数据的内容类型,包括语音、音乐、影视、通知、铃声等。

● 录制场景音频流录制场景的信息,通过SourceType进行描述。

SourceType 指音频流中录音源的类型,包括麦克风音频源、语音识别音频源、语音通话音频源等。

支持的音频格式

audio 模块下的接口支持 PCM 编码,包括 AudioRenderer、AudioCapturer、TonePlayer、OpenSL ES 等。

音频格式说明:

● 支持的常用的音频采样率(Hz):8000、11025、12000、16000、22050、24000、32000、44100、48000、64000、96000,具体参考枚举AudioSamplingRate。不同设备支持的采样率规格会存在差异。

● 支持单声道、双声道,具体参考AudioChannel。

● 支持的采样格式:U8(无符号 8 位整数)、S16LE(带符号的 16 位整数,小尾数)、S24LE(带符号的 24 位整数,小尾数)、S32LE(带符号的 32 位整数,小尾数)、F32LE(带符号的 32 位浮点数,小尾数),具体参考AudioSampleFormat。由于系统限制,S24LE、S32LE、F32LE 仅部分设备支持,请根据实际情况使用。

小尾数指的是小端模式,即数据的高字节保存在内存的高地址中,而数据的低字节保存在内存的低地址中。这种存储模式将地址的高低和数据的位权有效结合起来,高地址部分权值高,低地址部分权值低。

media 模块下的接口支持的音视频格式将在AVPlayer和AVRecorder的介绍中承载。

media 模块提供了AVPlayer和AVRecorder用于播放、录制音视频。

AVPlayer

AVPlayer 主要工作是将 Audio/Video 媒体资源(比如 mp4/mp3/mkv/mpeg-ts 等)转码为可供渲染的图像和可听见的音频模拟信号,并通过输出设备进行播放。

AVPlayer 提供功能完善一体化播放能力,应用只需要提供流媒体来源,不负责数据解析和解码就可达成播放效果。

音频播放

当使用 AVPlayer 开发音乐应用播放音频时,其交互关系如图所示。

图 1 音频播放外部模块交互图

音乐类应用通过调用 JS 接口层提供的 AVPlayer 接口实现相应功能时,框架层会通过播放服务(Player Framework)将资源解析成音频数据流(PCM),音频数据流经过软件解码后输出至音频服务(Audio Framework),由音频服务输出至音频驱动渲染,实现音频播放功能。完整的音频播放需要应用、Player Framework、Audio Framework、音频 HDI 共同实现。

图 1 中,数字标注表示需要数据与外部模块的传递。

1.  音乐应用将媒体资源传递给 AVPlayer 接口。

2.  Player Framework 将音频 PCM 数据流输出给 Audio Framework,再由 Audio Framework 输出给音频 HDI。

视频播放

当使用 AVPlayer 开发视频应用播放视频时,其交互关系如图所示。

图 2 视频播放外部模块交互图

应用通过调用 JS 接口层提供的 AVPlayer 接口实现相应功能时,框架层会通过播放服务(Player Framework)解析成单独的音频数据流和视频数据流,音频数据流经过软件解码后输出至音频服务(Audio Framework),再至硬件接口层的音频 HDI,实现音频播放功能。视频数据流经过硬件(推荐)/软件解码后输出至图形渲染服务(Graphic Framework),再输出至硬件接口层的显示 HDI,完成图形渲染。

完整的视频播放需要:应用、XComponent、Player Framework、Graphic Framework、Audio Framework、显示 HDI 和音频 HDI 共同实现。

图 2 中,数字标注表示需要数据与外部模块的传递。

1.  应用从 XComponent 组件获取窗口 SurfaceID,获取方式参考XComponent。

2.  应用把媒体资源、SurfaceID 传递给 AVPlayer 接口。

3.  Player Framework 把视频 ES 数据流输出给解码 HDI,解码获得视频帧(NV12/NV21/RGBA)。

4.  Player Framework 把音频 PCM 数据流输出给 Audio Framework,Audio Framework 输出给音频 HDI。

5.  Player Framework 把视频帧(NV12/NV21/RGBA)输出给 Graphic Framework,Graphic Framework 输出给显示 HDI。

支持的格式与协议

推荐使用以下主流的播放格式,音视频容器、音视频编码属于内容创作者所掌握的专业领域,不建议应用开发者自制码流进行测试,以免产生无法播放、卡顿、花屏等兼容性问题。若发生此类问题不会影响系统,退出播放即可。

支持的协议如下:

支持的音频播放格式如下:

说明

视频播放支持的视频格式分为必选规格和可选规格。必选规格为所有设备均支持的视频格式。对于可选规格,不同设备的实际实现不同。建议开发者做对应的兼容处理,保证应用功能全平台兼容。

支持的视频播放格式和主流分辨率如下:

AVRecorder

AVRecorder 主要工作是捕获音频信号,接收视频信号,完成音视频编码并保存到文件中,帮助开发者轻松实现音视频录制功能,包括开始录制、暂停录制、恢复录制、停止录制、释放资源等功能控制。它允许调用者指定录制的编码格式、封装格式、文件路径等参数。

● 图 3 视频录制外部模块交互图

音频录制:应用通过调用 JS 接口层提供的 AVRecorder 接口实现音频录制时,框架层会通过录制服务(Player Framework),调用音频服务(Audio Framework)通过音频 HDI 捕获音频数据,通过软件编码封装后保存至文件中,实现音频录制功能。

● 视频录制:应用通过调用 JS 接口层提供的 AVRecorder 接口实现视频录制时,先通过 Camera 接口调用相机服务(Camera Framework)通过视频 HDI 捕获图像数据送至框架层的录制服务,录制服务将图像数据通过视频编码 HDI 编码,再将编码后的图像数据封装至文件中,实现视频录制功能。

说明

AVRecorder 只负责视频数据的处理,需要与视频数据采集模块配合才能完成视频录制。视频数据采集模块需要通过 Surface 将视频数据传递给 AVRecorder 进行数据处理。

当前常用的数据采集模块为相机模块,相关说明以相机举例,相机模块目前仅对系统应用开放。

通过音视频录制组合,可分别实现纯音频录制、纯视频录制,音视频录制。

图 3 中,数字标注表示需要数据与外部模块的传递。

1.  应用通过 AVRecorder 接口从录制服务获取 SurfaceID。

2.  应用将 SurfaceID 设置给相机服务,相机服务可以通过 SurfaceID 获取到 Surface。相机服务通过视频 HDI 捕获图像数据送至框架层的录制服务。

3.  相机服务通过 Surface 将视频数据传递给录制服务。

4.  录制服务通过视频编码 HDI 模块将视频数据编码。

5.  录制服务将音频参数设置给音频服务,并从音频服务获取到音频数据。

支持的格式

支持的音频源如下:

支持的视频源如下:

支持的音视频编码格式如下:

支持的输出文件格式如下:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/112183.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

零基础新手也能会的H5邀请函制作教程

随着科技的的发展,H5邀请函已经成为了各种活动、婚礼、会议等场合的常见邀约方式。它们不仅可以提供动态、互动的体验,还能让邀请内容更加丰富多彩。下面,我们将通过乔拓云平台,带领大家一步步完成H5邀请函的制作。 1. 选择可靠的…

Leetcode 21 合并两个有序链表 (链表)

Leetcode 21 合并两个有序链表 (链表) 解法1 复杂的第一版本(优化大于和等于合并见方法二)解法2 注意注意:先添加元素toadd.next list1,添加之后才可以移动指针toadd toadd.next 解法1 复杂的第一版本&a…

【Java 进阶篇】深入了解 Bootstrap 按钮和图标

按钮和图标在网页设计中扮演着重要的角色,它们是用户与网站或应用程序交互的关键元素之一。Bootstrap 是一个流行的前端框架,提供了丰富的按钮样式和图标库,使开发者能够轻松创建吸引人的界面。在本文中,我们将深入探讨 Bootstrap…

【Python生活脚本】视频转Gif动图

忘记过去,超越自己 ❤️ 博客主页 单片机菜鸟哥,一个野生非专业硬件IOT爱好者 ❤️❤️ 本篇创建记录 2023-10-20 ❤️❤️ 本篇更新记录 2023-10-20 ❤️🎉 欢迎关注 🔎点赞 👍收藏 ⭐️留言📝&#x1f64…

pytorch nn.Embedding 读取gensim训练好的词/字向量(有例子)

最近在跑深度学习模型,发现Embedding随机性太强导致模型结果有出入,因此考虑固定初始随机向量,既提前训练好词/字向量,不多说上代码!! 1、利用gensim训练字向量(词向量自行修改) #…

谷歌云:下一代开发者和企业解决方案的强力竞争者

自从2018年Oracle前研发总裁Thomas Kurian加入谷歌云(Google Cloud)并出任谷歌云CEO以来,业界对于谷歌云的发展就十分好奇。而谷歌云的前任CEO Diane Greene曾是VMware的创始人之一,那么两任企业级技术和解决方案出身的CEO&#x…

windows上下载github上的linux内核项目遇到的问题

问题一:clone的时候报错 Cloning into G:\github\linux... POST git-upload-pack (gzip 27925 to 14032 bytes) remote: Counting objects: 6012062, done. remote: Compressing objects: 100% (1031/1031), done. remote: Total 6012062 (delta 893), reused 342 (…

计算机缺失d3dcompiler_47.dll解决方案,如何修复电脑缺失d3d文件

在计算机系统中,DLL文件(动态链接库)是一种重要的共享库,它包含了可被多个程序使用的代码和数据。然而,当某些DLL文件丢失或损坏时,可能会导致程序无法正常运行。本文将介绍四种解决D3DCompiler_47.dll缺失…

QT学习day4

作业:做一个闹钟 #include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this);//给定时器指针实例化一个对象timer new QTimer(this);//给语音播报者实例化一个…

总结一下vue中v-bind的常见用法

文章目录 🐕前言:🏨简述一下v-bind命令其它写法 🐕前言: 本篇博客主要总结一下v-bind命令在vue中的常见用法 🏨简述一下v-bind命令 v-bind命令是将动态的数据属性与咱们的标签进行一个绑定,它可以绑定标…

【Unity3D编辑器拓展】Unity3D的IMGUI、GUI、GUILayout、EditorGUI、EditorGUILayout、OnGUI【全面总结】

推荐阅读 CSDN主页GitHub开源地址Unity3D插件分享简书地址我的个人博客 大家好,我是佛系工程师☆恬静的小魔龙☆,不定时更新Unity开发技巧,觉得有用记得一键三连哦。 一、前言 在开发中,常常会遇到要使用OnGUI的地方。 也会遇到…

基础课2——自然语言处理

1.概念 自然语言处理(Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。 自然语言处理的主要研究方向包括: 语言学研究&…

我们不一样①

我们不一样① 从hello world开始 别人的hello world​​ 我们的hello world 代码展示 #include <stdio.h> int main(){printf("\033[31mhello world\033[0m"); getchar();return 0; } 此处用了 ANSI转义序列 ANSI转义序列是一种带内信号的转义序列标准&am…

【electron】实战技巧(持续更新,不要错过喔)

▒ 目录 ▒ &#x1f6eb; 导读需求开发环境 1️⃣ nvm处理多node环境避免node版本切换指定32位/64位 2️⃣ 常用node库npm-run-all&#xff08;脚本运行工具&#xff09;cross-env&#xff08;配置环境变量&#xff09;dotenv&#xff08;配置文件&#xff09;minimist&#x…

Apollo中的身份验证与授权:保护你的数据

前言 「作者主页」&#xff1a;雪碧有白泡泡 「个人网站」&#xff1a;雪碧的个人网站 「推荐专栏」&#xff1a; ★java一站式服务 ★ ★ React从入门到精通★ ★前端炫酷代码分享 ★ ★ 从0到英雄&#xff0c;vue成神之路★ ★ uniapp-从构建到提升★ ★ 从0到英雄&#xff…

模拟器-雷电-使用adb push或adb pull操作文件

一、环境 windows 10 雷电模拟器4.0.83 二、问题 有时候我们会需要往模拟器拷贝文件或者复制文件到我的电脑 三、方法 1、获取root权限 adb root adb remount 有可能遇到【daemon not running; starting now at tcp:5037】的报错 查看端口占用进程&#xff1a;netstat -…

Linux--进程终止

1.进程退出场景 进程退出场景只有三种&#xff1a; 代码运行完毕&#xff0c;结果正确代码运行完毕&#xff0c;结果错误代码在运行期间异常中断&#xff0c;退出进程 比如&#xff1a;对于错误的进程&#xff0c;可以通过不同的返回值来确定&#xff0c;什么是错误码呢&#x…

腾讯云 CODING 快速应用中心,让您 10 分钟轻松玩转 AIGC

点击链接了解详情 前言 AI 时代已经到来&#xff0c;与其说这是一个技术变革&#xff0c;不如说这是对我们工作和生活方式的全面升级。很多人已经听说过 Stable Diffusion AI 绘图和 Meta 公司推出的免费大语言模型 Llama 2&#xff0c;它们代表了当今最前沿的技术水平。但对于…

idea2023配置maven

看过【黑马程序员Maven全套教程&#xff0c;maven项目管理从基础到高级&#xff0c;Java项目开发必会管理工具maven】https://www.bilibili.com/video/BV1Ah411S7ZE?p9&vd_sourceedf9d91e5a0a27db51e3d6d4b9400637 配置的&#xff0c;前提要素配置也在这个课程里有啦&…

红队专题-从零开始VC++C/S远程控制软件RAT-MFC-[4]客户端与服务端连接

红队专题 招募六边形战士队员服务端编写新建工程server函数创建主线程类获取配置信息运行command 命令头文件里创建引用win32 类库/头文件startsocket 开始监听 类函数添加类StartSocketmysend/myrecv 设置 m_sockCommon 头文件MSGINFO_S 结构体 ThreadMain头文件runflag 启动 …