音视频开发—FFmpeg打开麦克风,采集音频数据

文章目录

    • 1.使用命令行实现采集PCM数据
    • 2.使用代码实现
    • 3.播放PCM
    • 4.PCM转换为WAV

1.使用命令行实现采集PCM数据

  1. 确保你的系统有FFmpeg安装。你可以通过在终端运行ffmpeg -version来检查是否已安装。

  2. 找出你的麦克风设备名。在Linux中,你可以使用arecord -l命令列出所有的音频录制设备。

  3. 使用FFmpeg录制音频。下面是一个基本的命令示例,它使用FFmpeg从麦克风捕获音频并将其保存为PCM格式的文件:

    ffmpeg -f alsa -i hw:0 -acodec pcm_s16le -ar 44100 -ac 2 output.pcm
    
    • -f alsa: 指定使用ALSA音频框架。
    • -i hw:0: 指定输入设备,hw:0根据你的arecord -l结果而定。
    • -acodec pcm_s16le: 指定音频编解码器为PCM 16位小端格式。
    • -ar 44100: 设置音频采样率为44100Hz。
    • -ac 2: 设置音频通道数为2(立体声)。
    • output.pcm: 指定输出文件名。
  4. 执行命令。复制并粘贴上述命令到你的终端中,根据需要修改输入设备。按下回车键开始录制,使用Ctrl+C停止录制。

确保你有足够的权限来访问麦克风设备。如果遇到权限问题,可能需要以root用户执行命令或修改用户权限设置。

2.使用代码实现

实现步骤:

1. 包含必要的库

代码首先通过extern "C"包含了FFmpeg库的头文件,保证了C++编译器能够正确地处理这些C语言编写的库。

2. 注册设备和初始化

使用avdevice_register_all()注册所有可用的设备和编解码器,以便FFmpeg能够识别和使用它们。然后,初始化一个AVPacket来存储从设备读取的数据。

3. 设置日志级别

通过av_log_set_level(AV_LOG_INFO)设置日志级别,这样FFmpeg在运行时会提供信息级别的日志输出,有助于调试和跟踪问题。

4. 打开音频输入设备

使用av_find_input_format("alsa")查找ALSA音频设备格式,并尝试用avformat_open_input()打开指定的音频设备(在这个例子中是"default",即系统默认音频设输入设备)。注:Linux是使用alsa,Windows上使用dshow,MacOs上使用avfoundation

5. 打开输出文件

创建并打开一个文件output.pcm用于写入捕获的音频数据。

6. 读取和保存音频数据

通过一个循环使用av_read_frame()从音频设备中读取数据,每次读取的数据被存储在之前初始化的AVPacket中。随后将这些数据写入到之前打开的输出文件中。循环继续执行,直到读取了5000个数据包或遇到读取错误。

7. 清理资源

在录制完成后,关闭输出文件,释放与音频设备关联的AVFormatContext,并关闭输入流。这一步骤确保所有打开的资源得到适当的管理和释放。

extern "C"
{
#include <libavformat/avformat.h>
#include <libavdevice/avdevice.h>
#include <libavutil/audio_fifo.h>
#include <libavcodec/avcodec.h>
}
#include <stdio.h>
#include <iostream>
using namespace std;
int main()
{AVFormatContext *formatCtx = NULL;AVInputFormat *inputFormat;AVPacket packet;int ret;FILE *outputFile;// 注册所有设备avdevice_register_all();// 初始化数据包av_init_packet(&packet);// 设置日志级别av_log_set_level(AV_LOG_INFO);// 寻找 ALSA 音频设备inputFormat = av_find_input_format("alsa");if (!inputFormat){fprintf(stderr, "Cannot find input device\n");return -1;}// 打开音频设备if ((ret = avformat_open_input(&formatCtx, "default", inputFormat, NULL)) < 0){av_log(NULL, AV_LOG_ERROR, "Cannot open input device\n");return -1;}outputFile = fopen("output.pcm", "wb");if (!outputFile){fprintf(stderr, "Could not open output file\n");return -1;}int count = 0;// 读取数据包while ((ret = av_read_frame(formatCtx, &packet)) >= 0 && count++ <5000){// 在这里处理捕获的音频数据cout << "packet size is " << packet.size << endl;fwrite(packet.data, 1, packet.size, outputFile);  // Write raw audio dataav_packet_unref(&packet);}// Clean upfclose(outputFile);// 清理avformat_close_input(&formatCtx);avformat_free_context(formatCtx);return 0;
}

3.播放PCM

生成的PCM为纯二进制数据,没有关键信息头,如果想要播放这段数据,可以使用ffplay制定采样的参数来播放,在Linux中一般默认的参数为

  • -f alsa: 指定使用ALSA音频框架。
  • -i hw:0: 指定输入设备,hw:0根据你的arecord -l结果而定。
  • -acodec pcm_s16le: 指定音频编解码器为PCM 16位小端格式。
  • -ar 44100: 设置音频采样率为44100Hz。
  • -ac 2: 设置音频通道数为2(立体声)。
  • output.pcm: 指定输出文件名。

命令示例:

ffplay -f s16le -ar 48000 -ac 1 input.pcm

在这里插入图片描述

可以看出来ffplay 已经成功将二进制数据转换为模拟信号进行播放了

4.PCM转换为WAV

如果不清楚什么是PCM和WAV 请看这篇blog

可以使用ffmpeg 通过添加参数的方式将PCM数据转换为WAV格式,以供各种播放器进行播放。

ffmpeg -f s16le -ar 44100 -ac 2 -i output.pcm output.wav

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/19628.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

通过强化学习彻底改变大型数据集特征选择

文章目录 一、说明二、强化学习&#xff1a;特征选择的马尔可夫决策问题三、用于使用强化学习进行特征选择的 python 库3.1. 数据预处理3.2. 安装和导入FSRLearning库 四、结论和参考文献 一、说明 了解强化学习如何改变机器学习模型的特征选择。通过实际示例和专用的 Python 库…

【Python】解决Python错误报错:IndexError: tuple index out of range

&#x1f9d1; 博主简介&#xff1a;阿里巴巴嵌入式技术专家&#xff0c;深耕嵌入式人工智能领域&#xff0c;具备多年的嵌入式硬件产品研发管理经验。 &#x1f4d2; 博客介绍&#xff1a;分享嵌入式开发领域的相关知识、经验、思考和感悟&#xff0c;欢迎关注。提供嵌入式方向…

ROS2从入门到精通2-1:launch多节点启动与脚本配置

目录 0 专栏介绍1 ROS2的启动脚本优化2 ROS2多节点启动案例2.1 C架构2.2 Python架构 3 其他格式的启动文件3.1 .yaml启动3.2 .xml启动 0 专栏介绍 本专栏旨在通过对ROS2的系统学习&#xff0c;掌握ROS2底层基本分布式原理&#xff0c;并具有机器人建模和应用ROS2进行实际项目的…

采用java18+vue语言+springboot开发的家政上门服务平台源码,(平台管理端+用户端+服务端全套源码)

采用java18vue语言springboot开发的家政上门服务平台源码&#xff0c;&#xff08;平台管理端用户端服务端全套源码&#xff09; 家政管理平台系统是运用现代计算机和网络技术&#xff0c;集信息网、服务网为一体&#xff0c;对社区家政需求信息汇集整理、综合处理&#xff0c;…

重生之 SpringBoot3 入门保姆级学习(11、日志的进阶使用)

重生之 SpringBoot3 入门保姆级学习&#xff08;11、日志的进阶使用&#xff09; 3.2.4 文件输出3.2.5 日志文档的归档与切割 3.2.4 文件输出 配置 application.properties # 日志文件名 如果不写路径默认就是在项目根路径建立 demo.log 文件 推荐写法 D:\\demo.log 路径 文…

OSError: [Errno 117] Structure needs cleaning

一 问题描述 OSError: [Errno 117] Structure needs cleaning: /tmp/pymp-wafeatri 我重新使用SSH登录也会提示这个类似问题 二 解决方法 2.1 尝试删除报错的文件 &#xff08;想直接看最终解决方法的可忽略此处&#xff09; sudo rm -rf /tmp/pymp-wafeatri 此种方法只能保证…

CISCN 2023 初赛 被加密的生产流量

题目附件给了 modbus.pcap 存在多个协议 但是这道题多半是 考 modbus 会发现 每次的 Query 末尾的两个字符 存在规律 猜测是base家族 可以尝试提取流量中的数据 其中Word Count字段中的22871 是10进制转16进制在转ascii字符串 先提取 过滤器判断字段 tshark -r modbus.pcap …

jenkins插件之plot

plot是一个生成图表的插件&#xff0c;这里我用于可视化phploc统计的数据 插件安装 进入 Dashboard --> 系统管理 --> 插件管理 --> Available plugins 搜索plot安装生成phploc分析数据 Dashboard --> 您的项目 --> Configuration点击 Build Steps点击 增加构…

振弦采集仪在岩土工程固结沉降监测中的应用研究

振弦采集仪在岩土工程固结沉降监测中的应用研究 岩土工程固结沉降是指土体在受到外力作用下&#xff0c;由于土体颗粒之间的重排结构&#xff0c;导致土体体积缩小和沉降的过程。固结沉降的监测对于岩土工程的设计和施工具有重要的意义&#xff0c;而振弦采集仪作为一种先进的…

物联网——TIM定时器、PWM驱动呼吸灯、舵机和直流电机

定时器概念&#xff08;常用于输出PWM波形&#xff0c;驱动电机&#xff09; 时间脉冲数时钟周期&#xff1b; 这里的脉冲数6553665536&#xff0c;支持定时器级联&#xff0c;从而延长定时 定时器类型 基本定时器原理图&#xff08;UI:更新中断&#xff0c; U:更新事件&#…

入门flask:Python后端开发的首选框架

新书上架~&#x1f447;全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我&#x1f446;&#xff0c;收藏下次不迷路┗|&#xff40;O′|┛ 嗷~~ 目录 一、引言&#xff1a;从零开始学习弗拉斯克 二、弗拉斯克的微框架哲学 三、弗拉斯克的核心…

知识维权维权不是低价治理的唯一方法

控价对于品牌来说确实是一个重要的环节&#xff0c;它旨在维护品牌形象和市场秩序&#xff0c;防止渠道出现低价、窜货等不正当竞争行为。整个控价过程确实需要包括前期的数据监测、治理动作以及后期的数据分析&#xff0c;以确保控价的全面性和有效性。 在治理低价链接方面&a…

kali自带--DNS路由--信息搜集

目录 DNS信息搜集 whois fierce dnsenum 路由信息搜集 DNS信息搜集 whois whois 域名 --域名注册的时候填的基本信息. fierce 域名的多级域名? 搜索引擎-谷歌搜索 whois 枚举/递归查询 dnsenum dnsenum 域名 -f 文件名 路由信息搜集 icmp经常ping不通--所以kali出了个tcp的…

【稳定检索/投稿优惠】2024年语言、文化与艺术发展国际会议(LCAD 2024)

2024 International Conference on Language, Culture, and Art Development 2024年语言、文化与艺术发展国际会议 【会议信息】 会议简称&#xff1a;LCAD 2024大会时间&#xff1a;2024-08-10截稿时间&#xff1a;2024-07-27(以官网为准&#xff09;大会地点&#xff1a;中国…

Rainbond 携手 TOPIAM 打造企业级云原生身份管控新体验

TOPIAM 企业数字身份管控平台&#xff0c; 是一个开源的IDaas/IAM平台、用于管理账号、权限、身份认证、应用访问&#xff0c;帮助整合部署在本地或云端的内部办公系统、业务系统及三方 SaaS 系统的所有身份&#xff0c;实现一个账号打通所有应用的服务。 传统企业 IT 采用烟囱…

源码编译安装LNMP

1、LNMP 包含&#xff1a;linux、Nginx、Mysql、php LNMP的工作原理 由客户端发送页面请求给Nginx&#xff0c;Nginx会根据location匹配用户访问请求的URL路径判断是静态还是动态&#xff0c;静态的一般是以 .html .htm .css .shtml结尾&#xff0c;动态的一般是以 .php .jsp…

水位监测站的工作原理

TH-SW2在雨季&#xff0c;河道和湖泊的水文信息监测对于防洪减灾、水资源管理和环境保护等方面具有至关重要的意义。水文监测站作为实现这一目标的基础设施&#xff0c;发挥着关键作用。水文监测站是观测及搜集河流、湖泊、水库等水体的水文、气象资料的基层水文机构。在雨季&a…

harbor -- docker私有仓库安装配置

1 安装docker-compose $ curl -L "https://get.daocloud.io/docker/compose/releases/download/v1.25.2/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose $ chmod x /usr/local/bin/docker-compose 2 安装配置harbor $ wget https://g…

Java基础语法——字符串(String/StringBuilder/Stringjoiner)

String Java的String类是不可变的&#xff0c;意味着一旦创建&#xff0c;其值就不能被改变。String类提供了丰富的API来操作字符串。 以下是一些常用的方法&#xff1a; 构造方法&#xff1a; 有以下几种常见的&#xff1a; public class stringlearn {public static void…

AI 赋能前端 -- 文本内容概要生成

幸福不在于你获得了什么,而在于你比他人多获得了什么 是比较出来的 大家好,我是柒八九。一个专注于前端开发技术/Rust及AI应用知识分享的Coder 此篇文章所涉及到的技术有 OpenAILangChainRust/WebAssemblyWeb Workerreact+ts+vite配置环境变量(env)因为,行文字数所限,有些概…