python 几种常见的音频数据读取、保存方式

1. soundfile 库的使用

soundfile库是一个Python库,主要用于读取和写入音频文件。它支持多种音频格式,包括WAV、AIFF、FLAC和OGG等。通过soundfile库,用户可以方便地将numpy数组存储到音频文件或者将音频文件加载到numpy数组中。此外,soundfile库还提供了一些函数,用于处理音频数据。它的使用简单且灵活,方便进行音频处理和分析的工作。

1.1 read 读文件

读取音频文件数据

import soundfile as sf
# wav numpy 型数据,sr是采样率
filename = "xx/xx.wav"
wav, sr = sf.read(filename, dtype='float64)

可通过dtype将任意的音频文件数据格式转为float64,float32,int16,int32 的numpy型数据,其中float64,float32是归一化后的结果。dtype 默认值为float64。

1.2 write 保存文件

保存音频文件数据

# save_filename, 保存的音频文件路径,data保存的数据,samplerate是采样率
sf.wrtie(save_filename,data,samplerate)

支持写入的数据也为float64,float32,int16,int32,并保存相应格式的数据

2. torchaudio 库的使用

torchaudio是PyTorch深度学习框架的一部分,主要用于处理和分析音频数据。它提供了丰富的音频信号处理工具、特征提取功能以及与深度学习模型结合的接口,使得在PyTorch中进行音频相关的机器学习和深度学习任务变得更加便捷。通过使用torchaudio,开发者能够轻松地将音频数据转换为适合深度学习模型输入的形式,并利用PyTorch的高效张量运算和自动梯度功能进行训练和推理。此外,torchaudio还支持多声道音频处理和GPU加速,以满足不同应用场景的需求。

2.1 load 读文件

加载音频文件数据

import torchaudio
file_path = "xx/xx.wav"
waveform, sr = torchaudio.load(file_path, normalize=True)

主要说明:
可以读取float32, int16, int32类型数据,返回的是torch.tensor类型的数据;
normalize=True时,返回的数据是归一化到(-1,1)的float32数据;
normalize=False时,返回的是float32、int16或者int32数据,具体需要看file_path本身是什么类型的音频数据;
normalize默认值为True。

2.2 save 保存文件

保存音频数据到文件

# out_path, 保存的音频文件路径,waveform保存的数据,sr是采样率
torchaudio.save(out_path, waveform, sr)

根据waveform的格式自动保存为float32、int16或者int32

3. from scipy.io import wavfile 库的使用

scipy.io.wavfile库是SciPy科学计算库中的一个模块,主要用于读取和写入WAV格式的音频文件。该库提供了函数用于将音频数据存储为WAV文件或者将WAV文件加载为numpy数组,方便进行音频数据的处理和分析。用户可以使用scipy.io.wavfile库来读取音频文件的采样率和数据,以及将音频数据写入WAV文件。此外,该库还提供了一些函数用于处理音频数据,如获取音频数据的声道数、比特深度等信息。通过scipy.io.wavfile库,用户可以方便地进行音频文件的读写操作,并结合其他Python库进行音频数据处理和分析。

3.1 read 读文件

from scipy.io import wavfile
file_name = "xx/xx.wav"
sr, wav_data = wavfile.read(file_name)

返回的是float32、int16、int32型numpy数据,具体格式根据file_name文件的音频格式

3.2 save 保存文件

# filename, 保存的音频文件路径,wav_data保存的数据,sr是采样率
wavfile.wrtie(filename, sr, wav_data)

根据wav_data的格式自动保存为float32、int16或者int32。

注:以上float32、float64数据是归一化后的结果,与其他转换为int16 / 2 ** 15,int32 / 2 ** 31

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/698434.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI 视频 | Stable Video 开放公测了,免部署,免费使用!谁说 4 秒的 AI 视频不香?!

谁说 4 秒的视频不香?2.21 日,Stable Video 开放公测了,不需要自己部署了,直接在网页上就可以生成视频了。 下面这些视频,都是通过 Stable Video Diffusion 生成的,可以先来感受一下: Stable V…

IPsec、安全关联、网络层安全协议

网络层安全协议 IP 几乎不具备任何安全性,不能保证: 1.数据机密性 2.数据完整性 3.数据来源认证 由于其在设计和实现上存在安全漏洞,使各种攻击有机可乘。例如:攻击者很容易构造一个包含虚假地址的 IP 数据报。 IPsec 提供了标…

【PCL】(十三)使用KdTree查找点

【PCL】&#xff08;十三&#xff09;使用KdTree查找点 以下代码实现使用KdTree来查找特定点的K个最近邻点&#xff0c;以及查找指定的某个半径内的所有邻点。 kdtree_search.cpp&#xff1a; #include <pcl/point_cloud.h> #include <pcl/kdtree/kdtree_flann.h&g…

解析 Go 编程语言数据类型:bool、整数、浮点数和字符串详细介绍

数据类型 数据类型是编程中的重要概念。数据类型指定了变量值的大小和类型。Go是静态类型的&#xff0c;这意味着一旦变量类型被定义&#xff0c;它只能存储该类型的数据。 基本数据类型 Go 有三种基本数据类型&#xff1a; bool&#xff1a;表示布尔值&#xff0c;要么是t…

龙年开工第一周谈LLM和编程

文章主要内容来自redis的作者antirez对于使用LLM后的“获奖感言” 文章要点 0、与大型语言模型(LLM)协作&#xff0c;学会让其为简单问题提供答案&#xff0c;这样可以更高效地利用时间。 1、正确地向LLM提问是一项基本技能。 2、在与他人交流时&#xff0c;提高描述问题的能…

nginx服务基础用法(概念、安装、热升级)

目录 一、I/O模型概述 1、I/O概念 1.1 计算机的I/O 1.2 Linux的I/O 2、零拷贝技术 3、同步/异步&#xff08;消息反馈机制&#xff09; 4、阻塞/非阻塞 5、网络I/O模型 5.1 阻塞型 I/O 模型&#xff08;blocking IO&#xff09; 5.2 非阻塞型 I/O 模型 (nonblocking …

外包干了两个月,技术退步明显。。。。。

先说一下自己的情况&#xff0c;本科生&#xff0c;19年通过校招进入广州某软件公司&#xff0c;干了接近4年的功能测试&#xff0c;今年年初&#xff0c;感觉自己不能够在这样下去了&#xff0c;长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试…

SD-WAN云专线:优越性能助力企业云上腾飞

随着企业数字化转型的推进&#xff0c;SD-WAN云专线作为一项安全、高速、低延迟、稳定可靠的专属连接通道&#xff0c;正迅速崭露头角。该技术通过连接用户办公点、数据中心以及各类云环境&#xff0c;构建强大的网络基础设施&#xff0c;助力企业轻松实现跨域云网数据互通&…

Python实现XML文件转Excel

了解xml.etree.ElementTree https://zhuanlan.zhihu.com/p/502584681?utm_id0 实现代码 运行前请确保对应的库装好 # encoding: utf-8 import os import xml.etree.ElementTree as ET import pandas as pd from tqdm import tqdmfolder_path "C:/Users/Administrato…

uniapp微信小程序解决上方刘海屏遮挡

问题 在有刘海屏的手机上&#xff0c;我们的文字和按钮等可能会被遮挡 应该避免这种情况 解决 const SYSTEM_INFO uni.getSystemInfoSync();export const getStatusBarHeight ()> SYSTEM_INFO.statusBarHeight || 15;export const getTitleBarHeight ()>{if(uni.get…

AI副业项目分享

在上一篇文章《这才是大学生该做的副业&#xff0c;别再痴迷于游戏了&#xff01;》中&#xff0c;我分享了一些副业的想法&#xff0c;接着有不少同学问我&#xff1a;具体如何做&#xff1f;这是真把我给整蒙了&#xff0c;这里分享下我可以提供的产品和服务吧&#xff0c;并…

Vant轮播多个div结合二维数组的运用

需求说明 在开发H5的时候&#xff0c;结合Vant组件的轮播组件Swipe实现如下功能。我们查阅vant组件库官方文档可以得知&#xff0c;每个SwipeItem组件代表一个卡片&#xff0c;实现的是每屏展示单张图片或者单个div轮播方式&#xff0c;具体可以查阅&#xff1a;Vant 2 - 轻量、…

JavaScript基础和数据类型

【一】JavaScipt基础 【1】什么是JavaScript &#xff08;1&#xff09;定义 JavaScript最初由Netscape公司&#xff08;现在的Mozilla基金会&#xff09;的Brendan Eich在1995年创造。 JavaScript是一种广泛用于网页开发的脚本语言。 它是一种动态、解释性的语言&#xff…

什么是智能指针?请列举几种智能指针的类型,并说明其区别。

什么是智能指针&#xff1f;请列举几种智能指针的类型&#xff0c;并说明其区别。 智能指针是一种 C 标准库提供的高级指针类&#xff0c;它能够自动管理动态分配的内存资源&#xff0c;并在适当的时候释放该资源&#xff0c;从而避免内存泄漏和野指针等常见问题。智能指针的主…

Mysql中like %xxx% 模糊查询该如何优化

背景&#xff1a; 实际项目中&#xff0c;like %xxx%的情况其实挺多的&#xff0c;比如某个表单如果支持根据公司名进行搜索&#xff0c;用户一般都是输入湖南xxx有限公司中的xxx进行搜索&#xff0c;所以对于接口而言&#xff0c;就必须使用like %xxx%来支持&#xff0c;从而…

C#,入门教程(05)——Visual Studio 2022源程序(源代码)自动排版的功能动画图示

上一篇&#xff1a; C#&#xff0c;入门教程(04)——Visual Studio 2022 数据编程实例&#xff1a;随机数与组合https://blog.csdn.net/beijinghorn/article/details/123533838 新来的徒弟们交上来的C#代码&#xff0c;可读性往往很差。 今天一问才知道&#xff0c;他们居然不…

MIT6.S081学习——二、相关命令行整理

MIT6.S081学习——二、相关命令行整理 1 添加user代码到xv6中并编译2 git版本管理 1 添加user代码到xv6中并编译 问题&#xff1a;如何让在xv6中运行copy.c 答&#xff1a;在xv6中运行copy.c文件&#xff0c;你需要先将该文件添加到xv6源代码目录中&#xff0c;然后修改Makefil…

笔试题讲解(C语言进阶)

目录 前言 1、题目 2、答案 3、解析 结语 前言 “纸上得来终觉浅&#xff0c;绝知此事要躬行”。本篇通过对指针实际案例的分析&#xff0c;由浅入深&#xff0c;来加强我们对指针的理解。 1、题目 这是一道难题&#xff0c;小心哦。 #include <stdio.h> int main(…

值类型:左值、纯右值、将亡值

值类型是一个古老的概念&#xff0c;早在C98就存在了&#xff0c;但在C11之前这些都无关紧要&#xff0c;随着C11右值引用的产生值类型也被赋予了新的含义。 但问题是C11并未给出清晰的定义&#xff0c;比如在C11的标准文档中&#xff0c;左值的概念只有一句话&#xff1a;“指…

使用向量数据库pinecone构建应用02:检索增强生成RAG

Building Applications with Vector Databases 下面是这门课的学习笔记&#xff1a;https://www.deeplearning.ai/short-courses/building-applications-vector-databases/ Learn to create six exciting applications of vector databases and implement them using Pinecon…