torchaudio.load() 和 librosa.load() 的返回值区别

问题

之前都在使用librosa加载音频数据,今天看到一段代码是用torchaudio加载的音频,发现torchaudio加载的数据和librosa返回的结果不一致。
查看资料后做出以下对比:
torchaudio.load 函数返回一个包含两个张量的元组:

  • 音频数据张量,形状为 (channels, samples)
  • 采样率

而 librosa.load 函数返回:

  • 音频数据numpy数组,形状为 (samples,)
  • 采样率

主要的区别有:

  • torchaudio 返回的是多通道数据,而 librosa 返回的是单通道数据。如果原始音频是多通道的,librosa 会自动将其转换为单通道。
  • torchaudio 返回的音频数据是一个张量,而 librosa 返回的是numpy数组。
import librosa
import torch
import torchaudioaudio_path = "../data/audio/4324107e-56bc-5ef4-b78b-d524d192b3fc/4324107e-56bc-5ef4-b78b-d524d192b3fc.mp3"
audio, sr = librosa.load(audio_path, sr=16000)
audio1, sr1 = torchaudio.load(audio_path, format='mp3')
print(audio.shape)
print(audio1.shape)# 处理后数据一致
transform = torchaudio.transforms.Resample(sr1, 16000)
audio1 = transform(torch.mean(audio1, dim=0, keepdim=True))
print(audio.shape)
print(audio1.shape)
(11448320,) 16000
torch.Size([2, 34344959]) 48000(11448320,)
torch.Size([1, 11448320])

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/861481.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Nacos详解

nacos官方文档:https://nacos.io/ 一、什么是nacos? Nacos是 Dynamic Naming and Configuration Service的首字母简称,一个更易于构建云原生应用的动态服务发现、配置管理和服务管理平台。 nacos官方文档:https://nacos.io/ nac…

C语言-二级指针应用场景

二级指针应用 引子:在线性表 销毁函数中,传入二级指针作为参数,可以实现对线性表的销毁操作。 //销毁已存在的线性表 void DestroyList(list_t **L){// Step 1: 检查L是否为非空指针if(L) // Step 2: 释放L指向的内存空间free(*L);// Step 3: 将L所指向的指针置为NULL&#xff…

数据结构--栈(图文)

栈是一种基本的抽象数据类型,具有后进先出的特点。在栈这种数据结构中,元素只能在一端进行插入和删除操作,这一端被称为栈顶(Top),而另一端则称为栈底(Bottom)。 栈的概念及特点 栈…

springboot社区维修平台

设计技术: springboot、mysql、maven、前端vue 主要功能: 住户管理、社区公告管理、维修工管理、维修订单管理、接单信息管理、订单信息管理、在线沟通管理、举报信息管理、留言板管理、系统管理等功能模块。 管理员功能模块 管理员通过后台登录页面…

4.2 sql手工注入和自动注入实战(OWASP实战训练)

4.2 sql手工注入和自动注入实战(OWASP实战训练) 引言1. information_schema1.1 查询数据库名(TABLE_SCHEMA)、表名(TABLE_NAME) information_schema.tables1.2 查询数据库名、表名、字段名(colu…

基于单片机和 Arduino 平台的六自由度可控机械手臂

摘 要 : 为了降低机械手臂的设计开发难度 , 并使之尽早地投入应用 , 设计一种基于单片机和 Arduino 平台的六自由度可控机械手臂 。提出六自由度可控机械手臂的控制方案, 给出机械手臂控制系统的结构框图 。 详细设计六自由度可控机械手臂…

Websocket在Java中的实践——自动注册端点

在《Websocket在Java中的实践——握手拦截器》中我们使用握手拦截器实现了路径解析的工作。这个过程略显复杂,因为路径解析这样比较底层的工作应该由框架来解决,而不应该交由开发者来做。本文介绍的自动注册端点的功能就可以很优雅的解决这个问题。 依赖…

【机器学习】python之人工智能应用篇--游戏生成技术

游戏生成技术,特别是生成式人工智能(Generative Artificial Intelligence, 简称Generative AI),正逐步革新游戏开发的多个层面,从内容创作到体验设计。这些技术主要利用机器学习、深度学习以及程序化内容生成&#xff…

Batch入门学习

Batch脚本是一种用于自动化任务的脚本语言,主要在Windows操作系统下使用。它通过一系列命令语句来执行特定的任务,如文件管理、程序执行等。下面是Batch脚本入门学习的基本内容: ### 1. 基础语法 #### 文件扩展名 Batch脚本的文件扩展名通常…

[C++][设计模式][原型模式]详细讲解

1.动机 在软件系统中,经常面临这“某些结构复杂的对象”的创建工作;由于需求的变化,这些对象经常面临着剧烈的变化,但是它们却拥有比较稳定一致的接口如何应对这种变化?如何向“客户程序(使用这些对象的程序)”隔离出…

【python语法】*args和**kwargs的理解

*args 是打包和拆分为元组 args有两部分构成为——和args。这里的重点是。 所以为了讲清楚args,我们要追根溯源——理解*的作用。这里的args只是一个参数名称而已,可以用其他的替换,比如下面的示例中都使用number进行替换。 *的作用&#x…

excel FORMULA

在Excel中,FORMULA 实际上是一个拼写错误。您可能是指 FORMULA 的正确拼写 FORMULA(这在Excel中不是有效的函数或关键字),但更可能是您想要讨论的是FORMULA(公式)的创建或使用。 在Excel中,您可…

STM32HAL库--IIC实验(速记版)

STM32 的普通 IO 口模拟 IIC 时序,可实现与 EEPROM 外设双向通信。 IIC 简介 IIC(Inter-Integrated Circuit)总线是一种由 PHILIPS 公司开发的两线式串行总线,用于连接微控制器以及其外围设备。 IIC 是由数据线 SDA 和时钟线 SCL 构成的串行总线。 IIC …

PostgreSQL的扩展(extensions)-常用的扩展-pg_pathman

PostgreSQL的扩展(extensions)-常用的扩展-pg_pathman pg_pathman 是一个用于 PostgreSQL 的分区管理扩展。它提供了一种高效的方式来管理和使用数据库分区,可以显著提升查询性能,特别是在处理大规模数据集时。 安装 pg_pathman…

Markdown 表格

Markdown 表格 Markdown 是一种轻量级标记语言,广泛用于格式化文本。它简单易学,支持多种平台,是许多程序员和作家喜爱的工具。在 Markdown 中创建表格,可以清晰地展示数据和信息。本文将详细介绍如何在 Markdown 中创建和使用表格。 Markdown 表格的基本结构 Markdown …

在数据库领域是如何实现“多租户”的呢?

数据库多租技术介绍 随着云计算时代的到来,多租户的概念也逐渐广为人知。“多租户”使得租户之间可以共享物理资源,能够帮助用户节约硬件成本和运维成本,提高资源利用效率。同时,在实现的过程中,考虑到共享带来的安全…

three.js - matcap材质(MeshMatcapMaterial)

说一下matcap纹理 先总结:MeshMatcapMaterial材质,通过采样含有光照信息的贴图来模拟光照效果。这种材质特别适用于模拟静态光源下的光照,并且,因其简单性和快速性而被广泛应用于各种场景。但是,由于其性能考虑&#x…

系统思考—啤酒游戏经营决策沙盘

在日常的教学中,我们通过系统思考仿真演练深入探索决策背后的动因。例如,我经常教授的麻省理工学院研发的“啤酒游戏”和“人民航空策略模拟”,这些都是麻省理工MBA学生的必修课。此外,还有更简洁的“红黑游戏”“收获季节”等模拟…

ElasticSearch索引架构与存储

关于ES官网的介绍: Elasticsearch provides near real-time search and analytics for all types of data. Whether you have structured or unstructured text, numerical data, or geospatial data, Elasticsearch can efficiently store and index it in a way that support…

在低版本Excel中创建次级下拉列表

在低版本中indirect函数不支持选区,创建次级下拉列表得依靠“名称管理”给选区命名。 (笔记模板由python脚本于2024年06月26日 06:24:22创建,本篇笔记适合常用Excel处理数据的coder翻阅) 【学习的细节是欢悦的历程】 Python 官网:https://www…