睡眠音频分割及识别问题(九)--Android下的YAMNet

部署PANNs模型面临的问题

  1. 加载模型出错
    在使用PANNs模型时,在PC端可以较好的运行,可是在Android端运行的时候,编译过程提示缺少libpytorch_jni.so文件,导致无法加载模型,无法预测。(如果有读者可以解决这个问题,请在评论中留言,万分感谢!)
  2. 模型所需空间较大
    PANNs的.pt模型文件大约30M,需要转换为Android端的torchscript文件,转换过后大约40M,加上pytorch框架可能会上50M。

部署YAMNet模型

  • 由于无法使用PANNs,我们尝试将YAMNet部署到Android中。由于Android对Tensorflow的支持较好(可以通过编辑器直接导入模型),所以顺利的完成了YAMNet在Android上的部署。
  • 最终编译出来的APK文件大小为21.2M。
    List item

测试YAMNet模型

在Android上使用0.975s的16kHz采样率音频数据测试,即一组全0的数组,形状为(1,15600)。得到结果如下所示:
在这里插入图片描述

小结

Pytorch对Andorid移动端不太友好,导致PANNs模型部署不成功;然后我们就转向了基于Tensorflow的YAMNet框架,后面尝试使用Java处理长音频数据,对音频进行重采样处理等操作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/507722.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux终端如何打开文件夹,如何从终端打开文件夹(带GUI)?

问题描述我想在我的统一面板(ubuntu 12.10)中放置一个链接/快捷方式/启动器。我在handytutorial.com上按照this tutorial创建了一个自定义启动器并将其拖到面板上。我只需要知道我必须输入哪个命令。这可能吗?最佳解决方案gnome-open在12.04对我不起作用&#xff0c…

linux 打开上一级目录,linux开机启动过程、PATH、过滤一级目录、cd的参数、ls -lrt、命令切割日志...

第二波命令正向我方来袭 :开机启动过程、PATH、过滤一级目录、cd的参数、ls -lrt、命令切割日志1.1 linux开机启动过程1.1.1 开机自检(BIOS)-- MBR引导-- GRUB菜单--加载内核(kernel)--运行INIT进程--读取/etc/inittab配置文件--执行/etc/rc.sysinit脚本(初始化脚本…

睡眠音频分割及识别问题(十)--Java读取wav文件

简介 Waveform Audio File Format(WAVE,又或者是因为扩展名而被大众所知的 wav),是微软与 IBM公司所开发在个人电脑存储音频流的编码格式。 由于项目需要从 wav 文件中读取音频数据,现有许多框架的 API 文档参差不齐&…

python 开发板 i2s_[Craftor原创] I2S总线接口设计(Verilog)

本文有Craftor原创,转载请保留出处。 I2S是数字音频的接口,这里不用多说,请读者自己查阅相关资料。 本文中要设计的是FPGA与数字音频芯片的I2S接口时序。简单点说,就是通过FPGA向音频芯片写数据,通过的是I2S总线&#…

linux内核态获取ip地址,Linux内核支持动态获取IP地址

配置选项:NFS: Network File SystemPNP: Plug-and-PlayCONFIG_ROOT_NFS若想要Linux box通过NFS依赖网络上的其他计算机来mount其整个根文件系统(假定该机器没有硬盘),则配置为Y。此时,可能还需要将"内核IP自动配置"设置为Y, 以便本…

深度学习(1)--引言

表示学习(representation learning) 使用机器学习来发掘表示本身,而不仅仅把表示映射到输出。 表示学习算法的典型例子为自编码器(autoencoder)。自编码器由一个编码器(encoder)函数和一个解码器(decoder) 函数组合而成。 编码器:将输入数据转换为一种…

pycharm配置python环境变量_求教大家 pycharm 中,环境变量 path 的问题!

问题的发现 在 pycharm 里把一个编译好的二进制文件放到/usr/local/bin/,然后在程序里调用。 cmmd "xxx ..." os.system(cmmd) 报这样的错,但是/usr/local/bin/已经在环境变量 path 里。 sh: xxx: command not found 最简单的解决办法就是把上…

linux nohup 运行,linux – 如何获取使用nohup运行的程序列表

当我开始使用$ nohup风暴dev-zookeper时,方法1:prayagupdprayagupd:/home/vmfest# jobs -l[1] 11129 Running nohup ~/bin/storm/bin/storm dev-zookeeper &方法2:使用ps命令。$ ps xwPID TTY STAT TIME COMMAND1031 tty1 Ss 0:00 /sbin/…

深度学习(2)--常见概率分布(1)

许多简单的概率分布在机器学习的众多领域中都非常有用,这个内容将分为两个部分来说明,第一个部分介绍伯努利分布、二项式分布、多项式分布及范畴分布,第二个部分介绍高斯分布、指数分布、Laplace分布、Dirac分布、经验分布及混合分布。 伯努…

gdb 调试_GDB调试指南-源码查看

前言我们在调试过程中难免要对照源码进行查看,如果已经开始了调试,而查看源码或者编辑源码却要另外打开一个窗口,那未免显得太麻烦。文本将会介绍如何在GDB调试模式下查看源码或对源码进行编辑。 准备工作为了说明后面的内容,我们…

suse linux 11如何分区,新手发帖,关于SUSE11挂载磁盘阵列并分区的问题

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼以下是盘阵给的代码:解压缩软件[rootRedHat5 ~]# tar xvzf Open-iscsi-2.0.865.tar.gz在/root下生成目录Open-iscsi-2.0.86,进入该目录进行编译和安装[rootRedHat5 ~]# cd Open-iscsi-2.0.86[rootRedHat5 Op…

深度学习(2)--常见概率分布(2)

上一部分介绍了伯努利分布、二项式分布、多项式分布以及范畴分布,这里将继续介绍高斯分布、指数分布、Laplace分布、Dirac分布、经验分布及混合分布。 高斯分布 高斯分布又称为正态分布,其图形为钟形曲线(bell-shaped curve),特点是中间高、…

update 千万数据_mysql学习(四)数据库

创建数据库create database 数据库名; 创建数据库的时候,我们应该记住以下几点: 1 不能与其他数据库名重复 2 名称可以由任意字母,阿拉伯数字,下划线,美元符,但是必须以字母开头 3 名称最长为64个字符&…

linux gpio按键驱动程序,Linux GPIO Key 驱动的加载

gpio-keys是基于input子系统实现的一个通用的GPIO按键驱动,基于platform来实现,位于drivers/input/keyboard/gpio_keys.c,这个文件是硬件无关的,而硬件有关的需要我们自己来注册.进入这个gpio_keys.c这个函数,第一步就是初始化.static int __init gpio_keys_init(void){return …

深度学习(3)--常用激活函数的有用性质

1 sigmoid函数 sigmoid函数是一个在生物学中常见的S型函数,也称为S型生长曲线。 sigmoid函数由下列公式定义: σ(x)11e−x(1)\sigma(x) \frac{1}{1 e^{-x}} \tag1σ(x)1e−x1​(1) sigmoid函数的级数表示: σ(x)1214x−148x31480x5−1780640x73114515…

kvm虚拟机不通网关_linux ssh 虚拟机下CentOS7开启SSH连接

一. 没开启,连接会报错二. 开启后,连接成功在虚拟机(Vmware Workstation)下,安装了CentOS7,现在想通过SSH工具连接虚拟机中的CentOS71、 首先,要确保CentOS7安装了 openssh-server,在终端中输入 yum list i…

linux netstat服务,linux netstat查看服务和端口状态

netstat可以查看linux系统中正在使用的服务和端口情况常见参数-a (all)显示所有选项,默认不显示LISTEN相关-t (tcp)仅显示tcp相关选项-u (udp)仅显示udp相关选项-n 拒绝显示别名,能显示数字的全部转化成数字。-l 仅列出有在 Listen (监听) 的服务状态-p …

memcpy函数实现_等比例缩放c++ opencv 实现

背景&#xff1a;在目标检测算法中&#xff0c; 输入图片等比例resize时mAP比直接resize会高几个点。实现&#xff1a;使用c 和opencv实现(之所以没用python&#xff0c;是因为用于生产环境)先贴代码&#xff1a;#include <math.h> #include <opencv2/core/core.hpp&g…

linux的bh文件停止运行,linux 系统 rcu_bh self-detected stall 问题处理

问题说明近期几台 linux 机器都报了以下 kernel 提示:Apr 24 21:02:09 cztest kernel: INFO: rcu_bh self-detected stall on CPU { 0} (t0 jiffies)Apr 24 21:02:09 cztest kernel: Pid: 0, comm: swapper/0 Not tainted 3.4.95.R620.CentOS6.5-x86_64.OpenBeta.KVM #1Apr 24 …

睡眠音频分割及识别问题(十一)--基于Android的YAMNet音频识别(总结)

WAV文件格式介绍 WAV文件遵守资源交换文件格式之规则&#xff0c;在文件的前44(或46)字节放置标头(header)&#xff0c;使播放器或编辑器能够简单掌握文件的基本信息&#xff0c;其内容以区块(chunk)为最小单位&#xff0c;每一区块长度为4字节&#xff0c;而区块之上则由子区…