卷积神经网络语音识别_用于物体识别的3D卷积神经网络

本文提出了一种基于CNN的3D物体识别方法,能够从3D图像表示中识别3D物体,并在比较了不同的体素时的准确性。已有文献中,3D CNN使用3D点云数据集或者RGBD图像来构建3D CNNs,但是CNN也可以用于直接识别物体体积表示的体素。本文中,我们提出了3D CAD物体检测。

相关工作

  1. 3D形状描述符。现代3D物体识别模型起始于60年代,早期的识别框架基于几何模型。然而,大多数识别工作基于手工提取的特征描述符,例如点特征直方图,3D形状上下文等。CNN第一次用于识别3D物体识别时用于识别RGBD图像,其中深度作为额外的输入通道。基于深度的方法在概念上非常类似于基于二维的识别方法。深度仅作为CNN的第四个通道,使用3D合成模型作为CNN的输入。然而,使用深度通道和颜色通道产生2.5D,不能提供物体的全部几何信息。近年来,研究者尝试了基于多视图和体积信息来更好的形状描述符。
  2. 卷积神经网络。CNNs是为图像和音频信号等二维数据而设计的。它广泛应用于各种计算机视觉任务和数据科学中。CNN在基于二维图像的任务中被广泛使用的原因是可以获得大量的基准数据集,与手工制作的特征相比,这些大型数据集有助于生成更好的图像描述符。本文将相似的特征学习方法应用于三维数据而不是二维数据。
  3. 三维数据上的卷积神经网络. 近年来,随着基于距离和三维CAD数据集的可用性,研究人员获得了与二维图像相比的图像中物体的附加信息。在深度网络中,采用动作、多视图和基于体积的方法来表示三维数据。将基于运动的CNN结构成功地应用于动作识别任务中。Wu等人开发了第一个基于体积数据的CNN架构,即3DShapeNets。3DShapeNets使用一个深度信念网络来表示三维几何形状,将其表示为三维体素网格上二进制变量的概率分布。他们也用他们的方法从深度图中完成形状。然而,我们的工作灵感来自VoxNet,它是由Maturana & Shere设计的。VoxNet由一个简单而有效的CNN组成,接受类似于Wu等人的输入体素网格。3D ShapeNets和VoxelNet提供了最先进的结果。另外值得注意的作品还有Shi等人提出的全景视图[22]和Su等人提出的多视图CNN。

数据集

近年来,已有一些3D数据集可用。但是,这些数据集没有像包含2D图像的ImageNet1数据集那样大。有许多合理大小的三维数据集。大多数三维数据集是基于点云的,这些点云是通过距离扫描器获取的,比如ModelNet2、Sydney Urban Objects3、SUN-3D4。ModelNet数据集用于训练和测试提出的CNN模型。ModelNet数据集包含来自662个不同对象类的127,915张CAD三维图像。ModelNet40是ModelNet的一个子集,它是3D对象识别的基准,并分为9843个训练图像和2468个测试图像中使用。在实验中,我们还在ModelNet10上测试了我们的网络。ModelNet10有10个对象类别,它是ModelNet40的一个子集。在实验中,我们还在ModelNet10上测试了我们的网络。ModelNet10有10个对象类别,它是ModelNet40的一个子集。

方法

通过从目标类中选择最相似的特征,实现了三维CNN中的目标识别。对象识别过程可分为两部分,即三维对象的数据表示和CNN对表示数据的训练。我们在提出的架构中使用了三维体数据表示。大多数研究人员使用体素或点云方法来表示体积数据。我们在CNNs中使用了基于体素的数据表示。体素是在二进制“occupation grid”的帮助下生成的。与二维数据集相比,dataset提供的模型数量较少,因此,为了利用网络,我们向模型提供了沿重力方向30°的旋转。所有的体素都是由ModelNet 数据集中提供的网格模型渲染到12个不同的方向后生成的。本文所提出的网络是Voxnet的改进版本。我们使用了两种不同的网络进行培训。

网络模型1

Network-1包括三个卷积层和两个完全连接的层。大多数研究人员使用的体素大小等于或小于32×32×32。但是,我们认为32×32×32像素对于一个物体的准确预测是非常少的。在二维图像任务中,实验表明小于227×227的迭代对二维图像中的目标识别任务效果不佳。为了充分利用网络,我们使用体素有32×32×32、64×64×64、128×128×128三种不同尺寸。体素中的许多像素表示空单元,产生大量不必要的矩阵乘法(零值矩阵)。为了降低这一成本,我们使用5×5×5的核来代替体积CNNs中常用的3×3×3卷积核。卷积(layer)操作后使用ReLU和max-pooling(大小为2×2×2)层。池化层来减少过多参数的过拟合。为了避免数据过拟合,由于方向和相似的视图,我们在第一个完全连接层之前使用dropout层,概率为0.5。

cc32ef2e4ff6dcc6c079f630380a130e.png

网络模型2

网络模型2的灵感来自AlexNet的网络架构。它由五个卷积层和三个全连接的层组成。网络模型2还使用了体素的多个视图。我们以30度旋转训练网络。除了池之外,此网络具有network-1中使用的所有设置。为了训练网络,我们没有使用网络中池化层。在我们看来,池化可以在对象的形状上产生歧义。Network-2帮助我们了解CNN的深度如何影响识别模型的性能。

01129092610ebab50e1d4ab2c3b169ba.png

10ee56aff3db80e8bbabd01023ba0648.png

实验

该网络使用ModelNet数据集进行训练和测试。所有的三维CAD图像都使用[19]提供的脚本在体素中转换。我们测试了不同尺寸的体素32×32×32、64×64×64和128×128×128的网络。我们分别实现了这两个网络,并比较了它们的结果。然而,两种网络的结果有非常小的差异。我们比较了ModelNet10和ModelNet40数据集的体素大小相同的结果。结果表明,高分辨率体素提高了识别任务的精度。与VoxNet相比,我们的模型具有更好的精度。然而,VoxNet在其架构中只有不到100万个参数,而我们的network-2有超过200万个参数。我们训练network-2不使用pooling来测试pooling对volume - CNN的效果。但结果表明,池化层对结果没有显著影响。池化层对性能没有影响的原因之一是,用于训练和测试的所有体素都是实心的。ModelNet数据集中没有一个对象模型,它具有空心对象。结果如图4所示,图5为损耗和精度。

2f2c29d18bd26f5f83933305eb00696b.png

186015b3e4ead3880ac6a2bc11fd5c83.png

结论

本文描述了基于体素的三维数据表示的三维数据识别任务。分析了CNN在不同体素尺寸下的性能。分析进一步设计新的网络和测试不同大小的体素,以找到适合CNN操作的大小。实验结果表明,体素的大小直接影响目标识别任务。但是另一方面,增加体素的大小会在容量CNN架构中造成性能瓶颈。为了克服这一问题,我们应该探索一种关于时间和空间的优化数据结构来处理体素的大尺寸。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/372914.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

#获得请求来源ip_以太网数据包TCP、IP、ICMP、UDP、ARP协议头结构详解

以太网首部目地MAC地址(8字节)源MAC地址(8字节)类型(2字节)1、IP头的结构版本(4位)头长度(4位)服务类型(8位)封包总长度(16位)封包标识(16位)标志(3位)片断偏移地址(13位)存活时间(8位)协议(8位)校验和(16位)来源IP地址(32位)目的IP地址(32位)选项(可选)填充(可选)数据(1)字节和…

c# ef报错_C# EF调用MySql出现“未将对象引用设置到对象的实例”错误解决方案

C# EF调用MySql出现“未将对象引用设置到对象的实例”错误解决方案---修改步骤---1.打开Nuget管理包,把Mysql.Data替换为6.10.0以下任意版本。这里选择的是6.8.82.修改完毕后,继续把Mysql.Data.Entity也修改为对应版本6.8.8。3.安装完成后可以看到App.Co…

ServletRequest startAsync()的有用性有限

前段时间我遇到了Servlet 3.0中AsyncContext.start(…)的目的是什么? 题。 引用上述方法的Javadoc : 使容器调度线程(可能从托管线程池中)运行指定的Runnable 。 提醒大家, AsyncContext是Servl…

mysql所支持的比较运算符_mysql比较运算符有哪些?Mysql比较运算符详解

比较运算符可用于比较数字和字符串。今天发一篇Mysql比较运算符详解,希望对初学者有所帮助,虽然现在流行NoSQL,但是MYSQL还是很有用的,数字作为浮点值进行比较,字符串以不区为例进行比较,运算符用于比较表达…

Http Invoker的Spring Remoting支持

Spring HTTP Invoker是Java到Java远程处理的重要解决方案。 该技术使用标准的Java序列化机制通过HTTP公开服务,并且可以被视为替代解决方案,而不是Hessian和Burlap中的自定义序列化。 而且,它仅由Spring提供,因此客户端和服务器应…

学习后缀自动机想法

小序:学习后缀自动机是要有耐心的,clj的论文自己看真心酸爽!(还是自己太弱,ls,oyzx好劲啊,狂膜不止) 刚刚在写博客之前又看了篇论文,终于看懂了,好开心 正文&…

mysql 分组top_MySQL:如何查询出每个分组中的 top n 条记录?

问题描述需求:查询出每月 order_amount(订单金额) 排行前3的记录。例如对于2019-02,查询结果中就应该是这3条:解决方法MySQL 5.7 和 MySQL 8.0 有不同的处理方法。1. MySQL 5.7我们先写一个查询语句。根据 order_date 中的年、月,…

利用jenkins的api来完成相关工作流程的自动化

[本文出自天外归云的博客园] 背景 1. 实际工作中涉及到安卓客户端方面的测试,外推或运营部门经常会有很多的渠道,而每个渠道都对应着一个app的下载包,这些渠道都记录在安卓项目下的一个渠道列表文件中。外推或运营部门经常会有新的渠道产生&a…

拥有成本分析:Oracle WebLogic Server与JBoss

Crimson Consulting Group 撰写的非常有趣的白皮书 ,比较了Weblogic和JBoss之间的拥有成本 。 尽管JBoss是免费的,但该白皮书却严肃地宣称,从长远来看,Weblogic更便宜。 尽管此研究是由Oracle赞助的,但它看起来非常严肃…

mysql limit 分页 0_Mysql分页之limit用法与limit优化

Mysql limit分页语句用法与Oracle和MS SqlServer相比,mysql的分页方法简单的让人想哭。--语法:SELECT * FROM table LIMIT [offset,] rows | rows OFFSET offset--举例:select * from table limit 5; --返回前5行select * from table limit 0…

linux每天一小步---sed命令详解

1 命令功能 sed是一个相当强大的文件处理编辑工具,sed用来替换,删除,更新文件中的内容。sed以文本行为单位进行处理,一次处理一行内容。首先sed吧当前处理的行存储在临时的缓冲区中(称为模式空间pattern space&#xf…

mysql trace工具_100% 展示 MySQL 语句执行的神器-Optimizer Trace

在上一篇文章《用Explain 命令分析 MySQL 的 SQL 执行》中,我们讲解了 Explain 命令的详细使用。但是它只能展示 SQL 语句的执行计划,无法展示为什么一些其他的执行计划未被选择,比如说明明有索引,但是为什么查询时未使用索引等。…

006_过滤器

过滤器 过滤器(Filter)把附加逻辑注入到MVC框的请求处理,实现了交叉关注。所谓交叉关注(Cross-Cutting Concerns),是指可以用于整个应用程序,而又不适合放置在某个局部位置的功能,否…

Android_项目文件结构目录分析

android项目文件结构目录分析 在此我们新建了一个helloworld的项目,先看一些目录结构: 这么多的文件夹和文件中,我们重点关注是res目录、src目录、AndroidManifest.xml文件: 一、res目录主要是用来存放android项目的各种资源文件&…

实体 联系 模型mysql_数据库系统概念读书笔记――实体-联系模型_MySQL

bitsCN.com数据库系统概念读书笔记——实体-联系模型前言为了重新回顾我写的消息系统架构,我需要重新读一下数据库系统概念的前三章,这里简单的做一个笔记,方便自己回顾基本概念实体-联系(E-R)数据模型基于对现实世界的这样一种认识&#xff…

使用Twitter Bootstrap,WebSocket,Akka和OpenLayers玩(2.0)

原始帖子可以在ekito网站上找到。 对于我们的一位客户,我们需要显示一张具有实时更新的车辆位置的地图。 因此,我开始使用Play制作原型! 框架及其最新发布的版本2.0,使用Java API。 我从Play的网络聊天室开始! 2.0个样…

mysql 5.6.23免安装_mysql5.6.23免安装配置

1.官网下载,并解压2.环境变量,path下,追加mysql的bin路径D:\Program Files\mysql\bin;3.mysql目录下的my-default.ini重命名为my.ini,并添加下面的代码basedirD:/Program Files/mysql #mysql路径datadirD:/Program Files/mysql/d…

在Intellij IDEA中运行Vaadin应用

在本文中,我将向您展示如何使用Intellij IDEA运行vaadin应用程序。 Vaadin提供了一些用于Eclipse和Netbeans的插件。 但是对于Intellij IDEA来说,还没有插件。 但是部署vaadin应用程序比其他两个IDE容易。 这是您要遵循的步骤。 1.首先创建一个新项目&am…

mysql主从数据库

Mysql主从配置,实现读写分离 大型网站为了软解大量的并发访问,除了在网站实现分布式负载均衡,远远不够。到了数据业务层、数据访问层,如果还是传统的数据结构,或者只是单单靠一台服务器扛,如此多的数据库连…