GAN还有这种操作!谷歌大脑和X实验室利用模拟条件和域适应提高机器抓取效率(附论文)

来源:机器人圈

作者:Coogle Brain,Google X

概要:相信大家都知道,通过检测和采集带有注释的视觉抓取数据集来训练现代机器学习算法可以说是非常耗时、昂贵的。


相信大家都知道,通过检测和采集带有注释的视觉抓取数据集来训练现代机器学习算法可以说是非常耗时、昂贵的。一个非常具有吸引力的替代方案是使用现成的模拟器来生成ground-truth合成数据,其中数据的真实注释是自动生成的。不幸的是,纯粹模拟数据的模型往往不能在实际中普及应用。我们研究了该如何扩展随机模拟环境和域适应方法,以训练一个抓取系统从原始单目RGB图像中抓取新目标。我们对实验方法进行了广泛的评估,总共有超过25000个物理测试抓取集,研究了一系列模拟条件和域适应方法,包括一种我们称之为GraspGAN的像素级域适应的新扩展。研究结果显示,通过使用合成数据和域适应方法,在只使用随机生成模拟对象的情况下,我们能够减少实际所需的样本量,在给定性能级的基础上将性能提高50多倍。此外,研究结果还显示,在只使用未标注的实际数据和GraspGAN方法的情况下,我们能够获得实际的抓取性能,而没有任何与从939777个标注实际样本中获得的标注相类似的实际标注。


抓取是最基本的机器操纵问题之一。实际上对于任何可行的操纵行为来说,需要讨论的第一步都是抓取的目标。因此,抓取已经成为机器人研究的中心领域之一,从最早的机器人研究到现在,一系列的方法和技术都涵盖在内。可以说,机器人操纵问题的核心挑战是泛化(generalization):一个抓取系统抓握系统能否成功地抓取在系统设计或训练过程中没有看到过的多种新目标?分析型或基于模型的抓取方法可以很好地泛化到那些满足其假设条件的情况下。然而,非结构化实际场景的复杂性和不可预测性往往会混淆这些假设,而基于学习的方法已经成为强大的补充。


学习机器人抓取系统有一个很大的好处,那就是有利于对具有实际统计数据的目标进行泛化,并可以从计算机视觉和深度学习的进步中获益。实际上,近年来已经表现出最佳泛化性能的许多抓取系统已经将卷积神经网络纳入抓取选择过程中。然而,基于学习的方法同时也引入了一个重大挑战:需要大型标注数据集。这些标注可能包含人为提供的抓取点,也可能是自动收集的。在这两种情况下,时间和金钱都有相当大的成本,最近的研究表明,抓取系统的性能表现可能受到可用数据量的强烈影响。


克服这些数据需求的本质途径是回顾那些基于分析、基于模型的抓取方法的成功范例,其中包含了我们以前对于物理和几何知识的积累。我们可以通过两种方式将这种先验知识纳入基于学习的抓取系统中。


首先,我们可以修改系统的设计,使用基于模型的抓取方法,例如作为基于学习抓取系统的评分函数。其次,我们可以利用以往的知识来构建一个模拟器,并产生可以与实际经验使用方式大致相同的综合经验。可以说,在这项研究中所探索的第二条道路是特别吸引人的,因为我们可以使用本质上大致相同的学习系统。然而,合并模拟图像带来了一个挑战:模拟数据与实际数据的系统方式不同,模拟必须具有足够的普遍目标。解决这两个挑战就是我们本项研究的主要任务。


缩小现实差距:我们提出的像素级域适应模型采用由我们的模拟器生成的合成图像(a),并产生(b)相似于现实世界中由相机在物理机器人的肩膀产生的图像(c)。然后,我们通过适合的、实际的图像来训练一个基于视觉的深度抓取网络,然后我们将进一步完善其特征层面的适应性。


我们的工作有三个主要贡献:


(a)通过整合合成数据,从单目RGB图像获取性能方面的实质性改善:我们提出将合成数据并入到基于视觉的机器人抓取的端对端训练方法,我们显示实现了性能的显著提高,特别是在较少的数据和无数据环境。


(b)模拟到真实世界迁移的详细实验:我们的实验涉及36个不同测试对象的25704个真实抓取,并考虑了多个维度:模拟对象的性质、模拟中使用的随机化类型,以及域适应技术用于将模拟图像适应现实世界。


(c)纯粹基于视觉的单目抓取的有效模拟到现实世界迁移的第一个示例:据我们所知,我们是第一个成功展示抓取的模拟到现实世界(simulation-to-real-world)迁移,并泛化到以前未见的自然物体,仅使用单目RGB图像。


结论


在本文中,我们研究了如何将模拟数据并入到基于学习的抓取系统中,以提高性能,并降低数据需求。我们研究机器人肩膀上的单目RGB图像的抓取,这是一个特别具有挑战性的设置,其中深度信息和分析型3D模型是不可用的。这对模拟现实世界的迁移提供了一个具有挑战性的设置,因为与模拟深度图像相比,模拟的RGB图像通常与真实的相同。我们研究了对象的性质在模拟、随机化和域适应方面的影响。我们还介绍了像素级域适应的新的扩展,使其适合于我们抓取系统中使用的高分辨率图像。我们的研究结果表明,模拟数据可以极大地改善我们所使用的基于视觉的抓取系统,实现可比或更好的性能,减少50倍的真实样本。研究结果还表明,使用逼真的3D模型进行模拟训练并不重要。最后,我们的实验表明,我们的方法可以提供合成图像的合理转换,并且包括域适应在大多数情况下大大提高了性能。


虽然我们的工作证明,在对较小数量的现实世界数据进行训练时,抓取成功率方面取得了很大的进步,但也存在一些局限性。我们考虑的两种适应方法都集中在不变性上,要么将模拟图像变换为真实图像,要么将特征规范化为跨域不变。由于我们网络的结构,这些特征包含外观和动作,但是并没有明确的推理出模拟与现实世界之间的物理差异。我们确实考虑了动力学性质的随机化,并表明它确实很重要。最近的几项研究着眼于明确地适应物理差异,将这些想法纳入抓取是未来工作的一个令人兴奋的途径。虽然我们的模拟到真实世界传输的方法现在只考虑单目RGB图像,但是将这种方法扩展到立体和具有深度的图像将是非常明确的。最后,我们的实验报告的成功率仍有改进的空间,我们预计在这一领域的进一步研究将会取得更好的成果。我们工作的主要观点来自不同方法的比较:我们不是要提出一个新的抓取系统,而是研究如何结合模拟数据来改进现有的方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498625.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

英伟达的雄心:成为AI时代的计算平台

9 月 26 日,NVIDIA英伟达在北京举行GTC大会,NVIDIA 创始人兼首席执行官黄仁勋在演讲中展示了能够加快人工智能大规模采用速度的全新技术,并介绍了为云服务商、电商和智慧城市提供的各项计算平台服务。发布AI 推理软件TensorRT 3:可…

Gartner公布云计算市场排位:亚马逊微软阿里前三

来源:网易科技概要:Gartner认为,亚马逊、微软和阿里云三大巨头引领了增长,预估IaaS、PaaS和SaaS的5年增长分别为28%、22%和19%。9月27日,美国权威研究机构Gartner发布2016年全球公共云市场份额报告,全球云计…

重磅 | 周志华最新论文:首个基于决策树集成的自动编码器,表现优于DNN

来源: AI科技大本营概要:深度神经网络需要花大力气调参,相比之下 gcForest 要容易训练得多。此外,深度神经网络需要大规模的训练数据,而 gcForest 在仅有小规模训练数据的情况下也照常运转。今年 2 月,南京…

adv是php系统标签,whatsns开源php系统网站SEO优化之网站首页,问题详情,文章详情,标签详情,栏目详情TDK优...

网站首页优化TDK可以进入后台,系统设置--站点设置中,设置网站首页别名官方首页名称优化--长尾关键词【whatsns知识库开源内容付费php问答系统】,这样百度搜索问答系统,开源php问答系统,php问答系统,付费问答…

MIT联合波士顿咨询:全球21个行业,对话3000名高管,AI如何重塑商业形态? | 雷报

来源:雷锋网概要:目前只有14%的调查对象认为,AI对他们现在的产品或服务已经有了很大的影响。但对于5年后的情况,这一比例上升到63%。人工智能已经成了一个新的风口,人人都在谈论人工智能,但是,企…

智能体到底是什么?这里有一篇详细解读

来源:机器人圈概要:根据我们希望实现的目标以及衡量其成功的标准,我们可以采用多种方法来创建人工智能。根据我们希望实现的目标以及衡量其成功的标准,我们可以采用多种方法来创建人工智能。它涵盖的范围极其广泛,从自…

人类PK机器:人工神经网络和生物神经网络的比较

原文作者:MADELINESCHIAPPA译者:李凌概要:通过对生物学习与人工智能进行的比较,我们可以建立一个更安全的基础设施系统。 通过对生物学习与人工智能进行的比较,我们可以建立一个更安全的基础设施系统。 本文由Sophos的…

h5大转盘 php,HTML5 canvas实现中奖转盘的实例代码

本篇文章给大家带来的内容是关于HTML5 canvas实现中奖转盘的实例代码,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。最近在学canvas做动画,于是就写个转盘练下手。上个简陋的成果图(中间那个是转的指针&#xff…

硬件巨头正在崛起,中国独占鳌头

来源:亿欧概要:四年前,当第一份独角兽名单产生时,名单上有39家创业公司,其中只有一家是硬件公司。今天,世界上有大约213家独角兽,其中有18家是硬件创业公司。考虑到硬件只占全球科技创业公司的一…

MATLAB显示错误使用untitled,使用Matlab 2016a阻止集合构建错误

matlab R2016a.OS:我所生成的Windows 10All是Master Block,除了用于测试用例之外,没有其他任何东西,我得到以下错误:请帮助我完成这项工作,因为我确实需要完成一些工作。Ali以上来自于百度翻译以下为原文Hi…

神经网络:你的大脑是一台计算机吗?

原作者:ShamliPrakash译者:彭婷概要:大约三年前,当我怀孕盼着儿子出生的时候,朋友送了我Lise Eliot写的“What’s Going on in There?”的书。大约三年前,当我怀孕盼着儿子出生的时候,朋友送了我Lise Elio…

深度 | 三大痛点左右着中国服务机器人产业发展

来源: 机器人内参概要: 从全球角度看,以智能服务机器人为主的机器人产业在不断发展,产业规模及市场空间持续扩张。目前全世界至少有48个国家在发展机器人,其中25个国家已涉足服务机器人开发,掀起一波服务机…

php fork 相关函数,C语言fork函数创建进程详解

在linux下,C语言创建进程用fork函数,接下来我们通过代码来一步步了解fork函数的各个知识点。1、依赖的头文件#include 2、fork的原理和概念fork子进程就是从父进程拷贝一个新的进程出来,子进程和父进程的进程ID不同,但用户数据一样…

华为云AI开发部总经理罗华霖:华为人工智能的实践与创新

来源:亿欧作者:罗华霖概要:9月21-22日,由深圳市罗湖区人民政府指导、亿欧公司主办的“GIIS-全球产业创新峰会”在罗湖区京基100瑞吉酒店盛大启幕。9月21-22日,由深圳市罗湖区人民政府指导、亿欧公司主办的“GIIS-全球产…

oracle drop 提交,oracle drop 存储过程

Oracle中删除用户遇到的问题我新建了一个用户xy,并导入了一些表,序列,存储过程在其中。现在我用删除该用户出现问题执行drop user xy,报错ORA-01922: 必须指定 CASCADE 以删除 XY问题原因CASCADE众所周知是级联的意思,…

Michael I. Jordan——计算思维、推断思维与数据科学

来源:图灵人工智能概要: Michael I. Jordan 是机器学习、统计机器学习泰斗,是贝叶斯网络、概率图模型、层次随机过程等多个重要方向的主要奠基者之一,也是统计学与机器学习交叉融合的主要推动者之一。Michael I. Jordan 是机器学习…

Google Brain 团队的研究方法

来源:全球人工智能概要:大约一年之前,Google Brain 团队首次分享了我们的使命:让机器拥有智慧,造福人类生活。大约一年之前,Google Brain 团队首次分享了我们的使命:让机器拥有智慧,…

Gartner重磅发布近40页PPT,详解2017年十大战略技术趋势

来源:中国大数据概要:Gartner将战略科技发展趋势定义为具有颠覆性潜力、脱离初级阶段且影响范围和用途不断扩大的战略科技发展趋势,这些趋势在未来五年内迅速增长、高度波动、预计达到临界点。 近日Gartner公司着重介绍了在2017年对多个组织具…

巴菲特、李嘉诚、盖茨、小扎、孙正义…… 这是他们眼中的未来

来源:全球创新论坛概要:这些企业家、梦想家和先知在各自的领域中都取得了非凡的成就,创造了巨大的财富,如果让他们展望人类下一个百年,他们会告诉我们什么?为了庆祝百年诞辰,《福布斯》杂志最近…

oracle 01304,关于ORA-01034和ORA-27101的解决方法

[oraclelocalhost admin]$ oerr ora 0130401304, 00000, “subordinate process error. Check alert and trace logs”// *Cause: A process subordinate to this Logminer process has exited with an// error condition.// *Action: Look in the alert log and trace files f…