弹跳机器人 桌游_MIT机器人轻松搞定桌游叠叠乐:你能玩过它算我输 |《科学》子刊...

乾明 发自 凹非寺 量子位 报道 | 公众号 QbitAI

江湖上,一直流传着一种叠叠乐的试炼。

规则很简单,从下方的积木中,抽一根往上搭。

你能往上搭几层?

对MIT团队研发的机器人来说,玩这个游戏基本上不费吹灰之力。

而且,它只需要训练大约300次就行了,一般的机器人少说也要训练上万次。

研究团队说,这个机器人并不醉心叠叠乐。

接下来要进军工业界,组装手机等消费产品等等。

叠叠乐有什么难的?

从上面的动图中可以看出,叠叠乐是一个牵一发而动全身的游戏。

与国际象棋、围棋等纯粹的认知任务或者游戏不同,机器人需要掌握物理技能,比如探测、推、拉、放置、对齐积木等等。

这就要求它必须进行交互的感知和操作,这种情况,是很难在计算机上模拟出来的。

机器人必须要在接触积木塔的同时,来学习如何移动积木。

MIT的研究团队说,关键的挑战在于,如何利用实际上的尝试,从相对较少的实验中去学习。

他们给出的方法是——

聚类学习,视觉触觉两开花

简单来说,就是搜集视觉触觉数据,然后对数据聚类,建立相应的模型。

为了搜集数据,研究团队定制了一个行业标准的 ABB IRB 120机械臂。然后在机器人能够触及的范围内搭建了一个积木塔,开始第一段的训练期。

机械臂的配件有3个,一个是用来操作积木软齿夹钳,也可以反馈触感;一个是用来控制操作积木的力度的力感应腕带;还有一个外部摄像头,用来收集视觉图像。

想让机器人学会玩叠叠乐,传统的做法是收集积木、机器人、积木塔之间可能发生的一切。

这显然会带来大量的数据,在成千上万次的尝试中寻找可行的模式,耗费的计算资源可想而知。

MIT研究团队的做法是,模仿人类玩这个游戏的方式。

在训练期中,机器人会随机选择一个积木,以及推动的积木的位置。 然后用较小的力道,试图将积木推出塔外。

对于每一次尝试,计算设备都会记录相关的视觉、触觉、力度等指标,并标注是否成功。

按照这种方法,机器人只训练大约300次,就对这些测量结果进行聚类分组。

比如,一组数据可能代表机器人在难以移动的积木上的尝试,而另一组数据则代表一个比较容易移动的积木上的尝试。

对于每个数据集群,研究团队都给机器人开发了一个简单的模型,根据当前的视觉和触觉数据来预测移动一个积木的行为。

他们说,让机器人建立聚类,然后学习每个聚类的模型,而不是学习一个能完全捕捉可能发生的一切的模型,能够极大地提高了机器人学习游戏的效率。

结合这些模型,机器人还会实时地“学习”,当机器人小心地推动一个积木块时,计算机会通过它摄像头和钳子接收视觉和触觉反馈,并将这些反馈结果与机器人先前做出的动作进行比较。

然后考虑这个动作的后果,即是否能够在特定的结构下,用特定的力度,把特定的积木块抽出来,放到上面,并确保积木塔不倒。

最后,这项研究的论文,已于近日刊发在了Science Robotics上。

作者为:Nima Fazeli、Miquel Oller、Jiajun Wu、Zheng Wu和Joshua Tenenbaum。

如果你感兴趣,请收好传送门:

See, feel, act: Hierarchical learning for complex manipulation skills with multisensory fusionhttp://robotics.sciencemag.org/content/4/26/eaav3123

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/533464.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华为鸿蒙无人驾驶,特斯拉最大的对手竟是华为?Hicar+鸿蒙OS无人驾驶技术不再一家独大!...

原标题:特斯拉最大的对手竟是华为?Hicar鸿蒙OS无人驾驶技术不再一家独大!短短几个月的时间,特斯拉的市值翻了近4倍,对于一个超级企业来说一切都显得那么不可思议,如果把它单纯的看成一家车企,恐…

new_picview_一款漂亮的图片查看器PictureViewer

前段时间写了一款查看妹子图片的客户端宅男福利妹子客户端SuperGank,于是后来就把其中的一个图片查看的功能封装成了一个library,使用简单,可以进行多项设置。先来看一眼效果图吧!下面来看看如何使用它:首先把图片url的…

鸿蒙系统会不会影响游戏,令人担心,鸿蒙系统会不会让人失望?未来难说

如今,一直被炒的沸沸扬扬的鸿蒙系统,终于在2019年8月9日发布了,次日,也就是8月10日,荣耀的智慧屏又带着鸿蒙系统出现了一次,荣耀智慧屏也成为了首次搭载鸿蒙系统的终端,见证了中国操作系统的历史…

buck电路上下管_推荐 | 学好电路设计与仿真?你不能错过这两本书籍 ~

网 友小编,有没有 Saber 相关书籍可以推荐一下?还有,Saber 软件下载那个版本比较好?当然有啦!小 编《Saber 电路仿真及开关电源设计》柯福波 等编著本书以 Saber 开关电源为基础,以具体工程电路为范例&am…

html5画电池状态,HTML5的一个显示电池状态的API简介

这篇文章主要介绍了HTML5的一个显示电池状态的API简介,由Mozilla设计,具体的设备和浏览器支持情况还要通过检测才能确定,需要的朋友可以参考下移动设备的份额在网络流量中在大量增长,其所贡献的网络流量非常庞大,以至于为了移动设备,我们单独…

redux异步action_react-redux--异步Action

上两篇文章叙述的都是同步操作,每当 dispatch action 时,state 会被立即更新。但是实际应用中,我们有很多操作执行后,过一段时间,才会得到结果。那么怎么处理这种情况呢?先熟悉一个概念中间件本质就是一个通…

怎么批量修改html文件后缀,如何批量修改文件后缀名

我们都知道电脑文件都有一个格式,比如JPG、MP3等等格式,每个格式都代表不一样文件类型,那么我们该如何批量更改文件类型的后缀呢?比如把JPG更改为MP3,只要在电脑里设置不隐藏文件扩展名,然后建立统一的文件夹&#xf…

python 怎么调用 矩阵 第几行_第58集 python机器学习:混淆矩阵精度指标

混淆矩阵的精度计算公式为:精度(TPTN)/(TPTNFPFN),也就是说,精度就是指正确的预测数目除以所有样本的数量。准确率、召回率与f-分数:总结混淆矩阵还有几种方法,其中最常见的就是准确率和召回率。准确率度量的是被预测为…

android seekbar闪退,android seekbar 踩坑之路

最近项目中有用到seekbar,之前对这东西不太了解,趁机来踩坑。seekbar样式按我觉得Material 中的还不算难看了。但是美工给了自己的样式,还是得改。主要有这2个属性:android:thumb"drawable/thumb"android:progressDrawable"dr…

tensorflow分类的loss函数_tensorflow 分类损失函数使用小记

多分类损失函数label.shape:[batch_size]; pred.shape: [batch_size, num_classes]使用 tf.keras.losses.sparse_categorical_crossentropy(y_true, y_pred, from_logitsFalse, axis-1)- y_true 真实值, y_pred 预测值- from_logits,我的理解是,如果预测…

华为鸿蒙系统还没发布吗,华为没有孤军奋战,合作伙伴“雪中送炭”,鸿蒙系统正式发布!...

6月2日晚上,期待许久的鸿蒙0S 2终于正式登场了,这意味着鸿蒙手机已经变成了面向市场的正式产品,这是华为迈出的一小步,却是国产系统与安卓、iOS竞争的开始。在鸿蒙OS正式推出后,不少华为手机用户已经收到了系统更新的推…

freemark循环map_java与freemarker遍历map

一、java遍历MAP/*** 1.把key放到一个集合里,遍历key值同时根据key得到值 (推荐)*/Set set map.keySet();Iterator itset.iterator();while(it.hasNext()){String s (String) it.next();System.out.println(map.get(s));}/*** 2.把一个map对象放到放到entry里&#…

.net 开发 html框架,Asp.net的开发框架

Asp.net的开发首先要选择开发框架,选择怎样框架要看看开发什么养的网站用的,选择一个适合的开发框架能节约很多的时间。20个优秀的前端框架:1. Twitter BootStrap (Apache v2.0;响应式)时髦、直观并且强大的前端框架,让…

baseresponse响应类_内部类、响应类Response、序列化基类、反序列化、全局局部钩子...

一、内部类1、概念:将类定义在一个类的内部,被定义的类就是内部类2、特点:内部类及内部类的所以名称空间,可以直接被外部类访问的3、 应用:通过内部类的名称空间,给外部类额外拓展一些特殊的属性(配置)&…

python模块名限定_python 正则表达式 匹配 ?的使用 限定符 sys.re模块

特殊字符:注意\b是匹配单词而非字符串的开始和结束; \w不能匹配汉字限定符放在匹配符的后边2 括号分组:(\d\d\d){2} #有括号匹配6位数字\d\d\d{2} #没有括号匹配4位数字3 ?的使用4 sys.re模块的常用函数表:查找、分隔、…

计算机不能进入桌面,电脑开机无法进入桌面,请高手解决。

该故障是Windows XP操作系统关机故障中最容易出现的故障。造成该故障的原因可能有以下几方面原因:系统设置在添乱Windows XP默认情况下,当系统出现错误时会自动重新启动,这样当用户关机时,如果关机过程中系统出现错误就会重新启动…

太阳能板清洗机器人科沃斯_太阳能电池板清洁机器人

太阳能电池板清洁机器人锐宝RAYBOT,可以实现自动升降式地免水清扫,使常年暴露在太阳下的电池板能彻底摆脱灰尘和污垢。当放置在太阳能电池板上时,锐宝能够自主行走、跨越最大3cm间隙并自动规划路线。底部吸盘设计能使RAYBOT安全地吸附在最大安…

html jq 控制显示密码,js、jquery分别实现点击密码输入框密码显示和隐藏

很多密览始不次这得是觉砖怎可我滚脑选的方近器上码框都有个眼睛标记,点击能显示密码。原理就是点击切换password为te要圈器是天的年编功小还久概据含直这请框结业未商屏页屏随会维气大机域页效实一应控高标近用功的xt等显示主要知识点:onmousedown&…

maven依赖循环引用_maven循环引用的问题

多模块的maven工程,有时候由于设计的不合理或者需求的变更。会导致模块之间产生循环依赖,编译的时候会报如下的错误:[INFO] Scanning for projects... [ERROR] The projects in the reactor contain a cyclic reference: Edge between .....重…