OpenAI“单手解魔方”被公开质疑,Gary Marcus称七大问题涉嫌误导

全世界只有3.14 % 的人关注了

青少年数学之旅

640?wx_fmt=png


近日,“OpenAI的机器手在4分钟内单手成功还原魔方”引起刷屏,然而,这一成就被著名机器学习怀疑论者马库斯质疑了,马库斯逐条列举OpenAI的误导性说法,机器学习圈却都撑OpenAI。你支持哪方?欢迎来与大咖一起讨论~

 

这几天,人工智能领域最令人兴奋的进展莫过于 “OpenAI 的机器手学会了单手解魔方”。

640?wx_fmt=gif

OpenAI 在 10 月 15 日发布这一成果,立即引起大量讨论。转魔方的视频被疯狂刷屏,仅 YouTube 的视频就有 20 万观看,网友纷纷表示:人工智能机器人的一个新里程碑诞生了!这是机器人在机体灵活性以及机器学习软件方面的飞跃!

640?wx_fmt=png

机器手还原一个三阶魔方全程只花了4分钟

640?wx_fmt=png

即使两根手指被绑住了也没问题

OpenAI 使用强化学习和 Kociemba 算法训练神经网络来模拟解决魔方问题。

研究人员专注于一个机器目前难以掌握的问题:感知和灵巧的操作。他们训练神经网络来实现由法生成的还原所需的旋转和翻转,并开发了一种称为自动域随机化的新方法,该算法能够无休止地在仿真中生成越来越困难的环境,从而让神经网络在模拟环境中学习解魔方,再迁移应用到现实世界。

640?wx_fmt=png

“用机器手解决魔方” 的背后有许多人手

OpenAI 训练类人机器手来解魔方的尝试,早在 2017 年 5 月就开始了。之所以对解魔方情有独钟,是因为研究人员认为,如果能成功训练这样一只机器手来完成复杂的操作任务,就能为通用型机器人奠定基础。


OpenAI 同时公开了一个机器手解魔方的完整视频,视频未经任何剪辑,可以看到,机器手灵活地操作魔方,在约 4 分钟的时间里成功还原了一个三阶魔方

机器手还原魔方的完整过程,视频未经任何编辑

然而,这一成果遭到了纽约大学心理学与认知科学教授、畅销书作家加里 · 马库斯 (Gary Marcus) 的质疑 ——OpenAI 声称 “解决” 了魔方,真的是这样吗?马库斯认为 OpenAI 还原魔方的博客内容存在误导性,他说:

鉴于 OpenAI 仍然没有更改关于 “解决魔方” 的误导性博客帖子 (博客标题是 “Solving Rubik’s Cube with a Robot Hand),所以我附上了详细的分析,将他们的说法和暗示与实际所做的进行了比较。依我之见,这些误导性对大多数对非专业人士来说并不明显。

640?wx_fmt=png

马库斯对 OpenAI“解决魔方” 的 7 条质疑如下:

1、这不是神经网络解决的;而是有 17 年历史的符号算法做到的。

2、这种算法是先天的,而不是学习的。

3、强化学习在选择转向哪个方向 (即大多数人所说的解决了魔方) 时不起作用。

4、所学到的是物体操纵,而不是解魔方。

5、只有一个物体被操纵,并且没有测试对其他对象的可推广性。

6、该物体装配了大量仪器 (如蓝牙传感器),机器手也安装了 LED。

7、成功率只有 20%;魔方经常从机器人手中掉落。

他说:“我强调一下,这个成果本身给人留下了深刻的印象,但描述有误导,更恰当的标题应该是’用强化学习操纵魔方’或‘灵巧的机器人手操纵物体的进展” 或类似的句子。”

OpenAI 联合创始人、机器人团队负责人 Woj Zaremba 注意到马库斯的帖子,反驳道:

1. 你的前三个论点是一样的。

2. 泛化是从模拟到现实,而不是从一个物体到另一个物体。

3. 我们没有装配仪器得到的结果稍微弱一些。

4. 你确信我们不会将性能提升到 100% 吗?

马库斯回应道:

1. 我的前两个论点完全不同:先天性≠象征性。这些是不同的。第三个论点有一点重叠,但并不明显。

2. 我当然知道,但是为了稳健性,你需要推广到新物体上

3&4:我期待看到其他结果;我相信你们最终会做得更好。

尽管是马库斯率先提出质疑,但不少人的回复并不赞同马库斯的说法,有人回复道:

“这是一个有缺陷的批评,基于对魔方的误解。魔方不是像围棋那样是一种可以学习的任务,而是需要记忆解法和熟练操作的任务;人类玩魔方也遵循一种算法。”

马库斯仍表示:总的来说,他们 (OpenAI) 没有对我的观点做出回应,我的观点是那篇博客的框架与论文的内容不相符合,虽然我同意这个工作很重要,但炒作是有误导性的。

网友评论各执一词,马库斯是一针见血,还是吹毛求疵?

马库斯在 Twitter 上也承认这个研究是个不错的研究,但博客文章中的一些说法用词不当,和实际不符,具有误导性。

我的主要观点是,现在被热议的 OpenAI 的博客文章具有误导性;在技术论文中精挑细选出的东西并不能解决问题。我在推特上也详细讲了,文章本身的标题以及开头的框架都具有误导性。因此,文章本身有其自身的问题。 


OpenAI 博客中的结尾表示:“强化学习不仅可以作为虚拟任务的工具,而且可以解决需要前所未有的灵活性的真实世界中的问题。” 而马库斯认为,如果没有更强的泛化测试,就无法提出进一步的主张。5 个略有不同的 cube 实验,也不能让这个机械手学会拧紧螺丝,开锁或给衬衫系上扣子。

640?wx_fmt=png


所以,这些问题的解决实际上无从谈起。

 

Twitter 上有人对马库斯表示支持,认为 OpenAI 的博客中的说法和实际确实存在实际差异。这种夸大其词可能导致大众对技术的盲目信任,进而造成消极后果,比如特斯拉的撞车事故。

 

640?wx_fmt=png


马库斯自己还发了个投票:

 

640?wx_fmt=png

不过从 600 多人的投票结果看,支持“解决魔方”应包括认知和操纵两方面的占大多数。

 

在 Twitter 上不断 “放炮” 的同时,这场辩论的战火不了避免地转到了其他平台,比如 Reddit。

640?wx_fmt=png


有网友搬运了马库斯在 Twitter 上发出的对 OpenAI 博客文章的 7 点详细意见,并配了贴图。但从网友讨论来看,支持马库斯的不多。更多的人认为他这是过于苛刻,咬文嚼字,没事找事。

 

比如下边这位就说,他觉得马库斯写的这 7 点摘要比 OpenAI 博客文章更具误导性。

 

640?wx_fmt=png


关注点 1-4:“神经网络没有解决问题;解决问题的是具有 17 年历史的符号 AI 算法。”

博客:“我们使用强化学习和 Kociemba 的算法来选择求解步骤,训练神经网络来解决仿真中的魔方。”

 

关注点 5:“只有一个对象被操纵,没有对其他对象的可推广性测试”

博客:测试使用了五种不同的原型,一个锁紧的模仿,一个面部立方体,一个完整的立方体,一个吉克魔方和一个 “常规” 魔方。这篇文章从来没有声称要解决魔方的问题。

 

关注点 6:“该物体已被植入大量设备(比如带有蓝牙功能传感器)。玩魔方的手上也装有 LED。”

博客:五个不同的原型中置入了不同级别的仪器。 “常规” 魔方没有置入任何设备,只是从中心正方形上切除小角,以消除对称性。

 

关注点 7:“成功率只有 20%;魔方经常掉落。”

博客:“尽管如此,我们的机器人仍未完善其技术,因为只有 60%的成功几率(而最困难的情况下只有 20%的成功几率)。”

 

而且下文专门开了一段来说这个问题。

 

还有人认为,马库斯实在是过于挑剔了,过于纠结于实际上并不重要的问题。

 

640?wx_fmt=png


我承认马库斯是一个能言善辩的人。但我觉得他过于迂腐,以至于无视于眼前的实际问题,大多数外行人都有能力阅读文章的背后之意,查看研究或博客文章的内容。

 

你可以去追求学术上的精确,但是那些真正关心这些东西的人很可能会陷入困境。我们都对他列出的几条问题有所了解,但至少其中大多数。在这种情况下几乎是无关紧要的,甚至像 “泛化性” 之类的重要论点,在机器人的高灵敏度这一主要问题面前,也显得不那么重要了。

 

我明白,不同的人会以不同的严谨程度来对待这个问题,并且我也理解马库斯的担忧,但我认为,对于 OpenAI 的公开批评过于挑剔,这些问题本身对这次讨论并不重要。 

马库斯是谁?深度学习怀疑论者

640?wx_fmt=jpeg

Gary Marcus


加里 · 马库斯 (Gary Marcus) 是一位科学家、畅销书作家和企业家。他是 Robust.AI 公司的创始人和首席执行官,Geometric Intelligence 公司 (2016 年被优步收购) 的创始人兼首席执行官,出版著作包括《代数思维》、《怪诞脑科学 (Kluge)》、《思维的诞生》等,最新著作是与 Ernest Davis 合著的《Rebooting AI : 构建我们可以信任的人工智能》。

马库斯也是著名的深度学习怀疑论者。作为认知心理学家,他一直高调参与人工智能辩论,与 Yann LeCun、AAAI 前主席 Thomas Dietterich 等 AI 大牛都展开过激烈辩论。

他曾撰文批判深度学习 (Marcus, 2018), 称深度学习实际上并没解决什么问题。这篇文章引起了人工智能圈极大的反响,几天之内,成千上万的人在推特上发表了自己对这个问题的看法,有些人热情支持马库斯的论点(例如,“这是我多年来读到的有关深度学习和 AI 的最好的观点),有些相反(例如,“有思考...... 但大部分都是错误的”)。

在那篇批判深度学习的文章中,马库斯概括了深度学习的十大挑战,直言深度学习本身虽然有用,但它不可能实现通用人工智能。他建议把深度学习视为 “一种非普遍的解决方法,而只是一种工具。”

他说:“相比纯粹的深度学习,我呼吁混合模型,不仅包括深度学习的监督形式,还包括其他技术,例如符号处理(symbol-manipulation),以及无监督学习(它本身也可能被重新概念化)。我也敦促社区考虑将更多的内在结构纳入 AI 系统。”

转载来源:新智元
参考来源:https://www.reddit.com/r/MachineLearning/comments/dkd4vz/d_gary_marcus_tweet_on_openai_still_has_not
部分素材源于网络,版权归原作者所有
如有侵权请留言联系删除,感谢合作

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

写在最后

微信公众号“少年数学家”
提供丰富的数学课外知识
数学人物、数学趣谈、科技与数学

想让孩子懂得更多有趣的数学
记得关注“少年数学家”
640?wx_fmt=png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/300140.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

android 带弧形背景,[Android日常]绘制弧形渐变背景

最近要修改用户空间头部信息显示,参考了好多APP的用户空间,都有一个弧形的背景,看着挺漂亮的。实现这种效果,有两种实现方式:1、作图;2、通过代码进行绘制。今天就讲讲如何通过canvas进行绘制。一、用到的知…

超强的绕口令

今天看到这样一个绕口令,自己读了半天,越读错的越多,呵呵,贴出来大家一起来玩玩1、初入江湖:化肥会挥发 2、小有名气:黑化肥发灰,灰化肥发黑 3、名动一方:黑化肥发灰会挥发&…

世界顶级精英们的人生哲学 【转】

1.别为你自己和别人下定论,你所看到听到的可能只是一面,为这个失去可能的朋友,很不值。 2.你可以有喝醉的时候,我们可以接受,但是你要明白和真正的朋友一醉才能让伤心事方休,否则,你只会是别人的…

记一次 .NET 某云采购平台API 挂死分析

一:背景 1. 讲故事大概有两个月没写博客了,关注我的朋友应该知道我最近都把精力花在了星球,这两个月时间也陆陆续续的有朋友求助如何分析dump,有些朋友太客气了,给了大大的红包,哈哈????,手…

来自女朋友的灵魂拷问!| 今日最佳

全世界只有3.14 % 的人关注了青少年数学之旅【1】【2】【3】【4】【5】【6】【7】【8】【9】

android 栏目编辑,android – 编辑文本导致内存泄漏

介绍:我有一个应用程序具有以下结构:ActionBar顶部(ActionBarSherlock)ViewPagerIndicator下面(对于选项卡)ViewPager(主机片段)我有一个问题,我的一个碎片导致了相当大的内存泄漏.我将问题缩小到以下情况:导致泄漏的片段只会在其onCreateVie…

Spring 事物传播特性

Spring 事物传播特性 这是Spring官方的定义 一共有7种 摘自源码省略了一部分 public interface TransactionDefinition {int PROPAGATION_REQUIRED 0;int PROPAGATION_SUPPORTS 1;int PROPAGATION_MANDATORY 2;int PROPAGATION_REQUIRES_NEW 3;int PROPAGATION_NOT_SUPPORT…

6月,回忆我失去的爱情

6月,夏天早已到来 自4月起,我一直放荡着。这个我在上个文章里已提到,哈哈 放荡两个月后,我回想我自己的爱情 我想明白为什么我会失去自己的爱情,哈哈 终于明白了是为什么,其实失去的这样的简单 我承认我有错…

《你必须知道的.NET》第1章学习笔记

面向对象中几个最基本的概念:类,对象,继承,封装和多态。 对象的出生,只是完成了对必要字段的初始化,其他数据要通过后面的操作来完成,如:属性的赋值,通过方法获取必要信息…

利用 PGO 提升 .NET 程序性能

引子.NET 6 开始初步引入 PGO。PGO 即 Profile Guided Optimization,通过收集运行时信息来指导 JIT 如何优化代码,相比以前没有 PGO 时可以做更多以前难以完成的优化。下面我们用 .NET 6 的 nightly build 版本 6.0.100-rc.1.21377.6 来试试新的 PGO。PG…

不作死就不会死,盘点那些死于自己发明的发明家

全世界只有3.14 %的人关注了青少年数学之旅还有他们死于自己的发明发明呼吸器:缺氧死亡 1772年,法国人希厄尔弗莱米奈特发明了可用于潜水的循环式再呼吸器,让呼出的气体实现循环。这是世界上第一个自持呼吸装置。不幸的是,弗莱米奈…

CIO们对数据中心虚拟化心存的六大疑虑

本文摘自:[url]http://industry.ccidnet.com/art/3915/20070428/1072803_1.html[/url] 巴塞罗那超级计算中心 数据中心虚拟化正在势不可挡地迅猛发展,据IDC预测,到2009年,虚拟化市场将在全球范围内将增长150亿美元。有专家预言&am…

启动Tomcat一闪而过解决

打开apache-tomcat-6.0.32/bing/catalina.bat在首行添加: set JAVA_HOMEC:\Program Files\Java\jdk1.6.0_07 就可以了。

android gdb 远程调试工具,Android下用gdb远程调试办法

Host: ubuntuTarget: Android ICS1. 将gdbserver和gdbclient分别放入target和host。两者都可在android源代码的prebuilt目录下找到。2. 在Target上启动gdbserver,在adb shell中执行$ /path/to/gdbserver :1111--attach PID其中PID为想要debug程序的进程号&#xff0…

如何在Domino中使用文本文件注册用户

具体的步骤如下: 1。先用以下的格式创建一个文本文件(每个用户一行): ZhangSan;;;;passw0rd;e:\id\603server;zhangsan.id;603server/r6domain;;zhangsan.nsf;;;;;;;;;;;; LiSi;;;;passw0rd;e:\id\603server;lisi.id;603server/r6domain;;lis…

C# 对接微信支付时生成符合 RFC3339 标准的日期时间字符串

rfc3339 是一种包含时区信息的字符串标准格式。格式为YYYY-MM-DDTHH:mm:ssTIMEZONE,YYYY-MM-DD表示年月日,T出现在字符串中,表示time元素的开头,HH:mm:ss表示时分秒,TIMEZONE表示时区(08:00表示东八区时间&…

盘点那些世间顶级直男hhhhhh | 今日最佳

全世界只有3.14 % 的人关注了青少年数学之旅【1】【2】【3】【4】【5】【6】【7】【8】【9】

android的单选按钮xml语法,android 控件 单项选择(RadioGroup,RadioButton)

1、继承关系和子类:2、定义:RadioButton表示单个圆形单选框,而RadioGroup是可以容纳多个RadioButton的容器3、XML重要属性:4、重要方法:5、实战:布局文件android:layout_width"wrap_content"andr…

.net项目开发工具(v2.0)功能完善专帖

首先,感谢你对本软件的支持。如果你有好的建议和要求,请记录于此,谢谢! 原文:http://www.cnblogs.com/mrhgw/archive/2007/06/04/770278.html?Pendingtrue#Post

CVE(Common Vulnerabilities and Exposures通用漏洞披露)笔记

产生背景:目前实时入侵检测和漏洞扫描评估基于的主要方法还是“已知入侵手法检测”和“已知漏洞扫描”,即基于知识库的技术,因此决定一个IDnA(Intrusion Detection and Assessment 实时入侵检测和漏洞扫描评估)技术和产…