AI 的寒冬将来临

640?wx_fmt=png

来源:云头条


深度学习处于所谓的AI革命的前沿至今已有好几年;许多人过去认为,深度学习是神奇的“银弹”,会把我们带到技术奇点(general AI)的奇妙世界。许多公司在2014年、2015年和2016年纷纷下豪赌,那几年业界在开拓新的边界,比如Alpha Go等。特斯拉等公司通过各自的门面(CEO)来宣布,完全自动驾驶的汽车指日可待,以至于特斯拉开始向客户兜售这种愿景(有依赖于未来的软件更新)。


我们现在进入到2018年年中,情况已发生了变化。这表面上暂时还看不出来,NIPS大会仍一票难求,许多公司的公关人员仍在新闻发布会上竭力鼓吹AI,埃隆·马斯克仍不断承诺会推出自动驾驶汽车,谷歌的首席执行官仍不断高喊吴恩达的口号(AI比电力更具革命性)。但这种论调开始站不住脚。正如我在之前的文章中预测,最站不住脚的地方就是自动驾驶――即这项技术在现实世界中的实际应用。


深度学习方面尘埃已落定


ImageNet得到有效地解决(注意:这并不意味着视觉已得到解决)时,这个领域的杰出研究人员、甚至包括通常低调的杰夫•辛顿(Geoff Hinton)都在积极接受媒体采访,在社交媒体上大造声势,比如雅恩•乐坤(Yann Lecun)、吴恩达和李飞飞等人。大意无非是,我们正面临一场巨大的革命;从现在开始,革命的步伐只会加快。多年过去了,这些人的推文变得不那么活跃了,下面以吴恩达的推文为例来说明:


2013年:每天0.413条推文

2014年:每天0.605条推文

2015年:每天0.320条推文

2016年:每天0.802条推文

2017年:每天0.668条推文

2018年:每天0.263条推文(截至5月24日)


也许这是由于吴恩达的大胆言论现在受到了IT界会更严厉的拷问,正如下面这条推文所示:


640?wx_fmt=png


显而易见,AI方面的声势已大幅减弱,现在盛赞深度学习是终极算法的推文少多了,论文也少了“革命性”的论调,多了“演进性”的论调。自推出Alpha Go zero以来,Deepmind还没有拿出任何激动人心的成果。


OpenAI相当安静,它上一次在媒体上大放异彩是玩《刀塔2》(Dota2)游戏的代理,我想它原本是为了营造与Alpha Go一样大的声势,但很快就没有了动静。实际上这时开始出现了好多文章,认为连谷歌实际上都不知道如何处理Deepmind,因为它们的结果显然不如最初预期的那样注重实际……


至于那些声名显赫的研究人员,他们通常在四处会见加拿大或法国的政府官员,确保将来拿到拨款,雅恩•乐坤甚至辞去了Facebook AI实验室主任一职,改任Facebook首席AI科学家。从财大气粗的大公司逐渐转向政府资助的研究机构,这让我意识到,这些公司(我指谷歌和Facebook)对此类研究的兴趣实际上在慢慢减弱。这些同样是早期的征兆,不是大声说出来,只是肢体语言。


640?wx_fmt=jpeg


深度学习不具有扩展性


深度学习方面老生常谈的重要口号之一是,它几乎毫不费力就能扩展。我们在2012年有了约有6000万个参数的AlexNet,现在我们可能拥有至少是参数是这个数1000倍的模型,是不是?也许我们有这样的模型,可是问题是,这种模型的功能强1000倍吗?或者甚至强100倍?OpenAI的一项研究派上了用场:


640?wx_fmt=png


所以,从视觉应用这方面来看,我们看到VGG和Resnets在运用的计算资源大约高出一个数量级后趋于饱和(从参数的数量来看实际上更少)。Xception是谷歌Inception架构的一种变体,实际上只是在ImageNet方面比Inception略胜一筹,可能比其他各种架构略胜一筹,因为实际上AlexNet解决了ImageNet。


所以在计算资源比AlexNet多100倍的情况下,我们实际上在视觉(准确地说是图像分类)方面几乎让架构趋于饱和。神经机器翻译是各大互联网搜索引擎大力开展的一个方向,难怪它获取所能获取的所有计算资源(不过谷歌翻译仍很差劲,不过有所改进)。


上面图中最近的三个点显示了与强化学习有关的项目,适用于Deepmind和OpenAI玩的游戏。尤其是Alpha Go Zero和更通用一点的Alpha Go获取的计算资源非常多,但它们并不适用于实际应用,原因是模拟和生成这些数据密集型模型所需的数据需要这些计算资源中的大部分。OK,现在我们可以在几分钟内、而不是几天内训练AlexNet,但是我们可以在几天内训练大1000倍的AlexNet,并获得性质上更好的结果吗?显然不能……。


所以实际上,旨在显示深度学习扩展性多好的这张图恰恰表明了其扩展性多差。我们不能简单地通过扩展AlexNet来获得相应更好的结果,我们不得不调整特定的架构,如果不能在数据样本的数量上获得数量级的提升,实际额外的计算资源无法换来太大的效果,而这种量级的数据样本实际上只有在模拟游戏环境中才有。


640?wx_fmt=png


自动驾驶事故不断


对深度学习名声打击最大的无疑是自动驾驶车辆这个领域(我很早以前就预料到这一点,比如2016年的这篇文章:https://blog.piekniewski.info/2016/11/15/ai-and-the-ludic-fallacy/)。


起初,人们认为端到端深度学习有望以某种方式解决这个问题,这是英伟达大力倡导的一个观点。我认为世界上没有哪个人仍相信这一点,不过也许我是错的。看看去年加利福尼亚州车辆管理局(DMV)的脱离(disengagement)报告,英伟达汽车实际上开不了10英里就脱离一次。


640?wx_fmt=png640?wx_fmt=png


我在另一篇文章(https://blog.piekniewski.info/2018/02/09/a-v-safety-2018-update/)中讨论了这方面的总体情况,并与人类驾驶员的安全性进行了比较(爆料一下情况不太好)。自2016年以来,特斯拉自动驾驶系统已发生了几起事故,几起还是致命的。


特斯拉的自动驾驶系统不该与自动驾驶混为一谈,但至少它在核心层面依赖同一种技术。到今天为止,除了偶尔的严重错误外,它还是无法在十字路口停车,无法识别红绿灯,甚至无法绕环岛正确行驶。


现在是2018年5月,离特斯拉承诺来一次西海岸到东海岸的自动驾驶(这一幕没有出现,不过传闻称特斯拉有过尝试,但无法成行)已有好几个月。几个月前(2018年2月),被问及西海岸到东海岸的自动驾驶时,埃隆·马斯克在电话会议上重申了这点:


 “我们本可以进行西海岸到东海岸的驾驶,但那需要太多专门的代码来进行有效地改动,但这适用于一条特定的路线,但不是通用的解决方案。于是我认为我们可以重复它,但如果它根本无法适用于其他路线上,那不是真正意义上的解决方案。”


“我为我们在神经网络方面取得的进展而感到激动。它是很小的进展,似乎不是多大的进展,但突然让人大为惊叹。”


嗯,看一看上图(来自OpenAI),我似乎没有看到那个长足的进步。对于这个领域的几乎各大玩家来说,出现脱离之前的英里数也没有显著增加。实际上,上述声明可以理解为:“我们目前没有能够安全地将人们从西海岸载到东海岸的技术,不过如果我们真愿意的话,其实可以做手脚……我们热切地希望,神经网络功能方面很快会出现某种突飞猛进,好让我们从耻辱和大堆诉讼中脱身出来。”


但是给AI泡沫最猛力一戳的是优步(Uber)自动驾驶汽车在亚利桑那州撞死行人的事故。从美国国家运输安全委员会(NTSB)的初步报告来看,我们可以看到一些令人震惊的声明:


640?wx_fmt=jpeg


除了这份报告中明显提到的总体系统设计失败外,令人吃惊的是,系统花了好几秒的时间来确定看到的前方到底是什么(无论是行人、自行车、汽车还是其他什么),而不是这种情形下做出唯一的合理决定,从而旨在确保没有撞上。这有几个原因:第一,人们常常会事后会用言语表达其决定。


因此,一个人通常会说:“我看到了一个骑车的人,于是我转向左边以避开他。”大量的精神生理学文献会给出一番截然不同的解释:一个人看到了被其神经系统的快速感知回路迅速理解成障碍物的东西后,迅速采取行动来避开它,过了好多秒后才 意识到所发生的事情,并提供口头解释。”


我们每天做不是用言语表达的众多决定,而驾驶包括许多这样的决定。用言语表达开销很大,又耗费时间,实际情形常常很紧迫,不允许这么做。这种机制已进化了10亿年来确保我们的安全,而驾驶环境(尽管现代)利用了许多这样的反射。由于这些反射没有专门针对驾驶而进化,可能会导致错误。


一只黄蜂在汽车里嗡嗡作响,引起驾驶员条件反射,可能会导致多起车祸和死亡。但是我们对于三维空间和速度的基本理解、预测代理的行为和路上迎面而来的实际物体的行为这种能力却是很原始的技能,跟1亿年前一样,这些技能在今天一样有用,它们因进化而得到了显著的增强。


但是由于这些东西大多不容易用言语表达,它们很难来测量,因而我们根本无法针对这些方面来优化机器学习系统……现在这将认同英伟达的端到端方法――学习图像->动作映射,跳过任何言语表达,在某些方面这是正确的做法,但问题是,输入空间是高维的,而动作空间却是低维的。


因此,与输入的信息量相比,“标签”(读出)的“数量”极小。在这种情况下,极容易学习虚假关系(spurious relation),深度学习中的对抗样本(adversarial example)就表明了这点。我们需要一种不同的范式,我假设预测整个感知输入以及动作是让系统能够提取现实世界语义的第一步,而不是提取虚假关系是第一步。欲知详情,请参阅我的第一个提议的架构:预测视觉模型(Predictive Vision Model,https://blog.piekniewski.info/2016/11/04/predictive-vision-in-a-nutshell/)。


实际上,如果说我们从深度学习的大流行中学到什么东西,那就是(10k+维度)图像空间里面有足够多的虚假模式,它们实际上在许多图像上具有共性,并留下印象,比如我们的分类器实际上理解它们看到的东西。连在这个领域浸淫多年的顶尖研究人员都承认,事实远非如此。


加里•马库斯对炒作说不


我应该提到一点,更多的知名人士认识到了这种傲慢自大,有勇气公开炮轰。这个领域最活跃的人士之一是加里•马库斯(Gary Marcus)。虽然我并不同意加里在AI方面提出的每个观点,但我们无疑一致认为:AI还没有像深度学习炒作宣传机器描绘的那么强大。实际上,相距甚远。他写过出色的博文/论文:


《深度学习:批判性评估》(https://arxiv.org/abs/1801.00631)


640?wx_fmt=png


《为深度学习的质疑声辩护》(https://medium.com/@GaryMarcus/in-defense-of-skepticism-about-deep-learning-6e8bfd5ae0f1)


640?wx_fmt=png


他非常深入细致地解析了深度学习炒作。我很敬重加里,他的表现像是真正的科学家,大多数被称为“深度学习明星”的人其表现就像三流明星。


结束语


预测AI的冬天就像预测股市崩盘――不可能准确地预测何时发生,但几乎可以肯定的是,它会在某个时候点发生。就像股市崩盘之前,有迹象预示股市即将崩盘,但是对前景的描绘是如此的诱人,以至于很容易忽视这些迹象,哪怕这些迹象清晰可见。


在我看来,已经有这类明显的迹象表明,深度学习将大幅降温(可能在AI行业,这个术语已被企业宣传机器没完没了地滥用),这类迹象已经清晰可见,不过大多数人被越来越诱人的描绘蒙蔽了双眼。那个冬天会有多“深”?我不知道。接下来会发生什么?我也不知道。但我很肯定AI冬天会到来,也许更早到来,而不是更晚到来。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。


  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/492647.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Libcurl安装与HelloWorld

Windows系统下源代码下载编译、安装方式如下: https://blog.csdn.net/fxbjye/article/details/89152849 编译后得到库文件,把这两个文件复制到项目文件中, 修改项目文件的属性, 修改附加依赖项: 输入代码&#xff1…

信息论之父是如何将世界数字化的?

来源:CSDN编译:弯月机械鼠闯迷宫在 20 世纪 50 年代早期的一段视频中,贝尔实验室的科学家克劳德香农(Claude Shannon)展示了他的一项新发明:一只名为 Theseus 的机械鼠(看起来需要上发条&#x…

奇点、技术失控与技术启示录

来源:资本实验室回顾过去,我们可以看到历史上各个时期涌现出的众多超越时代的新公司、新产品、新思维和新模式。尽管绝大多数创新产品最终都失败了,但先行者们致力于要解决所在时代各种问题和困难的精神,却影响着下一代的技术进步…

Gartner预测2019年十大「数据和分析技术」趋势:增强型分析成为重要卖点

来源:机器之能摘要:处于数据和分析位置的领导人必须审视这些趋势对业务带来的潜在影响,并相应调整业务模式和运营,否则就有可能失去竞争优势。增强型数据分析,增强型数据管理,持续型智能,可解释…

万字长文带你看尽深度学习中的各种卷积网络

来源:AI科技评论摘要:深度学习中的各种卷积网络大家知多少?深度学习中的各种卷积网络大家知多少?对于那些听说过却又对它们没有特别清晰的认识的小伙伴们,这篇文章非常值得一读。Kunlun Bai 是一位人工智能、机器学习、…

Nexus搭建Maven服务器

参考:http://blog.csdn.net/ichsonx/article/details/14642897 1、 为什么使用Nexus 如果没有私服,我们所需的所有构件都需要通过maven的中央仓库和第三方的Maven仓库下载到本地,而一个团队中的所有人都重复的从maven仓库下载构件无疑加大了仓…

通信测试:5G 时代的“卖水人”

来源:中泰证券摘要:“金矿”变成了5G,卖水人的故事已拉开帷幕。前言十八世纪末期,在美国的西进运动中,人们在萨克拉门托河里发现了金砂,工人、农民、海员和传教士,前仆后继前来淘金,…

2019数字化趋势:未来5年政府、零售数字化程度将达80%

来源:阿里云摘要:2月20日,阿里云研究中心发布《2019数字化趋势报告》。报告指出,当前数字化的应用领域正从互联网行业向政府、金融、零售、农业、工业、交通、物流、医疗健康等行业深入。其中,政府、零售业等将成为受云…

量子计算何时具有真正的商业价值?

来源:IEEE电气电子工程师学会我们对新技术的迷恋似乎总是遵循着同样的轨迹:我们时而着迷,时而崇拜,时而失望,时而沮丧,最终得到的满足比我们最初想象的要少。1954年,德州仪器公司宣称其新型晶体…

[转帖]FPGA--Vivado

来源:http://home.eeworld.com.cn/my/space-uid-639749-blogid-267593.html 一般的,在Verilog中最常用的编码方式有二进制编码(Binary)、格雷码(Gray-code)编码、独热码(One-hot)编码。二进制码和格雷码是压缩状态编码。 若使用格雷编码,则相…

国内5G工程建设面临的6大挑战

来源:5G产业圈摘要:2019年被很多人认为是5G建设元年,但是,5G建设要面临的这些难题,你清楚几个?1、网络云化带来的规划和运维挑战5G网络全面云化,在带来功能灵活性的同时,也带来很多技…

QT中的滚动条QScrollArea

QT里的滚动条操作&#xff0c; 我理解的QScrollArea对象的使用为&#xff0c;把某个widget绑定到该QScrollArea对象&#xff0c;scrol->setWidget(widget); 绑定的widget对象的长宽超过边界时&#xff0c;会有滚动条的效果。 #include <QtGui/QApplication> #include…

iis5.1/6.0/7.0+ 配置url重写 无扩展名伪静态

最近在搞url重写 遇到iis 无扩展名及html映射问题 供后人查看 因为考虑功能比较多(URLRewriter组件有些功能满足不了要求)所以就用了HttpModule方法重写 iis5.1中 添加应用程序映射 .* (注意 这种方法只有5.1中可以)到 C:\WINDOWS\Microsoft.NET\Framework\v2.0.50727\aspnet_i…

无人驾驶重塑竞争生态圈

来源&#xff1a;智车科技摘要&#xff1a;中国有可能成为L4技术以及相关应用的世界领导者&#xff1b;在2030年&#xff0c;中国极有可能成为世界最大的无人驾驶市场&#xff1b;无人驾驶L4生态会是“共生”的&#xff0c;价值链将趋向扁平化&#xff1b;传统汽车领城的公司需…

5G的3大应用场景落地开花,中国或将引领全球5G产业发展

来源&#xff1a;易观智库摘要&#xff1a;2019年2月11日&#xff0c;易观发布了《中国5G应用市场数字化专题2018》的专题分析。5G是指“第五代移动通信计划”&#xff0c;不同于以往通信计划的更迭主要在于提升数据传输速率&#xff0c;5G的网络特点强调数据传输速率的提升、降…

一个简单的parser

所有的内容基于《两周自制脚本语言》。 原文中使用Java编写。鉴于本人不怎么会写Java&#xff08;书里面有好奇怪的语法&#xff0c;不懂&#xff08;逃&#xff09;&#xff09;&#xff0c;便用C#写了一个简单的parser。 代码输入格式&#xff1a; 1: i23*3/(4-2)2: i1; if(i…

向机器理解人类行为迈出一小步

一名被试人员正在键盘上打字来源&#xff1a;《中国科学报》摘要&#xff1a;近日&#xff0c;《中国科学报》采访了CCF优秀博士学位论文奖获奖者、清华大学博士易鑫及其导师史元春教授&#xff0c;深入报道了他们对人机自然交互研究的最新进展。随着信息技术的发展&#xff0c…

邬贺铨院士:工业互联网ICT的新挑战来(附PPT照片)

来源&#xff1a;走向智能论坛摘要&#xff1a;2月21日&#xff0c;由中国信息通信研究院、工业互联网产业联盟、中国通信学会联合主办的2019工业互联网峰会在北京召开。中国工程院院士邬贺铨做题为“工业互联网ICT的新挑战”的主旨演讲。尊敬的苗部长、赵院长、张总&#xff0…

计算机视觉及智能影像报告:未来规模超200亿美元

来源&#xff1a;网易智能近日&#xff0c;Forrester咨询公司对中国计算机视觉及智能影像市场进行了调查&#xff0c;访问了包括研究机构、科研院校、投资机构以及部分互联网企业&#xff0c;视频行业企业&#xff0c;针对以视频行业为代表的文娱产业中人工智能的应用趋势、面临…

权威报告丨2018-2019 新型互联网生态研究报告摘要

来源&#xff1a;商业伙伴摘要&#xff1a;核心观点&#xff1a;1、传统ICT企业与互联网企业&#xff0c;正在相互进入对方业务领地&#xff1b;2、新型互联网企业既有互联网的基因&#xff0c;又专注于B端企业级市场&#xff1b;3、政府、金融与制造是新型互联网市场规模最大的…