向深度学习三剑客学习四种科研精神(上)

来源:陈德旺科学网博客

深度学习,尤其是深度神经网络学习算法的兴起和大数据的加持,结合GPU的算力,如同 “三英战吕布”,终于搞定了人工智能这一反复无常的“吕布”, 使得人工智能得以第三次复兴。

如今,人工智能技术向各行各业渗透,智能产业的发展正如火如荼。饮水思源,我们不能忘记,提出深度学习核心算法并于2019年获得图灵奖的三位英雄:深度学习三剑客: Hinton, LeCun 和Bengio. 尤其,是要向他们学习以下四种创新精神,以更好地实现我国创新能力的提升。

1.    坚持神经网络研究三十年的坚定执着精神

Hinton, LeCun 和Bengio虽然在不同的国家,处于不同的阶段,从20世纪八十年代开始,不约而同就对人工神经网络,尤其是神经网络学习算法,非常感兴趣。Hinton年纪较大,在另外2位还在读上大学或读研究生的时候,Hinton已经博士毕业,到斯坦福大学做博后了。1986年,Hinton与美国科学院院士Rumelhart等在Nature 上发表论文,提出了著名的BP(反向传播)算法:多层神经网络参数学习算法,引起了神经网络第二次复兴的浪潮。该经典论文至今已经被引用2万多次。这次复兴之后,基于BP算法的神经网络解决了很多问题,相关研究和论文呈现井喷状态。 


可惜,好景不长在。几年后,研究人员发现:BP算法虽然好用,但也存在收敛速度慢,容易陷入局部最小值和网络的初始化参数密切相关。尤其,由于训练时间太长,训练参数太多,内存经常溢出,难以处理如图像识别这类高维度和大量样本数据问题。于是,神经网络的研究陷入了第二次低潮:很难拿到课题,很难发表论文 ,很多研究人员就放弃了,转向别的研究方向。

但是,Hinton不气馁,始终坚持研究方向不动摇,苦思冥想破解之道不懈怠, 转移到加拿大多伦多大学继续开展研究。在共同发明BP算法20年后,2006年Hinton,通过深度思考和编程实践,终于想出了针对高维数据的破解之道,在Science上发表了用神经网络减少数据维度的新方法,为深度学习的兴起奠定了理论基础,至今被引用1万余次。之后,深度神经网络的发展可谓波澜壮阔,气势如虹。由于篇幅关系,就不逐一描述了。

2.    合作与争论并重的和谐团队精神

1987博士毕业后,LeCun 去加拿大多伦多大学,追随神经网络的旗手人物Hinton 做了一年的博士后。在Hinton的启发和指导下,LeCun提出卷积神经网络用于手写体识别,大幅度提高了精度,引起了关注。但好景不长,该方法的通用性不强,还是难以处理更高维的彩色图像数据。

2003年,LeCun到纽约大学任教并发展了第三个合作者:前公司同事 蒙特利尔大学教授Yoshua Bengio,与Hinton一起组成了所谓的“深度学习的阴谋( Deep Learning Conspiracy)”。据说,Bengio 在读研究生时,读到了Hinton的一篇论文,如被电击,找到了儿时非常喜欢的科幻故事的感觉。如今有机会加入偶像领导的神秘小组,自然是喜出望外。

2004年机会终于来了,Hinton拿到了一个加拿大政府支持的大项目,很快就组建了研究组,并邀请LeCun和Bengio加入了他的项目组。至此,三剑客正式进入了蜜月期 。为了证明神经网络是有用的,他们开发了更多层的神经网络(深度神经网络),用更大的数据集来训练网络,并在更强大的计算机上运行网络参数的学习算法。Hinton 曾开玩笑地表示:三人平均每周都要见一次,而聚会经常以吵架结束。我想Hinton2006年在Science上发表的经典论文应该和这些吵架相关,吵架和辩论使Hinton的思考更有深度(深度思考)。十年面壁思考,十年讨论争论,Hinton化了整整20年的时间,终于想出了神经网络第二次衰落的关键破解之法。 

达摩面壁9年(另说10年),9年后的2015年,三剑客合作写了一篇Deep Learning(深度学习)综述论文发表在Nature, 正式给他们的研究成果和无数相关研究树立了一面旗帜,影响了这些年AI的快速发展和智能产业的快速崛起,已经被引用2.5万余次了。

作者简介:陈德旺,IEEE高级会员,IEEE Trans.on ITS 编委,中国自动化学会混合智能专委会副主任,中国运筹学会智能计算分会副理事长,美国加州大学伯克利分校访问学者,福州大学数学与计算机科学学院教授、博士生导师,主要研究方向为人工智能、大数据和智能交通等。至今发表论文120余篇,其中SCI检索论文40余篇,IEEE Transaction论文13篇,他引3000余次;获得各类科研奖励10多项。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/487627.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

val什么意思vb中的属性值_老司机带你探索Mysql中int(1)、int(10)、int(11)的区别是什么?...

在上一篇原创文章MySQL一个表的自增id用完了,背井大佬让我用这些姿势再往里插数据,最后留下了一个问题,大家知不知道int(1)和int(11)有什么区别,没有小伙伴互动回答,只有一位老哥让我说一下什么区别,我说上…

c#switch语句判断成绩_C#程序流程控制 知多少?

最近发现读书是个慢过程,很难一口吃个胖子,尤其读这种技术类的书,需要细嚼慢咽的精读,很耐心的读。迄今为止我一个像样的C#程序都没有做过,是小白中的小白,这倒不影响什么,毕竟在曾经学过C语言的…

无穷存在吗?

来源:数学职业家无穷大的存在问题是一个令人惊讶的古老问题。亚里士多德首先引入了一个明确的区分,以帮助理解它的意义。他区别两种不同的无穷大。其中之一,他称之为潜在无穷大:这种无限大刻画了无止境的宇宙或一个永无休止的名单…

机器学习虽好,也要看什么场合!

来源:AI科技评论编译 | 王念编辑 | 丛末身为AI时代的程序猿,我们天生就对数据集敏感。因此,当我们拿到一批真实数据时,激动之情肯定溢于言表!举例来说,我们可能拿到了一组患者正确药量的数据集,…

CVTE前端笔试编程题

这些题目是做完笔试之后,在别的地方找到的,现在附上。 1.(1)这题考察的怎么把参数转换为数组,然后再截取你想要的位数。 function C(){var a_argsArray.prototype.slice.call(argumens,0,2);var b_argsArray.prototype.slice.call(arguments,…

springboot 引入jdbc驱动_SpringBoot+MyBatis+Druid整合demo

最近自己写了一个SpringBootMybatis&#xff08;generator&#xff09;druid的demo1. mybatisgenerator逆向工程生成代码1. pom文件pom文件添加如下内容&#xff0c;引入generator插件<!-- mybatis代码生成插件 --><!--如果使用的mysql驱动是6.x的&#xff0c;那就无法…

盘点|世界流行的十大机械工程设计软件,你会用几种?

来源&#xff1a;自机械前线机械设计是机械生产的第一步&#xff0c;是决定机械性能的最主要的因素。为了满足机械产品性能的高要求&#xff0c;在机械设计中大量采用计算机技术进行辅助设计和系统分析&#xff0c;以下是目前世界上流行的十款式机械工程设计软件。1、Autodesk …

SpaceX再发射58颗星链卫星 总数达到538颗

来源&#xff1a;网易智能据外媒报道&#xff0c;在距离上次星链&#xff08;Starlink&#xff09;卫星发射仅仅10天后&#xff0c;美国太空探索技术公司SpaceX于当地时间周六再次发射了最新一批星链卫星。与以往每批发射60颗星链卫星不同的是&#xff0c;SpaceX此次只发射了58…

MVC系列——MVC源码学习:打造自己的MVC框架(一:核心原理)(转)

阅读目录 一、MVC原理解析 1、MVC原理二、HttpHandler 1、HttpHandler、IHttpHandler、MvcHandler的说明2、IHttpHandler解析3、MvcHandler解析三、HttpModule 1、HttpModule能干什么2、HttpModule的使用3、HttpModule和HttpHandler如何区分4、UrlRoutingModule解析 四、总结正…

python中的画布背景设置_教你用python画图—Turtle详细教程

Turtle模块绝对是吸引非专业代码开发者人员学习python入门的好工具通过turtle几行代码的执行软件就会画出漂亮的图形&#xff0c;美观而且有成就感&#xff0c;这样一下子对python编程就产生了兴趣。这些漂亮的图形如三角形、五角星、机器猫等。在写代码的时候改变几个参数&…

城市大脑,是工程问题,但首先是基础科学问题

2020年&#xff0c;在5G&#xff0c;大数据&#xff0c;人工智能、区块链、新基建等一轮轮科技浪潮下&#xff0c;城市大脑开始逐步成为新的城市建设和前沿科技热点。到2020年6月已经有近500多个城市宣布建设“城市大脑”&#xff0c;包括阿里&#xff0c;华为&#xff0c;百度…

JOptionPane弹框常用实例

最近在做swing程序中遇到使用消息提示框的&#xff0c;JOptionPane类其中封装了很多的方法。 很方便的&#xff0c;于是就简单的整理了一下。 1.1 showMessageDialog 显示一个带有OK 按钮的模态对话框。 下面是几个使用showMessageDialog 的例子&#xff1a; Java代码 JOption…

从5G到6G的思考:需求、挑战、技术趋势

来源&#xff1a;5G作者&#xff1a;易芝玲&#xff1a;中国移动首席科学家。王森&#xff0c;韩双锋&#xff0c;崔春风&#xff1a;中国移动通信研究院。王亚峰&#xff1a;北京邮电大学信息与通信工程学院。未来智能实验室的主要工作包括&#xff1a;建立AI智能系统智商评测…

VS2017C++单元测试

0、欢迎食用 希望对点进来的你有所帮助。全文记流水账&#xff0c;内心想法如示例项目名称。1、建立需测试的项目 新建项目正常书写.h 和.cpp文件2、新建单元测试 右击解决方案 -> 添加 -> 新建项目 Visual C -> 测试 -> 本机单元测试项目点击确定出现3、添加被测项…

ncf 推荐系统_浅析神经协同过滤NCF在推荐系统的应用

NCF在推荐领域应用背景CF&#xff0c;也就是协同过滤&#xff0c;在推荐领域有极其广泛的应用&#xff0c;应该没有谁的智能推荐系统是没用到过CF的。CF其实就是挖掘user和item的交互关系&#xff0c;然后生成I2I或者U2I表示向量。传统的CF从数学角度上还是偏行为统计计算的&am…

2020身高体重标准表儿童_2020年儿童标准体重表出炉!过胖影响发育!(附身高体重标准表)...

近年来&#xff0c;孩子们长胖的趋势越来越明显&#xff0c;一些疾病也有年轻化的趋势。很多家长们平时也很注意饮食搭配和运动&#xff0c;但孩子还是一不小心就“超重”了&#xff0c;真的防不胜防。相信和我一样担忧孩子家长肯定不少。今天就来和大家讲讲&#xff0c;关于孩…

游戏的未来是什么?

“我们还没有真正跨过VR 1.0&#xff0c;无绳VR要么不可靠要么非常贵。我们正在朝VR 2.0发展&#xff0c;用的是眼球追踪&#xff0c;有更大的视野、更高的分辨率、更好的音频和六个自由度&#xff0c;但这些领域仍需要进一步研究。”来源丨Forbes作者丨Matt Gardner编译丨科技…

AI仿生:人类进化新可能

来源&#xff1a; 脑极体看过《银翼杀手》这部开创赛博朋克风格科幻电影的人&#xff0c;一定会对电影中仿生人罗伊贝蒂印象深刻&#xff0c;尤其是电影结尾时反派男主在滂沱大雨中的临终独白&#xff1a;我目睹过你们绝对不会相信的东西&#xff1a;战舰在猎户星座的边缘燃烧&…

python 获取 字典中的指定键_python中字典方法的详细教程

上篇文章讲到了python字典的基础知识&#xff0c;今天继续python中哈希(字典的应用)方法的应用。前章回顾&#xff1a;python字典的应用及案例分析字典方法&#xff1a;dict.clear() 删出字典内所有的元素。dict.copy() 返回字典的一个浅复制。dict.fromkeys(seq[,val]):创建一…

事务基本信息

一、事务的定义 事务&#xff08;Transaction&#xff09;是由一系列对系统数据进行访问与更新的操作所组成的一个程序执行逻辑单元&#xff08;Unit&#xff09;&#xff0c;侠义上的事务特质数据库事务。1&#xff09;当多个应用程序并发访问数据库时&#xff0c;事务可以在这…