周志华:深度学习理论探讨比应用滞后太多

来源: 网易科技

摘要:深度学习的理论探讨比应用滞后好几个数量级,一方面是做应用马上能见效,然后会有很多人尝试。另一个方面是做理论研究门槛相对比较高,像今天做深度学习很多企业应用的人,里面有很多现有的深度学习开发工具,这使得一个有比较好基础的程序员可能经过半个月训练就可以用这样的工具做很多应用了。


南京大学教授周志华在与深鉴科技联合创始人汪玉对话时表示,深度学习的理论探讨比应用滞后了“好几个量级”。


周志华在谈及人工智能近期的热潮时表示,这是源于机器学习在过去15年里取得了飞速进展,而机器学习的实质就是人类希望通过计算机来寻找出数据中所包含的规律;周志华认为,目前深度学习的优势在于能更好地发挥出数据的作用,而且目前深度模型多是基于神经网络,这就能更方便快捷地利用上新增加的能力,但同时深度学习模型的理论基础不是特别扎实,“很多时候它到底怎样能做得更好是在靠尝试,而不是有一个很清楚的理论告诉我们该怎么做、不该怎么做,这是它的弱点。”他认为,深度学习的理论探讨比应用滞后了“好几个量级”。


周志华认为,机器学习里有很多其他技术的优点正好可以弥补深度神经网络的弱点,而它这些技术的弱点又可能是深度神经网络的优点,机器学习如果能够借鉴神经网络的成功而把弱点克服掉,这将带来更大的技术进步。


在谈及人工智能是否会造成人类失业时,周志华表示,现在的职业流失是必然的,人工智能的技术应用可以看成是一次新的技术革命,“每次技术革命如果不能破除一些传统职业,那就不是真正的革命。”


不过,他认为人工智能是在帮助人类把一些繁重的智力劳动缓解出来,一些重复性强的智力劳动职业可能会受到影响,但一定也会产生新的行业,“对于从业者来说要不断学习,就像原来拉拖车的工人,如果你没有学习怎样开卡车,碰到的处境可能是不太好的,但如果及时跟进、及时学习开卡车了,我想你的职业前途一片光明。”


以下是对话节选(有删减):


汪玉:请周老师给大家介绍一下您现在在做哪方面人工智能的研究?


周志华:人工智能是一个非常广的领域,我本人做机器学习方面的研究,实际上这一轮人工智能的热潮就是因为机器学习在过去15年里取得了飞速进展。大家可能听到“深度学习”这个词更多,深度学习实际上是机器学习里的子领域,机器学习到底在做什么?简单地说,如果大家手上有很多数据,并认为数据中包含了一些规律,这个规律人并不是很明确地知道,希望通过计算机算法、利用计算机辅助帮你把规律找出来,后面用到分析数据得到规律的算法就是机器学习的研究对象。我们就是研究怎样设计、分析和应用,从数据里产生模型、规律算法的这么一个学科。


汪玉:您已经做了很多年的机器学习方面的研究,您能不能从历史发展的角度给大家解释一下为什么人工智能突然就起来了,当然刚才从您的角度说,这其实是一个很长的积累过程,能不能给大家分享一下这个历史?


周志华:其实整个人工智能的发展在我看来大概经历过三个阶段:第一个阶段,大家可能知道1956年美国达特摩斯会议,当时Joma(音)召集了很多年轻人一起讨论,最早大家觉得我们只要把逻辑推理做出来就能做很好的事情了,后来发现光有逻辑推理还不够,要有知识,人工智能第二阶段就是研究知识工程。再后来发现获取知识非常困难,就想能不能自动获取知识,然后就开始研究机器学习。


机器学习作为学科进入这个舞台其实是在80年代初,那时候大家就做了很多事,但离真正解决我们现实应用里的问题还有一定距离,后来又经过二十多年的耕耘,到2010年左右很多应用领域的人回头一看才发现机器学习领域的人已经给他们准备好了应用工具。


其实机器学习的发展本身是很漫长的过程,过去五六年里我们看到人工智能很多应用爆炸式地出来,其实是因为过去二十年我们积累了很多技术,这些技术在不同领域发挥它的作用。


汪玉:现在工业界应用比较广泛,您觉得深度学习大家一般说得比较多一点,深度学习自身有什么好处和不好吗?


周志华:今天我们说的深度学习是一种非常复杂的模型,当我们有了很大的数据之后它能够更好地发挥数据的作用,所以这是它好的方面。


另外一个好的方面,今天我们的深度模型很多是基于神经网络的,神经网络模型有一个很好的优点,就是它能够很容易利用上新增加的能力。


汪玉老师是做硬件的,知道深度神经网络热潮背后很重要的推手其实是我们可以用GPU对深度神经网络进行加速,这是它两个非常大的优势。


但在另一方面现在深度学习模型的理论基础不是特别好,所以很多时候它到底怎样能做得更好是在靠尝试,而不是有一个很清楚的理论告诉我们该怎么做、不该怎么做,这是它的弱点。


实际机器学习里还有很多别的技术,它们的优点可能正好是深度神经网络的弱点,而它们的弱点又可能是深度神经网络的优点,机器学习往下发展,如果能够借鉴神经网络成功的性质,而把它的弱点克服掉,这会带来更大的技术进步,当然这里面有很多困难的问题。


汪玉:既然您说到了深度学习缺乏,现在理论研究还比较初步,大家都在努力做,这块您觉得有希望吗?其实我自己对这件事情也很好奇。


周志华:我觉得希望当然是有的,深度学习的理论探讨比应用滞后好几个数量级,一方面是做应用马上能见效,然后会有很多人尝试。另一个方面是做理论研究门槛相对比较高,像今天做深度学习很多企业应用的人,里面有很多现有的深度学习开发工具,这使得一个有比较好基础的程序员可能经过半个月训练就可以用这样的工具做很多应用了。


汪玉:这样会催生一个大的产业,“深度学习网络训练者培训”。


周志华:是,这应该是一个行业。我想表达的是,用这样的技术去做应用上手相对比较快,所以很多人去做。


另一方面,做理论可能要经过好多年的培养和很艰苦的学习才能有做理论分析的能力,而现在有这么一个状态,我们在深度神经网络尝试出很多新的改进,但做理论的人不够多,所以没办法对这些进展一一分析,这是它滞后的一个很重要的原因。


二是因为现在深度神经网络改进得太多了,大家从不同方面去走,做理论的人少,而做一个问题需要很长时间,他要想到底该做哪个分析才是最重要的,而这一点我们今天恰恰看不到。


因为我们看不到深度学习、深度神经网络里有哪一种技术、哪一种做法是真正Dominet(音)的,是大家一定要用的,当一些东西比较成形之后可能做理论才能跟得上去。


汪玉:理论跟不上去已经成为一个状态了,这种状态的出现对于应用本身有什么风险?


周志华:这里面其实有很大的风险,我们做这件事情现在看起来很成功,但你可能不知道它未知的缺陷到底在什么地方,只有我们在理论上搞清楚之后你才可能知道它最坏情况下大概会怎么样,有些时候你要避免它产生最坏的情况,可能要做一些额外的控制,而今天基本上等于我们做这件事看到了它好的方面,但它坏的时候会坏起来怎么样,怎么样会导致它最坏,完全不清楚,所以理论方面一定要加强,我也希望呼吁更多年轻人不要为短期应用里取得的成效迷住眼睛,要做一些有长远影响的工作,希望去考虑一些基础的、理论的重要的问题。


汪玉:这是非常重要的问题,在未来如果从行业角度慢慢把深度学习、机器学习里的很多技术用起来时,怎样能培养更多同学和未来的黏性人看这背后到底是什么样的机理,我们不说美国,在中国目前的大环境下有哪些举措是可以做的,能够推动人工智能,应用的研究大家都去做了,背后理论研究的推手从哪几个层面能做一些事情?


周志华:我想第一个能做的就像今天访谈一样推动倡导呼吁年轻同学们考虑这样的问题。第二,今天有很多企业都在挖人工智能方面的学生,在挖人工智能方面的人才,大家希望很快挖一个人来就能让一件事情见效,但有更长远考虑的企业能不能在人工智能研究的基础方面有更多考虑,这样对做这方面事情的年轻人有更多支持,很简单,现在的年轻人如果用一些深度神经网络的工具,马上可以在企业里拿到很高的薪水,但如果要让他沉下心来做一些很基础本质的问题,可能有很长时间是非常清苦的,这就造成年轻人不太愿意做这种非常深的研究。


但从长远来看,当人工智能过去二十年积累的技术红利被吃完之后,如果在本源上没有进一步往前走,这个“水”是不能长期持续下去的,我也希望有企业能支持更基础的人工智能的研究。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498319.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

李飞飞最新演讲全文:机器已能“看懂”图像和视频,但我们仍站在人工智能研究的起点

来源: 科研圈 摘要:AI 不仅仅能够精准辨认物体,还能够理解图片内容、甚至能根据一张图片写一小段文章,还能“看懂”视频...... 所以无论我们在讨论动物智能还是机器智能,视觉是非常重要的基石。世界上所存在的这些系统…

matlab控制realsense,RealSense开发学习--1.初识RealSense

RealSense3D实感技术是Intel研发的一项新的技术。这项技术利用摄像头,红外投影传感设备及红外捕捉设备获取外界的深度信息,彩色视频信息以及其它信息。并基于此完成获取深度图像,彩色图像,手势识别,面部识别&#xff0…

微软Azure Stack混合云进入中国

来源: 微软科技 摘要:Azure Stack是Azure的延伸,能够将Azure云计算的灵活性和快节奏的技术创新带到混合云环境,在满足混合云部署的多样化需求的同时,推进企业业务的数字化转型。 2017年11月1日,北京 —— …

中科院等发布《2017研究前沿》 中国25个前沿表现卓越 居全球第二

来源:科学网 概要:中科院作为国家战略科技力量,作为首批国家高端智库建设试点单位,服务国家科技发展的宏观决策,把握世界科技发展大势,研判科技发展的战略方向。 11月2日上午,中国科学院科技战…

python开学吧真假,开学第一课,课课有总结

记得大学毕业论文最后,我写了一首打油诗,里面有一句“晨光熹微亦堪盼”,而今天,便是晨光熹微之时。今天的学业笔记如下:1、python是一门语言,是人与计算机进行沟通的介质;2、编程就是程序员把自…

阿尔法元并未否定AI需要“人类师父”

来源:中国科学报 概要:阿尔法元无师自通、零基础“自学成才”,果真如此吗?答案显然是否定的。 10月19日,《自然》杂志刊登了谷歌DeepMind团队新成果,一个名为AlphaZero(阿尔法元)的机…

经济民族主义的前夜?普华永道思略特全球创新1000强解读

来源:亿欧 概要:普华永道旗下咨询机构思略特发布2017年度全球创新企业1000强榜单,研发支出超过160亿美元的亚马逊成为全球研发支出最多的企业。 上周,普华永道旗下咨询机构思略特发布2017年度全球创新企业1000强榜单,研…

oracle sha2,SHA2算法支持列表

按照国际标准,全球信任的CA在2016年1月1日起必须停止签发SHA1签名算法的各种证书,要求各个CA尽快升级PKI/CA系统,支持用户可选择申请SHA1证书还是SHA2证书。沃通CA为了响应谷歌浏览器的提前修改用户界面警告SHA1证书的出现的问题,…

芯片史上最大收购案!「博通」拟斥资1000亿美元收购「高通」

来源:海外创投 概要:高通今日美股开盘55美元,新闻被曝光后,高通股价在今日盘中最高涨幅一度达到19%,最终以以61.81美元的价格收盘,上涨13%。 高通今日美股开盘55美元,新闻被曝光后&a…

人工智能时代:互联网推动制造业升级的四大方向

来源: 腾讯研究院 概要:事实上制造业的问题,这几年已经成为全球性话题引起越来越多国家的重视。其中以美国和德国为代表,较早意识到这场由互联网点燃的数字化革命的意义,不仅在于消费市场,更应该为国家的经…

全球 35 大开源公司都在这里!

来源:全球人工智能 概要:如果你认为开源软件主要是业余爱好者和单枪匹马的开发人员的杰作,那你的看法完全落伍了。虽然独立开发人员仍是开源社区的重要组成部分,但如今开源项目的大部分工作由企业开发人员完成。 这些公司在开发和…

linux 进程 命令 cat,Linux cat命令详解

cat主要有三大功能:1.一次显示整个文件:cat filename2.从键盘创建一个文件:cat > filename 只能创建新文件,不能编辑已有文件.3.将几个文件合并为一个文件:cat file1 file2 > file常用的命令展示特殊用法:增加多行内容,EOF必须成对出现…

谷歌大脑最新研究:不用「训练」!高斯过程「超越」随机梯度下降

来源:雷克世界 编译:嗯~阿童木呀、多啦A亮 概要:近年来,深度神经网络作为一种灵活的参数模型,以能够适应复杂的数据模式而著称。 可以这样说,一个具有独立同分布(independent identically distr…

Facebook最新对抗学习研究:无需「平行语料库」完成「无监督」机器翻译

来源:雷克世界 编译:嗯~阿童木呀、多啦A亮 概要:得益于最近在深度学习方面取得的进展以及大规模平行语料库的可用性,现如今,机器翻译已经在多个语言对上取得了令人印象深刻的表现。 相信大家都知道,最近在机…

结合脑成像技术与人工智能,破除自杀的“诅咒”

来源:36氪 概要:近日发表的一项研究,介绍了一种通过人工智能与脑成像技术结合的方法来预测自杀倾向的方法。在初步的试验中,准确率达到了91%。 自杀已经成为了一个公共健康领域的“诅咒”,正在夺取越来越多的生命。在很…

Linux软件安装部署文档,MetaQ安装部署文档

一.MetaQ安装部署情况:地点IPBroker IDMaster/SlaveSlave ID:Group合肥192.168.52.231Slave1:meta-slave-group-hf北京192.168.51.331Master/广州192.168.70.1571Slave2:meta-slave-group-gz二.MetaQ安装1. 前提已有安装了ZooKeeper的机器&am…

美媒:中关村取代硅谷获评全球最大科技中心

来源:澎湃 概要:北京被评为2017年度全球最大科技城市第一名,中关村已取代硅谷成为全球最大的科技中心。 美媒称,一份最新报告显示,北京被评为2017年度全球最大科技城市第一名,中关村已取代硅谷成为全球最大…

linux 和服务通讯,Android 的Activity和Service之间的通信

在Android中Activity负责前台界面展示,service负责后台的需要长期运行的任务。Activity和Service之间的通信主要由IBinder负责。在需要和Service通信的Activity中实现ServiceConnection接口,并且实现其中的onServiceConnected和onServiceDisconnected方法…

【MLA首日报告摘要】周志华、马毅等教授分享机器学习最新进展

来源:专知 概要:第15届中国机器学习及其应用研讨会今天11月4日在北京交通大学举行,海内外从事机器学习及相关领域研究的10余位专家与会进行学术交流。 第15届中国机器学习及其应用研讨会今天11月4日在北京交通大学举行,海内外从事…

埃森哲5G智慧城市报告:美国GDP将狂增5千亿

来源:智东西 概要:第五代通信技术将不仅仅带来网速的提高(eMBB),更意味着可靠的低延时(uRLLC)海量物联网(mMTC)。 5G被认为是万物互联的开始。第五代通信技术将不仅仅带来…