中国工程程院院士高文:从大数据科学到人工智能的迁移过程

概要:中国工程程院院士、北京大学教授高文应邀参加JDD京东金融全球数据探索者大会,并进行了以“探索大数据,迎接人工智能时代”为主题的演讲。

来源:亿欧


11月6日,京东举行JDD京东金融全球数据探索者大会,在全球范围内寻求志同道合的伙伴共同探索大数据和人工智能在金融领域的最佳实践。中国工程程院院士、北京大学教授高文应邀做会议演讲,演讲主题为“探索大数据,迎接人工智能时代”。


高文院士重点观点如下:


要满足三个条件,AI系统就不需要外部数据的支持。这三个条件是:集合是封闭的;规则是完备的;约束是有限的(不可以有递归)。


人工智能现在大概发展到“刚上小学”的阶段,后面还有很长的路要走,人工智能至少还有10-20年的好日子过。


人工智能的发展,还是要靠学习、靠知其所以然的研究。


一、大数据时代


我们现在这个时代确实是已经从大数据时代,移到人工智能时代。为什么这样讲呢?实际上这和大数据本身的内涵关联性比较强。我们知道大数据本身的规模越来越大,从原来的EB级正在往ZB级发展,数据本身在不停地增加,我们称为数据泛滥。这个数据泛滥包括很多,比如和零售相关有很多数据,再早一点是科学的数据,不管哪种数据都是和网络关联的,个人自媒体出来以后网络数据又非常多。


以前大家都把它叫做大数据,最近有一个讲法,大数据不是规模大,而是垃圾多的数据叫大数据,利用率低的数据。比如视频数据、网络的个人数据。大数据本身的概念越来越大,但这个数据大了以后到底怎么使用怎么发展,最近一段时间大家都深入讨论。


比如说数据是不是越大越好,是不是什么东西都一定要一个数据?回答是No。最近有一个非常好的案例,Alpha Go下围棋,以前是需要使用人类下围棋的数据,同时自己尝试了三千万局的数据,最近的Alpha Zero不需要人类对弈数据了,自己会生产数据。现在我们就可以提问,什么样的情况不需要外部数据,自己生产数据就够了?我和有些专家讨论,觉得,什么样的AI系统不需要外部数据就可以战胜人,实际上就是满足三个条件:


1、集合是封闭的,不管你是状态集还是什么集,你的集合是封闭的,我们知道围棋集合是封闭的。


2、规则是完备的。也就是说下棋什么地方能下,什么地方不能下,这个规则是完全完备的,不能随便更改。


3、约束是有限的,也就是说你在约束条件下,不可以递规,因为有了递规之后往下推延就停不下来,而有限的时候就能停下来。满足这三个条件,不需要外部数据,系统自己产生数据就够了。所以可以想见,今后有很多的情况你去判断这个人和机器最后谁能赢,满足这三个条件机器一定赢,不管德扑、围棋,类似的情况很多了。


是不是所有的情况都是这样?当然不是。你可以看现在很多的交易、物流、零售,其实它有很多的条件一直在变,不满足刚才的条件,这时候你需要很多外部的数据。有外部数据就够了?当然不是,外部数据怎么用?它自己不会去产生一个用法,这个用法需要人,需要通过人工智能这些手段去用这些数据。所以人工智能实际上就是从大数据科学到人工智能,非常自然的迁移过程。


二、人工智能时代


  • 人工智能发展阶段


最近人工智能非常热,热到每一个人,每一个投资人都说我要投人工智能或者我要干人工智能,这件事好不好呢?不知道。但我们可以看看历史,以史为鉴,可以知道很多事情,人工智能发展到去年刚好是60年。我们看看60年的发展实际上是经历了三个阶段:


第一个阶段20年,1956年到1976年。第二个阶段,从1976到2006年,30年,2006年是第三波浪潮刚刚开始,它会持续多长时间?不知道,可能25年,可能35年,也可能是40年。当然按照20、30,下面到底是40年、30年甚至60年都不知道。但你知道这个规律就应该知道人工智能绝不是已经把所有的事情做完了,如果用人的一生来比喻,人工智能其实现在大概刚上小学,有的还不到小学,所以现在它的历程可能只是1/10,后面有很长的路可走。


在人工智能路上有很多关键人物不能忘记,图灵不能忘记,计算机领域特别重要的一个奖图灵奖,其他学科有诺贝尔奖,诺贝尔时代没有计算机,后来有了计算机以后,大家就想计算机界也应该设一个和诺贝尔奖相当的奖,这个奖就是图灵奖,现在全世界一共65个人得了一个图灵奖,姚期智教授,是华人当中唯一得到图灵奖的。


在人工智能领域得到图灵奖的一共8位,马文·明斯基(1969),约翰·麦卡锡(1971),艾伦·纽厄尔(1975),赫伯特·西蒙(1975),爱德华·费根(1994),拉吉·瑞迪(1994),莱斯利·瓦伦特(2010),犹大·伯尔(2011)。整个计算机科学领域,人工智能实际上是插在宝塔尖的1/8。莱斯利·瓦伦特,犹大·伯尔,后面这两位是2010年和2011年获奖,都是和概率推理、概率学习、因果学习有关的两个学者。


总体来说,人工智能到现在有三个主要的代表性的学派,哪三个呢?


第一个是用逻辑的方法做人工智能,通常我们把它叫做逻辑主义学派,或者叫做符号主义学派。


第二个是以连接主义为基本工具,就是用神经元网络,今天的深度学习就是它一个典型的代表


第三个学派,从搞控制论的人,比较主张的一个学派,更多的是做这种自适应和进化、计算。这三个学派里各有千秋,不能说哪个好哪个坏。


什么叫人工智能?我们今后可能就是人类智能和人工智能的一个对决,其实人工智能是人类智能的一个计算机的实现,从对决的角度,它永远不可能超过人类智能,只是说在某一个特定的方面它可能胜出,但从智能本身它没办法胜出。我们看看智能的定义,其实智能有很多方面,包括逻辑能力,语言能力、空间能力、感知能力,包括音乐感知的能力,肢体的控制能力。后面这几个是比较难的,包括人的内省、自我反省,包括人际关系的能力,包括自然探索的能力,比如发现一些新的东西,完全没有任何线索,你能想出我要做这个,我把这个问题解决掉。自然探索的能力,包括图像、图形的感知能力。


其实智能分为这九个能力,而现在的人工智能在这九个方面只有三个做的还可以,有六个方面还相当的远,所以我们说现在的人工智能要想挑战人类智能,路还很长。


为什么我们说人工智能60年呢?因为1956年当时有一个里程碑式的会议,达特茅斯会议。当时人工智能这几个元老还很年轻,他们集聚到一起开了两个月的会,讨论怎么样让机器具有人的智能、定出了人工智能的最终目标以及什么叫人工智能。现在看起来1956年定义的人工智能的白皮书,到现在一点都不过时。所以我们说年轻人还是非常厉害的,三四十岁的年轻人,在计算机刚刚兴起的时候,连人工智能概念都还没有,他们就提出来我们要怎么做这个东西,这是非常了不起的一件事,现在看起来确实他们做的是对的。


这次会议开了以后,全世界很多学校都开始跨入到人工智能热潮当中,典型的像斯坦福大学、CMU、MIT、哈佛大学很多人都在做相关的这些研究,那个阶段大家采用的技术手段,主要是逻辑主义或者符号主义。


什么叫逻辑或者符号呢?实际上就是他认为一切的推理,我都可以用逻辑演算的方式来实现,我只要定义了整个逻辑演算的体系,做一个规则,就可以完成任何事,可以进行推理、数学证明,可以创作、奏乐等等。其实我们小学就学过代数运算,逻辑也是一种运算,但它不是用的代数运算,而是布尔运算,和代数运算非常接近。有了这个运算就可以对它进行推理,推理你要使用一个工具,他们使用了演绎推理的工具。


我们知道到现在为止,最主要的自然科学的定理使用的都是演绎推理的方式来完成的。比如说亚里士多德的三段论体系就是非常典型的演绎推理,欧几里得的几何学也是用这样完成的,牛顿力学,麦克斯韦、爱因斯坦全都是用演绎定理推出来的。


所有演绎推理的基础是满足三段论方程,什么叫三段论,我有一个大前提,这是一个一般的原理,我有一个小前提是我要研究的特殊情况,根据大前提、小前提得到一个结论,这个结论是根据一般情况,对特殊情况做出一个判断,这就完成了演绎推理,这就叫三段演绎推理。


所有的基础逻辑的方法都是这样做的,为了做这个当时设计了很多的人工智能语言,用这种语言可以写人工智能的方程,机器就可以去证明。


当然这听起来很好,而且第一次浪潮,大家都认为十年之内人工智能一定可以完成很多事,但一直到1976年前后,大家发现一开始定的那么高调的东西绝大多数都实现不了,加上当时有人落井下石。1973年有一个英国人发了一个报告,给AI拨一大盆冷水。


他把AI研究分三类系统,A是指自动机、B是机器人、C为中央神经系统。自动机和中央神经系统研究是有价值的,但进展太慢;机器人的研究毫无价值,而且非常令人失望,所以他建议把所有的机器人研究都取消掉;A和C因为它本身令人失望,所以也是非常低调。这个报告出来以后各国政府全部都把对人工智能投入的经费砍掉,马上就进入了严冬。所以1976年实际上是人工智能第一次的严冬的到来。


1976年之后尽管没有经费,但学者的可爱之处是给钱也做,不给钱也做。因为做逻辑的,前面已经把自己的体量拉的很大。当时做神经网络的,基本上没有得到什么钱,所以本身就是教授带几个学生在那玩,这个领域虽然面临寒冬了,但对他来讲没有变化,反正盛夏的时候没有钱,寒冬的时候还是没钱,所以带着学生继续玩。


这一玩玩出花样来,1976年开始有很多做神经元网络的,不停的写东西、发东西,一直到1986年出来一个让人眼睛一亮的东西,这个东西叫BP算法(即误差反传网络)。以往的神经元网络只能做非常小的事,做不了大事。但这个东西出来以后可以做大事了,所以就推动了这个领域发展的速度非常快。


但它也只能解决一些问题。一开始人们也是期待要解决很多问题,但遥遥无期,到最后又来了第二次的低谷,包括日本第五代机的失败,当时在斯坦福大学要建一个知识百科全书的项目都失败了,使得第二次人工智能又跌入了低谷。


第三次是从2006年开始的,现在是人工智能的三个大牛,一位在多伦多大学Geoffrey Hinton,一位在蒙特利尔大学Yoshua Bingeo,一位在纽约大学Yann LeCun,这一年分别发表了三篇文章在讲一件事。这个文章出来了以后,当时大家并不知道这个东西要怎么用,这个东西被谁给激活了?李凯和李飞飞做的ImageNet,主要操刀是李飞飞做的。


ImageNet是一个全球的图像识别比赛,在2012年以前都是用常规的方法,2012年开始有一个参赛队用了这个方法,比别的队错误率马上降低了一半。到2013年其它方法全部退出,全都是深度学习,2014年不停地改进。所以可以看出2015年的时候错误率已经降的非常多,深度学习的网络也非常多。到2016年的时候几乎做到不光人没法比,错误率已经低到不需要再做了,所以李飞飞选择2017年宣布这个比赛停止,不再做了,因为其实已经没有太大促进意义了。

所以今天的第三轮,由于深度学习,由于刚才所说的产业界的热情参与,我们产生了很多新的企业,有很多新的机遇,这是非常好的事。


  • 人工智能发展机遇


在这个机遇下国家干了什么?国家有一个中国人工智能2.0的发展战略研究,这是中国工程院一起来搞的,今年发布了一个重大研究计划,这里面主要是做五个关键技术和一批应用。(12月14日,亿欧将在北京举办2017AI产业应用峰会,科技部撰写《中国人工智能2.0规划编制》的专家李修全博士将出席现场。)


这五个关键技术,包括大数据智能,这和前面讲的大数据关联性非常强。第二个方面是群体智能,依靠群体的力量推进智能的研究。第三个是跨媒体智能,要把声音、图像、文字、自然语言所有这些东西联结在一起来研究智能,这是跨媒体智能未来所希望达到的目标。第四个是人机混合增强智能,人和机器混合起来怎么样让智能更高能力更强。第五个是自主智能系统,其实就是无人机。我们有五个支柱,上面是应用,下面是基础支撑。


那么这样一个轮廓,在国家战略上来说已经进行了非常圆满的布局,这个是不是够了?其实还不是。如果看整个人工智能学科的轮廓,包括计算机视觉、语言识别、自然语言、人机交互、机器人学习等等这样的方向,这些方面目前大的布局是沉浸到应用这个方面。


涉及到人的九类智能,我们在逻辑语言文字和图形图像来说现在已经做的相当不错,中间六类还是有相当的距离需要探索。


总结一下,历史总是这样螺旋前进的,人工智能的三次浪潮也是从符号主义到连接主义。这个符号主义到现在为止已经有30多年比较寂寞了,但它作为人类智能的一个高等抽象,应该是发挥作用的,所以怎么发挥作用,这个是未来大家可以慢慢观察。


连接主义,就是神经元网络、深度学习,目前是非常大行其道的,但怎么样解决小数据甚至没有数据的学习?实际还是有相当大的挑战,特别是很多的学习结果是不可解释的,这是最大的挑战。行为主义是注重自适应和进化,这是从人从猴子演化过来,它可能更接近。它怎么样在学习方面做得更好,还是需要探索。


不管是企业、国家投资,大家利用好天时地利要好好干一场。我想人工智能肯定至少还有10年到20年左右的好日子过,大家珍惜这个机会。当然人工智能既然是一个少年,少年主要的成长靠什么?靠学习,靠知其所以然的学习的研究,中国下一代人工智能也会在这个方面进行一些布局,知道今后的方向,也许对在座各位会有点帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498282.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2017全球硬科技创新大会今日开幕 科技大腕聚集共绘西安“硬科技”发展蓝图

概要:2017全球硬科技创新大会今天在西安开幕。 来源:中国科技网 科技大腕聚集共绘西安“硬科技”发展蓝图 2017全球硬科技创新大会今天在西安开幕。本次大会参会人数超过5000人,其中有诺贝尔奖获得者、国内外相关领域院士专家、科技企业领袖、…

c语言能实现帧动画吗,CSS3 animation属性中的steps实现GIF动图(逐帧动画)

相信 animation 大家都用过很多,知道是 CSS3做动画用的。而我自己就只会在 X/Y轴 上做位移旋转,使用 animation-timing-function 规定动画的速度曲线,常用到的 贝塞尔曲线。但是这些动画效果都是连续性的。今天发现个新功能 animation-timing…

Sorenson Capital:值得投资的 5 种 AI 技术

概要:身为投资者的你,如果看好AI和机器学习的前景,又该在AI公司遍地开花的市场中,选择什么样的公司进行投资? 来源:36Kr 值得投资的机器学习和人工智能的应用有哪些? 人工智能、神经网络、机器…

这个重量级产业,中国正在爆发!

来源:全球新论坛 概要:中国在汽车领域和先进国家差距很大,但是我们至少做了一件对的事情,在中国销售的车辆都是在中国制造。 集成电路产业是中国产业升级的重中之重,我们都知道汽车是人类第一大工业,中国在…

AI论文引用排行榜丨微软第一,清华第九;Alphabet董事长看AI:美国仅领先5年,大陆追赶速度快;

来源:集微网 概要:根据The Verge报导,Schmidt表示,美国在AI人工智慧领域落后的风险相当高,他预测未来5年美国还有领先的实力,但之后大陆追上来的速度会非常快。 1.AI论文引用排行榜:微软第一,清华第九; 日经…

MIT 的新型开源系统 Taco 将数据分析速度提升 100 倍 !(附论文)

来源:全球人工智能 概要:麻省理工学院(MIT)开发的一种新型计算机系统为涉及“稀疏张量”(sparse tensor)的计算加快了速度,稀疏张量是主要由0组成的多维数据数组。 麻省理工学院&#xff08…

android动态设置文本居中显示图片,Android DrawableTextView图片文字居中显示实例

在我们开发中,TextView设置Android:drawableLeft一定使用的非常多,但Drawable和Text同时居中显示可能不好控制,有没有好的办法解决呢?小编的方案是通过自定义TextView实现。实现的效果图:注:第一行为原生Te…

洪小文:以科学的方式赤裸裸地剖析AI(二)|从寒冬到复兴

来源:微软研究院AI头条 概要:1956年,在达特茅斯会议之后,包括很多国家政府,美国国家科学基金会、军方,大家满怀希望投了很多钱。但是到1975年以后发生了几件事情,让AI进入了寒冬。 谈AI的历史&a…

ios android分享代码,快速插入代码块——iOS Android

昨天看到一篇分享插入代码块的文章 Xcode 快速开发 代码块,想到把我知道的其它方案也分享一下iOS篇这种方案可行,但效率不够高方案二:DashDash 目前只有 macOS 版本,免费,但有限制(会有时间延时,可以付费取…

重磅!腾讯发布AI生态计划将赋能1000合作伙伴!

来源: 腾讯科技 概要:11月8日,腾讯2017全球合作伙伴大会,在“创想人工智能”论坛上,腾讯披露了人工智能的整体布局,以及在众多研究领域的最新技术进展与应用探索。 11月8日,腾讯2017全球合作伙伴…

重磅:ATT的《5G移动边缘计算白皮书》!

来源:5G 概要:今天(11月8日),AT&T宣布,其正在硅谷建设MEC(移动边缘计算)测试外场。 精彩报告

android 6.0 adb,安卓6.0,adb停用系统更新

集各路大神的方法,汇总一下。1、下载adb工具包2、进入开发者选项,打开“手机打开USB调试”,手机上确认允许电脑usb调试。3、手机上断开wifi和移动网络,应用管理里找到系统更新-存储-删除数据,再退出进入系统更新。4、电…

GoogleNet是怎么理解图像的?谷歌大神教你读懂「神经特征可视化」

来源:雷克世界 编译:嗯~阿童木呀 概要:特征可视化使我们能够看到在ImageNet数据集上训练的GoogLeNet是如何构建对多层图像的理解的。 边缘(层 conv2d0) 纹理(层 mixed3a) 模式(层 mi…

android studio云测,Android studio 下的robotium自动化测试和持续集成

【背景介绍】Android Studio 是一个Android开发环境,基于IntelliJ IDEA. 类似 Eclipse ADT,Android Studio 提供了集成的 Android 开发工具用于开发和调试。作为官方主推的开发环境和停止对其他开发IDE的支持,Android Studio将成为今后唯一的…

博通收购高通12张PPT深度解析!

来源:国际电子商情 概要:11月6日,博通官方发出公告,宣布将以每股60美元现金,另加10美元公司股票收购高通全部流通股,交易总价值达到1300亿美元。 高通昨日证实已收到了博通公司发出的主动收购提议&#xf…

华为鸿蒙显示安卓,被谷歌除名,华为6月2日发布鸿蒙反击,开机界面已流出!...

前几天谷歌发布了Android 12的公测版更新名单,小米、OV、一加、索尼、三星等赫然在列,唯独没有华为!这是一件很明显的事情,谷歌已经把华为从安卓系统中“除名”,华为现在要做产品也不得不自力更生了。作为对谷歌除名的…

腾讯AI战略详解:技术社会与创新图景 | 2017互联网科技创新白皮书重磅首发

来源:腾讯研究院 概要:11月8日上午,以“开放创想”为主题的2017腾讯全球合作伙伴大会在成都开幕。 11月8日上午,以“开放创想”为主题的2017腾讯全球合作伙伴大会在成都开幕,来自全球的350位国内外顶级大咖、500家主流…

腾讯「AI In All」的背后,是开放AI技术能力,探索腾讯应用场景

来源:灯塔大数据 概要:过去一年中,我们听到不少公司在谈到未来的时候都会谈到一个词,叫做「All In AI」,腾讯在 AI 方面的战略也用一个词概括,那就是「AI In All」。 「过去一年中,我们听到不少…

AI时代,企业如何利用机器学习技术驱动业务发展?

来源:全球人工智能 概要:在过去的这些年,为了构建基础设施,数据社区专注于聚集和收集数据,并使用数据来改进决策。 为了成为一个机器学习公司,你需要工具和流程去克服数据、工程和模型方面的挑战。 在过去…

自动移动文字html,css怎么移动文字?

css怎么移动文字?下面本篇文章给大家介绍一下方法。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。css怎么移动文字?首先可以用个容器来包住文字,给宽和高。然后,可以使用多种方法来移动…