2017年6月21日至22日,腾讯·云+未来峰会在深圳举行。人工智能领域的世界级泰斗迈克尔·欧文·乔丹(Michael I.Jordan)进行了主题为“机器学习:创新视角,直面挑战”的演讲,与大家分享他对人工智能的未来与挑战的见解。
迈克尔·乔丹:
大家早上好!很荣幸受邀来到这里。我是一名人工智能和统计学方面的研究者,今天我非常高兴来到这里,好像大家都非常地了解我,我也非常高兴能够和腾讯这样顶尖的公司合作,能够分享我们对于未来的发展趋势的预见。
我们要非常清晰地了解,哪些技术是会出现的,哪些是不可能存在的,而哪些是我们现在所存在的问题,以及未来我们会看到什么样的技术的发展。这就是我今天这个演讲的主要内容,就是标题所说的“创新视角,直面挑战”。
简单回顾一下到底人工智能是如何发展成现在这样的
首先我们简单回顾一下到底人工智能是如何发展成现在这样的。
“人工智能”这个说法是上世纪60年代第一次出现的。那时候我们说要造一个机器人,让它可以和人一样思考,跟人一起互动,加入到人的世界当中来。那个时候大部分人工智能的电影向大家展示的是机器人最终进入到人的世界中,那时候很多的研究也都是关于视觉系统、语音系统,寄希望于这些技术就能够让机器人越来越像一个人。
“IA”(Intelligence Augmentation),智能增强
但是在80年代、90年代以来出现了另外一个趋势,这个趋势对我们来说也是非常重要的,我们叫做“IA”(Intelligence Augmentation),也就是智能增强技术。搜索引擎就是这种技术的体现,我们可以靠搜索引擎中获得关于这个世界的各种知识而不用背在脑子里,比如中国最长的河流是什么,法国首都是什么,只要在搜索引擎中打字就可以获得答案。所以人类的智能得到了增强。还有语言方面的技术,电脑可以通过自然语言处理做语言转换,我说的是英语,但是说其它语言的人也能用自己的语言听到我的表达。我们可以看到这些技术目前正在发展,而机器帮助我们有了更好的存储能力,更好的沟通、交流的能力。
“II”(Intelligent Infrastructure),智能基础设施
还有一个部分是 “II”(Intelligent Infrastructure),也就是智能基础设施,这对我们来说是最重要的。现在我们的交通和金融行业,在我们身边的每一个行业、每一个模块,现在都出现了智能化的趋势,我们也发现世界更了解我们了,能够根据我们的需求提供服务。所以在我们前方是有一个系统的,如果你要说云的话,这个系统就是云,这个云变得更加智能。我们沟通的对象不是机器人,而是这个云的架构和云的基础设施在和我们沟通。
现在有一个问题是,之前我们大部分的研发都是智能机器人、掌握自然语言方面的,但是这些技术和IA以及II所需要的技术迥然不同。所以,现在我们在建立基础智能设施的的时候就会遇到很多新问题,在腾讯也是如此。
比如,我们要对相关的大型的设施做出相应的决定,比如说我们要做一个金融系统、交通系统,或者向人类提供医疗决策的时候,一个单独的机器人如果要仅仅根据周围的信息做决策是很不好的,有时候机器了解的信息是不够的,一个机器做出的决策往往是不对的,它没办法意识到我们周围环境的变化。如果说单个机器人犯错了以后还可以自我学习更正,但是如果这种事情大规模地发生,那就是危险的。
如何分享竞争性的数据
以及,我们应该如何分享竞争性的数据呢?我们可以看到模型训练技术的发展,可以用数据帮助业务的发展。但是这些数据都是停留在各个公司内部的,他们怕别人也有了这样的数据以后就会有竞争优势,但是这并不是最好的做法。如果能把信息进行分享,比如说诈骗信息,每个公司都能看到危险的一小部分,然后我们一起不断地把问题进行整合,就可以让问题进行更好的解决,同时大家也不会失去竞争力,每个人都可以从中获益。但目前从技术和思维的角度来说还没有办法完全解决
云和终端设备互动
然后有这个云和终端设备互动的问题,到底我们的知识在哪里?知识是在每个地方不同重复的,在每个地方会出现不重叠性,以及在发展中不同的问题会得到不同的答案。所以我们如何在数据之间取得协调,既包括在云端,也包括在终端上时得到相应的解答,这是很难做到的。
我们在公平、质量和多样性之间如何取舍,我们现在还没什么办法能够同时达成这三者。我们现有的系统只能满足一种某一种取向,有多种取向的情况就无能为力。
安全
还有一个问题是安全问题。假如大批量的系统受到攻击,如果我们不进行处理,它们就无法正常工作,这是比较大的问题,这是我们要重视的。这些都不是小问题,都是大问题,这就是我对智能的一个想法。
从人工智能的角度来看,我们看看哪些是可能的,哪些是不可能的
下面回到我们的机器人、智能发展,包括从人工智能的角度来看,我们看看哪些是可能的,哪些是不可能的。
机器视觉
我们看到机器视觉,在过去几年,我们已经可以通过摄像头对场景中的物体进行识别,但是它还是没有办法能够像我们清晰的了解到所有的情况,就像我在这里站在台上,大家在台下,或者了解到所有人的注意力在哪里,让人工智能系统完全理解语义很难,我们现在还不知道要怎么才能做到。我们现在可以把语音转化成文字,文字也可以转换成语音,在各种语言上都可以实现,但是我们的机器人还没办法帮我们了解听觉、视觉之后的真正的意义。
自然语言处理
还有一点就是自然语言的处理,我们可以看到到目前为止,自然语言的处理得结果还没有达到我们需要的发展,我们现在有大量的语言的翻译,但是大部分的语言和语句因为没有办法得到有效的语义的阐述,没办法让我们的受众了解到这个语义的意思,有时候我们问问题仅仅能了解部分的答案,而不能了解全部的答案。
对机器人来说也是如此,我们看到世界上有很多工业可编程的机器人,他们也在和我们沟通,但是它们没办法了解到我们的环境、处境以及我们的情绪。如果我们都觉得机器智能以后将会无处不在的话,其实这是不太可能的。
机器人没有办法了解和处理抽象思维
对于我们来说,在过去几年的发展,特别是在机器人的发展上,我们的机器人还只是一个雏形,之后可能会出现一些有效的对话,特别是像这样一个自我导识的机器也会出现,但是智能方面它目前还是比较有限的。我相信在未来,短期内不会出现太多的像人这样的灵活性和可变化性。也许机器可以了解一些事实,它们看上去非常有知识,但是它们没法真正得到人这样一种高级智能,甚至像小孩一样的高级智能,它没有办法了解抽象思维,没有办法进行抽象的处理,机器人还不能实现这方面的能力。这些机器人就像小孩一样,他们知道一些非常棒的现实,他们知道每条河流、每个国家,但是它们仍然没有很高的智能进行人的抗衡,所以在这方面,我们还是很难看到“超越人类的人工智能”出现,这个技术可能要很多年的发展才能够出现。我相信我们真正要关注的不仅仅只是这样一种技术的发展,毕竟我觉得我们这代人身上还看不到这种高水平的人工智能的出现。
人工智能还没有办法进行抽象、识别语义
但是除此之外,虽然人工智能还没有办法进行抽象、识别语义,但是计算机的计算能力不是要比人的大脑高出很多吗?机器人以及人工智能可以帮助我们大批次的处理数据,能够通过数据了解未来一些事件的走向,同时能够保证我们的数据结果不断地提高,可以发现一些人类发现不了的事情。但是它们没办法像人类同一样地理解这些洞见,当面对各种信息的时候也无法分辨哪些是真的。所以这个机器人并没有办法实现像人一样的能力,假设让一个机器人做公司的CEO,那它没有办法引领这个公司的发展,在我们这代人身上,在机器上还没能力做出这样的决定
我们到底应该关注什么,应该担心什么呢?
我们到底应该关注什么,应该担心什么呢?
担心高度类人化的人工智能的发现
如果我们担心这种高度类人化的人工智能的发现,我们应该关注,我们所谓的人工智能看上去很智能,但是它并非如此。比如说在医疗行业中,我们让机器做很多的医学诊断,这是不太可能的,有很多人会因为这种不畅的诊断,可能会剂量出现问题,特别是结果间有冲突的情况下,如果出现任何问题,这个机器没有办法做出有效的诊断,我们的病人都有可能去世。
关注机器人可能会造成大量的工作的流失
与此同时,我们要关注机器人可能会造成大量的工作的流失,以及许多人因为丢了工作没有办法得到收入。在过去我们可以看到工业的发展,在七八十年代都是如此,但是在过去50年中,人们在不断地调整,现在我们可以看到未来10到20年,人们没有机会更多的调整,机器人会取代更多的人,获得更多的工作。
恶意使用人工智能
同时它还可以帮助现有的智能设备的发展,在世界上也有很多人会恶意使用人工智能的系统。如果出现人工智能系统的误用,我相信也会有问题。机器人本身是没有任何恶意要伤害人类的,只是使用这些及其人的人本身含有恶意。
未来人工智能的发展
在这里我特别要和大家谈到近期机器学习方面一些比较大的挑战,我相信这些挑战都是我们大家已经意识到的,但是现在还没有解决,如果我们能够确保未来要建立起一个人工智能的系统,我们必须要解决这些问题,否则没有办法保证未来人工智能的发展。
设计一个系统
首先是我们必须要设计一个系统,这个系统可以带来有意义的经过校准以后的信息,能够应对一些不确定性,比如说在医疗行业,还有在策略规划的角度,如果你是公司的CEO,你必须要清楚地了解到,一种做法和另外一种做法之间的差别,你不可能只有一个做法。与此同时,我们还要保证我们的系统能够真正地解释它们自己所做出的决策,如果机器做出了一个决定,我们必须要让机器向我们阐释为什么做这样的决定,是否还有其它的潜在方法。还有我们要找到问题发生的原因。
另外我们要找到一个系统,这个系统可以实现长期目标的追溯,同时可以主动的收集在实现目标相关的数据。
实时
还有一点是实时,我们可以看到很多的数据和机器需要花几天、几个小时来学习这些数据,但是到目前为止,我们的机器学习方面还没有办法能够达到真正的实时操作。
意外情况下怎么办
还有在意外情况下怎么办,还有在外部事件上的连接,包括数据和其他的要求,需要和政府的合作,和法律部门、和社会科学家的合作。
以上这些就是我们正在努力解决的技术挑战,虽然不一定都能完全解决,但它们需要我们的关注。我们做AI,或者做计算机视觉,并不是为了赢下来一些对人类的比赛就好,我们需要像工程师一样解决一些问题。
更难的大规模的挑战
还有一些大规模的挑战,这对我们来讲是更难的。
语义方面
比如说在语义方面,现在世界中有什么、未来在世界中会发生什么,需要有能够理解这个世界的概念。我们在机器学习上,我们讲的更多的是表面的东西,我们需要了解真正的世界上需要什么。我们需要能够理解上下文的机器人。现在的机器人了解我们的一些情况,但是它们不清楚我们的过去,也没办法深刻地理解我们。一段时间过去以后我们就会觉得厌倦,我们不想要这样的互动或者交互。
云端和终端的互动
然后有云端和终端的互动问题,这也是挑战非常大的。如果把数据放到云上,你需要关注成本、加载速度的问题。同时你还要考虑现实的情况,有时候云和终端的距离太远,云和终端获取到的信息有区别,就有可能会做出错误的决定,所以我们现在需要有更好的方案。
不确定性
当然还有不确定性,这也是人类的一个非常重要的特点,围棋比赛其实并不是一个很好的例子,因为你知道棋盘上的东西,但是人的生活有很多不确定性,比如说我不知道今天会发生什么事情,我不知道将来会发生什么,这就是所谓人的一生,这和围棋是不一样的。这样的问题需要从更深层次才可能改善。
总结
最后总结一下。我很高兴来到这里和大家讲人工智能,我也期待着看大家在AI方面会做什么,看看其它企业会做什么。我们需要一起合作,我觉得这相当于3000年以前,两个人一起来建立合作,大家去建大桥、建房子。大家都很兴奋,大家一同带来了新的发展,同时也会面临一些灾难,大楼可能会倒闭等等,因为他们当时没有什么科学。然后我们一起创建了土建工程,与全世界分享这些知识。这些知识指导着我们实践,我们由此建立了自洽的体系,那么全世界不同的地方都会用共通的方式去建造,因为已经证明了这是可信任的,它不会再垮塌。
但是人工智能的发展还没有达到这一步,现在还没有建立这样完善的体系。这需要付出几十年的努力,所以我们需要一起合作,共同认真思考怎么解决这些挑战。
参考文献
人工智能泰斗迈克尔·乔丹分享机器学习要义:创新视角,直面挑战