人工智能泰斗迈克尔·乔丹分享机器学习要义:创新视角,直面挑战


2017年6月21日至22日,腾讯·云+未来峰会在深圳举行。人工智能领域的世界级泰斗迈克尔·欧文·乔丹(Michael I.Jordan)进行了主题为“机器学习:创新视角,直面挑战”的演讲,与大家分享他对人工智能的未来与挑战的见解。

迈克尔·乔丹:

大家早上好!很荣幸受邀来到这里。我是一名人工智能和统计学方面的研究者,今天我非常高兴来到这里,好像大家都非常地了解我,我也非常高兴能够和腾讯这样顶尖的公司合作,能够分享我们对于未来的发展趋势的预见。

我们要非常清晰地了解,哪些技术是会出现的,哪些是不可能存在的,而哪些是我们现在所存在的问题,以及未来我们会看到什么样的技术的发展。这就是我今天这个演讲的主要内容,就是标题所说的“创新视角,直面挑战”

这里写图片描述


简单回顾一下到底人工智能是如何发展成现在这样的


首先我们简单回顾一下到底人工智能是如何发展成现在这样的。

“人工智能”这个说法是上世纪60年代第一次出现的。那时候我们说要造一个机器人,让它可以和人一样思考,跟人一起互动,加入到人的世界当中来。那个时候大部分人工智能的电影向大家展示的是机器人最终进入到人的世界中,那时候很多的研究也都是关于视觉系统、语音系统,寄希望于这些技术就能够让机器人越来越像一个人。

“IA”(Intelligence Augmentation),智能增强

但是在80年代、90年代以来出现了另外一个趋势,这个趋势对我们来说也是非常重要的,我们叫做“IA”(Intelligence Augmentation),也就是智能增强技术。搜索引擎就是这种技术的体现,我们可以靠搜索引擎中获得关于这个世界的各种知识而不用背在脑子里,比如中国最长的河流是什么,法国首都是什么,只要在搜索引擎中打字就可以获得答案。所以人类的智能得到了增强。还有语言方面的技术,电脑可以通过自然语言处理做语言转换,我说的是英语,但是说其它语言的人也能用自己的语言听到我的表达。我们可以看到这些技术目前正在发展,而机器帮助我们有了更好的存储能力,更好的沟通、交流的能力。

“II”(Intelligent Infrastructure),智能基础设施

还有一个部分是 “II”(Intelligent Infrastructure),也就是智能基础设施,这对我们来说是最重要的。现在我们的交通和金融行业,在我们身边的每一个行业、每一个模块,现在都出现了智能化的趋势,我们也发现世界更了解我们了,能够根据我们的需求提供服务。所以在我们前方是有一个系统的,如果你要说云的话,这个系统就是云,这个云变得更加智能。我们沟通的对象不是机器人,而是这个云的架构和云的基础设施在和我们沟通。

现在有一个问题是,之前我们大部分的研发都是智能机器人、掌握自然语言方面的,但是这些技术和IA以及II所需要的技术迥然不同。所以,现在我们在建立基础智能设施的的时候就会遇到很多新问题,在腾讯也是如此。

比如,我们要对相关的大型的设施做出相应的决定,比如说我们要做一个金融系统、交通系统,或者向人类提供医疗决策的时候,一个单独的机器人如果要仅仅根据周围的信息做决策是很不好的,有时候机器了解的信息是不够的,一个机器做出的决策往往是不对的,它没办法意识到我们周围环境的变化。如果说单个机器人犯错了以后还可以自我学习更正,但是如果这种事情大规模地发生,那就是危险的。

如何分享竞争性的数据

以及,我们应该如何分享竞争性的数据呢?我们可以看到模型训练技术的发展,可以用数据帮助业务的发展。但是这些数据都是停留在各个公司内部的,他们怕别人也有了这样的数据以后就会有竞争优势,但是这并不是最好的做法。如果能把信息进行分享,比如说诈骗信息,每个公司都能看到危险的一小部分,然后我们一起不断地把问题进行整合,就可以让问题进行更好的解决,同时大家也不会失去竞争力,每个人都可以从中获益。但目前从技术和思维的角度来说还没有办法完全解决

云和终端设备互动

然后有这个云和终端设备互动的问题,到底我们的知识在哪里?知识是在每个地方不同重复的,在每个地方会出现不重叠性,以及在发展中不同的问题会得到不同的答案。所以我们如何在数据之间取得协调,既包括在云端,也包括在终端上时得到相应的解答,这是很难做到的。

我们在公平、质量和多样性之间如何取舍,我们现在还没什么办法能够同时达成这三者。我们现有的系统只能满足一种某一种取向,有多种取向的情况就无能为力。

安全

还有一个问题是安全问题。假如大批量的系统受到攻击,如果我们不进行处理,它们就无法正常工作,这是比较大的问题,这是我们要重视的。这些都不是小问题,都是大问题,这就是我对智能的一个想法。

这里写图片描述

这里写图片描述

这里写图片描述


从人工智能的角度来看,我们看看哪些是可能的,哪些是不可能的


下面回到我们的机器人、智能发展,包括从人工智能的角度来看,我们看看哪些是可能的,哪些是不可能的。

机器视觉

我们看到机器视觉,在过去几年,我们已经可以通过摄像头对场景中的物体进行识别,但是它还是没有办法能够像我们清晰的了解到所有的情况,就像我在这里站在台上,大家在台下,或者了解到所有人的注意力在哪里,让人工智能系统完全理解语义很难,我们现在还不知道要怎么才能做到。我们现在可以把语音转化成文字,文字也可以转换成语音,在各种语言上都可以实现,但是我们的机器人还没办法帮我们了解听觉、视觉之后的真正的意义。

自然语言处理

还有一点就是自然语言的处理,我们可以看到到目前为止,自然语言的处理得结果还没有达到我们需要的发展,我们现在有大量的语言的翻译,但是大部分的语言和语句因为没有办法得到有效的语义的阐述,没办法让我们的受众了解到这个语义的意思,有时候我们问问题仅仅能了解部分的答案,而不能了解全部的答案。

对机器人来说也是如此,我们看到世界上有很多工业可编程的机器人,他们也在和我们沟通,但是它们没办法了解到我们的环境、处境以及我们的情绪。如果我们都觉得机器智能以后将会无处不在的话,其实这是不太可能的。

机器人没有办法了解和处理抽象思维

对于我们来说,在过去几年的发展,特别是在机器人的发展上,我们的机器人还只是一个雏形,之后可能会出现一些有效的对话,特别是像这样一个自我导识的机器也会出现,但是智能方面它目前还是比较有限的。我相信在未来,短期内不会出现太多的像人这样的灵活性和可变化性。也许机器可以了解一些事实,它们看上去非常有知识,但是它们没法真正得到人这样一种高级智能,甚至像小孩一样的高级智能,它没有办法了解抽象思维,没有办法进行抽象的处理,机器人还不能实现这方面的能力。这些机器人就像小孩一样,他们知道一些非常棒的现实,他们知道每条河流、每个国家,但是它们仍然没有很高的智能进行人的抗衡,所以在这方面,我们还是很难看到“超越人类的人工智能”出现,这个技术可能要很多年的发展才能够出现。我相信我们真正要关注的不仅仅只是这样一种技术的发展,毕竟我觉得我们这代人身上还看不到这种高水平的人工智能的出现。

人工智能还没有办法进行抽象、识别语义

但是除此之外,虽然人工智能还没有办法进行抽象、识别语义,但是计算机的计算能力不是要比人的大脑高出很多吗?机器人以及人工智能可以帮助我们大批次的处理数据,能够通过数据了解未来一些事件的走向,同时能够保证我们的数据结果不断地提高,可以发现一些人类发现不了的事情。但是它们没办法像人类同一样地理解这些洞见,当面对各种信息的时候也无法分辨哪些是真的。所以这个机器人并没有办法实现像人一样的能力,假设让一个机器人做公司的CEO,那它没有办法引领这个公司的发展,在我们这代人身上,在机器上还没能力做出这样的决定

这里写图片描述


我们到底应该关注什么,应该担心什么呢?


我们到底应该关注什么,应该担心什么呢?

担心高度类人化的人工智能的发现

如果我们担心这种高度类人化的人工智能的发现,我们应该关注,我们所谓的人工智能看上去很智能,但是它并非如此。比如说在医疗行业中,我们让机器做很多的医学诊断,这是不太可能的,有很多人会因为这种不畅的诊断,可能会剂量出现问题,特别是结果间有冲突的情况下,如果出现任何问题,这个机器没有办法做出有效的诊断,我们的病人都有可能去世。

关注机器人可能会造成大量的工作的流失

与此同时,我们要关注机器人可能会造成大量的工作的流失,以及许多人因为丢了工作没有办法得到收入。在过去我们可以看到工业的发展,在七八十年代都是如此,但是在过去50年中,人们在不断地调整,现在我们可以看到未来10到20年,人们没有机会更多的调整,机器人会取代更多的人,获得更多的工作。

恶意使用人工智能

同时它还可以帮助现有的智能设备的发展,在世界上也有很多人会恶意使用人工智能的系统。如果出现人工智能系统的误用,我相信也会有问题。机器人本身是没有任何恶意要伤害人类的,只是使用这些及其人的人本身含有恶意。

这里写图片描述


未来人工智能的发展


在这里我特别要和大家谈到近期机器学习方面一些比较大的挑战,我相信这些挑战都是我们大家已经意识到的,但是现在还没有解决,如果我们能够确保未来要建立起一个人工智能的系统,我们必须要解决这些问题,否则没有办法保证未来人工智能的发展。

设计一个系统

首先是我们必须要设计一个系统,这个系统可以带来有意义的经过校准以后的信息,能够应对一些不确定性,比如说在医疗行业,还有在策略规划的角度,如果你是公司的CEO,你必须要清楚地了解到,一种做法和另外一种做法之间的差别,你不可能只有一个做法。与此同时,我们还要保证我们的系统能够真正地解释它们自己所做出的决策,如果机器做出了一个决定,我们必须要让机器向我们阐释为什么做这样的决定,是否还有其它的潜在方法。还有我们要找到问题发生的原因。

另外我们要找到一个系统,这个系统可以实现长期目标的追溯,同时可以主动的收集在实现目标相关的数据。

实时

还有一点是实时,我们可以看到很多的数据和机器需要花几天、几个小时来学习这些数据,但是到目前为止,我们的机器学习方面还没有办法能够达到真正的实时操作。

意外情况下怎么办

还有在意外情况下怎么办,还有在外部事件上的连接,包括数据和其他的要求,需要和政府的合作,和法律部门、和社会科学家的合作。

以上这些就是我们正在努力解决的技术挑战,虽然不一定都能完全解决,但它们需要我们的关注。我们做AI,或者做计算机视觉,并不是为了赢下来一些对人类的比赛就好,我们需要像工程师一样解决一些问题。

这里写图片描述


更难的大规模的挑战


还有一些大规模的挑战,这对我们来讲是更难的。

语义方面

比如说在语义方面,现在世界中有什么、未来在世界中会发生什么,需要有能够理解这个世界的概念。我们在机器学习上,我们讲的更多的是表面的东西,我们需要了解真正的世界上需要什么。我们需要能够理解上下文的机器人。现在的机器人了解我们的一些情况,但是它们不清楚我们的过去,也没办法深刻地理解我们。一段时间过去以后我们就会觉得厌倦,我们不想要这样的互动或者交互。

云端和终端的互动

然后有云端和终端的互动问题,这也是挑战非常大的。如果把数据放到云上,你需要关注成本、加载速度的问题。同时你还要考虑现实的情况,有时候云和终端的距离太远,云和终端获取到的信息有区别,就有可能会做出错误的决定,所以我们现在需要有更好的方案。

不确定性

当然还有不确定性,这也是人类的一个非常重要的特点,围棋比赛其实并不是一个很好的例子,因为你知道棋盘上的东西,但是人的生活有很多不确定性,比如说我不知道今天会发生什么事情,我不知道将来会发生什么,这就是所谓人的一生,这和围棋是不一样的。这样的问题需要从更深层次才可能改善。

这里写图片描述


总结


最后总结一下。我很高兴来到这里和大家讲人工智能,我也期待着看大家在AI方面会做什么,看看其它企业会做什么。我们需要一起合作,我觉得这相当于3000年以前,两个人一起来建立合作,大家去建大桥、建房子。大家都很兴奋,大家一同带来了新的发展,同时也会面临一些灾难,大楼可能会倒闭等等,因为他们当时没有什么科学。然后我们一起创建了土建工程,与全世界分享这些知识。这些知识指导着我们实践,我们由此建立了自洽的体系,那么全世界不同的地方都会用共通的方式去建造,因为已经证明了这是可信任的,它不会再垮塌。

但是人工智能的发展还没有达到这一步,现在还没有建立这样完善的体系。这需要付出几十年的努力,所以我们需要一起合作,共同认真思考怎么解决这些挑战。

这里写图片描述


参考文献


人工智能泰斗迈克尔·乔丹分享机器学习要义:创新视角,直面挑战

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/246815.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Tensorflow官方文档---起步 MNIST示例

Tensorflow •使用图 (graph) 来表示计算任务. • 在被称之为 会话 (Session) 的上下文 (context) 中执行图. • 使用 tensor 表示数据. • 通过 变量 (Variable) 维护状态. • 使用 feed 和 fetch 可以为任意的操作(arbitrary operation) 赋值或者从其中获取数据 综述 Ten…

Git 版本管理

相关文章 版本管理 github访问太慢解决方案 Material for git workshop GitHub秘籍 安装-Git版本管理 Git官网安装说明 Linux 系统安装 # 如果你的 Linux 是 Ubuntu: $ sudo apt-get install git-all# 如果你的 Linux 是 Fedora: $ sudo yum install git-all 如果是其他…

tensorflow:Multiple GPUs

深度学习theano/tensorflow多显卡多人使用问题集 tensorflow中使用指定的GPU及GPU显存 Using GPUs petewarden/tensorflow_makefile tf_gpu_manager/manager.py 多GPU运行Deep Learning 和 并行Deep Learning(待续) Multiple GPUs 1. 终端执行程序…

Tensorflow一些常用基本概念与函数

参考文献 Tensorflow一些常用基本概念与函数 http://www.cnblogs.com/wuzhitj/archive/2017/03.html Tensorflow笔记:常用函数说明: http://blog.csdn.net/u014595019/article/details/52805444 Tensorflow一些常用基本概念与函数(1&#…

ubuntu16.04 Nvidia 显卡的风扇调速及startx的后果

问题描述 #查看nvdia GPU 显卡状态 watch -n 10 nvidia-smi 发现显卡Tesla k40c的温度已经达到74,转速仅仅只有49%。 查看Tesla产品资料,Tesla K40 工作站加速卡规格 ,可知 所以需要调整风扇速度来降温。 然而官方驱动面板里也没有了风扇调…

Python函数式编程-map()、zip()、filter()、reduce()、lambda()

三个函数比较类似,都是应用于序列的内置函数。常见的序列包括list、tuple、str map函数 map函数会根据提供的函数对指定序列做映射。 map函数的定义: map(function, sequence[, sequence, ...]) -> list map()函数接收两个参数,一个是函…

Kaggle : Using a Convolutional Neural Network for classifying Cats vs Dogs

数据下载 https://www.kaggle.com/c/dogs-vs-cats-redux-kernels-edition/data Part 1 - Preprocessing #Package Requirements #!/usr/bin/python2 # -*- coding: UTF-8 -*- import cv2 # working with, mainly resizing, images import numpy as np …

李宏毅机器学习课程1~~~Introduction Regression

机器学习介绍 机器学习就是要找一个函数。 机器学习的三大要素框架:训练集,函数集(模型集),损失函数集。 机器学习图谱 AI训练师的成长之路。 1. 梯度下降法的理解Gradient Descent 参数变化的方向就是损失函数减少的方…

李宏毅机器学习课程2~~~误差从哪里来?

Stanford机器学习—第六讲. 怎样选择机器学习方法、系统 误差来源 误差主要来自于偏差和方差。 数学上定义: 通过covariate X 预测 Y ,我们假设存在如下关系: Y f(X) ϵ 满足正态分布均值为0 方差σϵ 模型预测错误定义为: …

李宏毅机器学习课程3~~~梯度下降法

梯度下降法描述 梯度下降法是为了找到最优的目标函数,寻找的过程就是沿着损失函数下降的方向来确定参数变化的方向。参数更新的过程就是一个不断迭代的过程,每次更新参数学到的函数都会使得误差损失越来越小,也就是说学习到的参数函数越来越逼…

李宏毅机器学习课程4~~~分类:概率生成模型

分类问题用回归来解决? 当有右图所示的点时,这些点会大幅改变分类线的位置。这时候就会导致整体的回归结果变差。当把多分类当成回归问题,类别分别为1,2,3,4……,因为回归的问题是预测具体的值,这样定义类别…

李宏毅机器学习课程5~~~分类:逻辑回归

Function Set 不同的w,b来确定不同的函数,这样就组成了函数集合,不同的w,b可以来表达不同的分布函数。 Good of a Function 变换表达形式 两个Bernoulli distribution的交叉熵。所谓交叉熵,是用来刻画两个分布的相似性…

李宏毅机器学习课程6~~~深度学习入门

深度学习历史 深度学习经典步骤 神经网络的符合标记含义 Wij 代表的是从神经元j到神经元i,这样写的目的是便于表达,否则最后的表达式子就是Wij的转置,细节见下面。 每个神经元的偏执值组成一个向量b 单个神…

李宏毅机器学习课程7~~~反向传播

到底为什么基于反向传播的纯监督学习在过去表现不佳?Geoffrey Hinton总结了目前发现的四个方面问题: 带标签的数据集很小,只有现在的千分之一. 计算性能很慢,只有现在的百万分之一. 权重的初始化方式笨拙. 使用了错误的非线性模型…

李宏毅机器学习课程8~~~keras

keras keras示例 确定网络结构 确定损失函数 确定训练网络参数 batchsize与运算时间,平行运算,可以缩简运算时间。batchsize不能太大,这是由于内存的关系。此外,batchsize太大容易陷入局部极值点或者鞍点。batchsize=&…

李宏毅机器学习课程9~~~深度学习技巧

Recipe of Deep Learning Overfitting overfitting的判断是要训练误差与测试误差做比较。这个56-layer的网络在训练集上都没有训练好,说白了就是有点欠拟合。所以仅仅依靠测试集上的结果来判断56-layer比20-layer overfitting是不合理的。 更多理解见 Overfitting…

Liner(分段线性插值)

第一次写微博,记录自己的学习历程~~~~欢迎大家一起探讨~~~~ 分段线性插值故名思议就是说把给定样本点的区间分成多个不同区间,记为[xi,xi1],在每个区间上的一次线性方程为: 关于其证明: 分段线性插值在速度和误差取得…

在linux设置回收站 - 防止失误操作造成数据清空,并定期清理

安装trash sudo apt-get install trash-chi 原理 执行trash命令后,是将文件移动了用户的回收站,每个用户的回收站路径为$HOME/.local/share/Trash,比如用户asin的回收站位于/home/asin/.local/share/Trash,用户root的回收站位于…

Spline(三次样条插值)

关于三次样条插值,计算方法比较复杂,但是静下心来仔细研究也是可以理解的。 本文借鉴文章来源:http://www.cnki.com.cn/Article/CJFDTotal-BGZD200611035.htm 定义: 简单来说就是给定了一些在区间[a,b]的数据点{x1,x2,x3.....xn…

李宏毅机器学习课程10~~~卷积神经网络

卷积的意义 数字图像是一个二维的离散信号,对数字图像做卷积操作其实就是利用卷积核(卷积模板)在图像上滑动,将图像点上的像素灰度值与对应的卷积核上的数值相乘,然后将所有相乘后的值相加作为卷积核中间像素对应的图像…