Stuart Russell:智能本质和人工智能安全的巨大挑战

8b83f6f980f8d33a64b0ce3bb513afdc.png

斯图尔特·罗素(Stuart Russell),加州大学伯克利分校计算机科学专业教授,著有人工智能领域“标准教科书”——《人工智能:一种现代化方法》(与谷歌研究主管Peter Norvig合著)

来源:智能探索

随着人工智能的发展速度越来越快,Russell对这一领域的担忧不断加剧。他表示,人工智能有了很大跨越,很大程度上是因为神经网络学习算法有了质的飞跃。相关技术已经应用在Facebook的人脸识别软件,智能手机的私人助手应用,以及谷歌的自动驾驶汽车上面了。还有一个现实中的例子,根据《自然》杂志上最近刊登的一项研究成果,一个人工神经模拟网络学习玩雅达利公司的视频游戏,结果玩得竟然比人类还要好,这也引起了业界震动。“如果这发生在一个刚出生的孩子身上,你会认为,这是与生俱来的。”Russell说道。

2015年,在美国物理学会年会上,Russell接受了Quanta Magazine的采访,并谈论了智能本质和人工智能安全的巨大挑战。

您认为,人工智能的目标就是要能证明它能符合人类价值观,这意味着什么?

这么说真有点气人,这里把两件事情放在在了一起,一个是要“能证明”,另一个是“人类价值观”,它们貌似就是非常矛盾的。人类价值观本身就多少存在一些神秘,从某种程度上,我们的价值观会在行为上有所表现,你可能希望证明机器也能做出绝大多数类似的行为吧。或许,机器会有一些零碎的东西无法理解,而实际上,就连人类自己有时都不太认可彼此。不过,只要机器能够获得基本权利,你可能就会发现它们其实并不是非常有害的。你会如何着手实现这些?这个问题其实就是我现在的工作:机器需要在什么地方拥有一些近似于价值观的东西呢?重要的是,这些价值观必须是人类希望他们拥有的。我认为答案就是一种名叫“逆向强化学习”的技术。普通的强化学习是一种过程,你会根据自己的表现得到一定的奖励和惩罚,你的目标就是要识别出一些能让你获得最多奖励的行为。这就是雅达利游戏公司DQN系统正在做的事情:它给每个游戏分数,而这套系统的目标,就是要让分数变得越来越大。逆向强化学习恰恰与之相反,你会发现一些行为,然后你需要尝试搞清楚这种行为尝试最大化的那个分数是多少。举个例子,你的家用机器人看到你早上从床上爬起来,然后把一些褐色的玩意儿放进一台噪音很大的机器里磨碎,然后再把一些蒸汽、热水、牛奶和这个液体混合在一起,一饮而尽之后,精神就会变得非常好。此时,逆向强化学习技术就需要学习,这其实就是人类在清晨价值功能的一部分,因为他们需要喝咖啡。关于人类行为和行为态度,在书本、电影、互联网之外,其实存在着大量信息。因此,当涉及到人类价值时,机器需要学习的资源是非常庞大的,比如谁赢了比赛金牌,谁去坐牢,以及为什么会这样。

您是怎么进入人工智能这一领域的?

当我还在读书的时候,总体来说,人工智能还不是一种正式的学术科目。但是当时我所在的是伦敦的一家公立寄宿学校,位于圣保罗,所以我的时间没有花在打英式橄榄球上,相反,在附近的一所高校里,我学习了计算机科学A-level课程。我当时为A-level课程准备了一个项目,就是编了一个程序教自己下井字棋,或是一字棋。当时我在那里并不受到人们欢迎,因为我总是一连几个小时霸占着学校里的计算机。第二年,我写了一个国际象棋程序,同时也获得了帝国理工大学教授的许可,可以使用他们学校里的大型计算机。搞清楚计算机如何学习下棋真的太有意思了,我学到了很多今后会在书本上学到的东西。不过怎么说呢,当时我还只是把这个当作是一个爱好;因为当时我最感兴趣的学科专业是物理。我在牛津大学学习了物理学,之后当我申请读研究生的时候,也是申请了在牛津和剑桥继续攻读理论物理专业。后来我又申请了麻省理工学院,卡耐基-梅隆大学和斯坦福大学三所高校的计算机科学专业,但不幸的是,当时我错过了申请截止日期,好在斯坦福大学网开一面,于是我来到了斯坦福大学。

98a289029da0fb812e63d3ac79522931.png

在您整个职业生涯里,花了大量时间尝试理解人工智能是什么,这也是搞清楚机器会如何实现人工智能的先决条件。从中您学到了些什么?

在上世纪80年代,我进行了理论研究,当时我开始思考制定理性决策,但问题是,这个问题是不可能解决的。如果你非常理性,你可能会想:这是我目前的状态,这是我现在能做的行为,之后我可以做那些行为,接着是那些行为,再接着又是那些行为。哪条路径能确保实现我的目标呢?理性行为的定义,要求你去优化整个宇宙的未来,这靠计算是根本不可能实现的。在人工智能中,也有些事情是不可能实现的,因此我们去定义那些我们正在尝试所做的事情,其实根本没有什么意义,所以,我决定尝试搞明白:我们究竟是如何做决策的?那么,我们是怎么做的呢?这里有一个技巧,你可以去思考一个短期预测,然后再去猜测未来会是什么样子。因此,举个例子,在国际象棋程序里,如果他们非常理性,那么他们就只会走那些能确保将死对方的棋,但实际上,他们并不会这么做。他们会算一下未来要走的几步棋,然后再猜测一下,如果这么走,对于当前自己的棋局是否有帮助,最后,他们会选择走一步对自己当前棋局最为有利的一步棋。“你能证明你的系统,无论他们有多么智能,都不会重写系统内部最初由人类设置的那个目标吗?”实际上,真正需要重点考虑的另一件事情,就是在多个抽象级别里的决策问题,也就是所谓的“分层决策”。在一个人一生之中,大约要做20万亿个物理动作。举个例子,在本届大会上做一次演讲,需要作出大约13亿个物理动作。如果你是理性的,那么就会预先想好会怎么做这13亿个物理动作,显然,这非常荒谬,同样也是不可能实现的。因此,如果人们想要能够进行目标管理,就需要非常丰富的高层次抽象行为库。你走路的时候会去想,“首先我要么移动我的左脚,要么移动我的右脚,之后我要么移动…”会这样想吗?显然不会。那么你会想些什么呢?你会想“我得赶紧去艾派迪旅游公司,然后订一个航班。当我落地之后,我要打个的。”这才是人类会想的东西。在我的飞机实际落地之前,我是不会去想任何东西的,也不会去找出租车标记,或是叫车,但是当我落地之后,我会需要更多细节。基本上,这才是我们真正的生活,未来是铺开的,很多细节能够及时的靠近我们,但是很多大块、或是人生的大方向却是非常抽象的,比如“我要考博士”,“我要生孩子”等等。

目前的计算机能做分层决策吗?

这正是目前人工智能所缺失的那一部分,所有这些高级别行为都来自什么地方?我们不认为像DQN网络这样的程序可以识别行为的抽象表达。有一些游戏,DQN还不知道怎么玩儿,那些难度较高的游戏需要在原始行为表现的基础上,向前思考很多很多步,举个例子,如果一个人想,“哦!我现在需要做的,是去开门。”,而开门则需要涉及到拿钥匙,等等。如果机器没有“开门”这个行为表现,那么在这个任务上就不会有任何进展。但是,如果问题被解决(当然这几乎是不可能的),那么我们就会看到机器能力将得到极大的提升。我个人其实也不太确定,在人类级别的人工智能和计算机分层决策问题之间的主要障碍是什么。

对于人类级别人工智能的可能性,您关注的是什么?

1994年,在我首版书中有一个章节,题目叫做“如果我们成功了会怎样?”因为在我看来,对于人工智能似乎大家还没有真正思考过这个问题。或许可能因为这距离我们非常遥远,但很显然,如果人工智能获得成功,那无疑将会是一件大事,甚至会是人类历史上最重大的事件,我们需要用一种较好的方式去描述它。如果这事儿真的成了,那么我们就需要做非常多的思考,至少,要比我们现在正在思考未来会是什么样多得多。

智能爆炸的基本概念,就是一旦机器获得了一定级别的智能水平,他们就能在人工智能上工作,就像我们做的那样,同时还会提升他们自己的能力,重新设计他们自己的硬件,等等。同时,他们的智能将会破纪录般地被放大。在过去的几年里,人工智能圈子已经逐渐开始重新定义人类级别人工智能参数(这可能会是个问题),其中最令人信服的参数必须是要和价值参数有关:你构建了而一个系统,在优化效用函数上表现的非常好,但是效用函数并不是非常正确的。牛津大学哲学家Nick Bostrom写了一本书,叫做《超级智能》,他用回纹针作为例子,你说,“做些回纹针”。它就将整个星球变成一个巨大的回纹针堆积场。你构建了一个超级优化程序;你会给它什么样的效用函数呢?因为这个程序就要打算这么干了!

4601a4aacf59b5c1bf002b320a356133.png

您如何看待机器和人类价值观的差异呢?

那是个内在问题。你可以说,当有某个领域出现了价值观冲突的时候,机器应该宁可什么都不做。但这是很难实现的。我认为,我们不得不在某些价值功能的基础上构建人工智能。如果你想要一个家庭机器人,它就必须要很好地分享人类价值观的不同部分,否则它很可能会做一些非常愚蠢的事情,比如当孩子肚子饿了,并且冰箱里没有食物了,它可能就会把猫放进烤箱里做晚饭。现实生活中充满了类似的权衡,如果机器可以有一些折中的方式,那么它们在生活中就不会做出那些愚蠢的事情。

从某种意义上来说,在价值观领域里,我没有看到任何的解决方案。我同时还觉得,如果人工智能可以判断正确的人类价值观,那么可能会带来巨大的经济利益。举个例子,一旦家庭机器人做出一两次愚蠢的事情,如同前文讲的把猫放进烤箱,那么人们肯定再也不会买这种类型的机器人了。

但同时还有一个问题,如果智能系统自我表现行为符合人类价值观,那么人类就会过渡到越来越多的智能系统上面,这是否意味着人类自己的价值观要变得越来越好?还是继续表现自我?我不知道答案。

您曾经说过,我们需要通过数学验证人工智能在所有可能的环境下表现出的行为,这该怎么做呢?

人们指出的困难之一,就是一个智能系统可以武断地制造出一个全新的“自我”,而这个新智能系统的目标和原来的老智能系统也是不同的。这种场景,相比很多科幻小说作家会经常提及,在某种程度上,机器会自发地达到战胜人类的目标。所以问题来了:你能证明你的系统无论它多么智能,都永远永远不会重写自己最初由人类设置的目标吗?

证明这点还是相当容易的,正如前文所提到的DQN系统,它可以永远不去改变自己“优化游戏分数”的目标。现在,有一次网络攻击,就是人们谈论被称为“wire-heading”的网络攻击,它让你可以实际进入到雅达利游戏的控制台,手工改变屏幕上生成的分数。此时对DQN是不可行的,因为它的行为范围是完全在游戏本身之中的;它没有机器人手臂去干这种事儿。不过,如果机器在现实世界中有了行动能力,那就会带来严重的问题。因此,你能够证明你设计的系统在自身行为范围之内,永远不会改变自身机制吗?这更难证明了。

如果朝着人工智能这个方向有什么进展的话,您觉得会很有希望吗?

目前有一个新兴的行业领域,叫做“网络-实体系统”,这个系统可以将虚拟环境与真实世界进行匹配。在网络-实体系统中,你可以用一些二进制数字来代表一个空中交通管制程序,然后你可以获得一些真实的飞机,而你真正关心的是,不要发生飞机碰撞。你要试图去证明一个关于虚拟和真实世界整合的定理,此时你会怎么做呢?你会对真实世界进行非常保守的数学描述,比如飞机在这样或那样的环境下可以加速,等等,你的定理在真实世界中会是正确的,只要真实世界能够包含在你的整体行为环境之中。

但是,您已经指出,数学方法可能无法作为人工智能系统的正式验证方法?

在数学专业里有个术语,叫做“不可判定性”。在你所问到关于计算机程序的很多问题之中,其实都存在这样一个普遍的“不可判定性”问题。著名的计算机科学之父,也是人工智能之父阿兰·图灵说过,没有计算机程序能够决定是否存在任何其他可能的程序可以最终终止,并输出一个答案,或是陷入到一个无限循环之中。因此,如果你开始了一个程序,但是它自身可以重写,变成另外一个其他程序,那么就会产生问题,因为你不能证明所有其他可能的程序会让一些“所有权”满意。所以问题就是:是否有必要担心那些能够自我重写的人工智能系统的不可判定性?它们会基于现有程序,加上它们在真实世界中的经验,自我重写成一个新的程序。在下一个程序如何设计的问题上,与真实世界交互的影响范围可能性又是什么?目前,我们貌似还没有太多这方面的知识。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

5cdd0b841e20e45c2a466052c3979ec8.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482344.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

费马大定理:三百年数学圣杯的角逐

来源:和乐数学费马大定理,又被称为“费马最后的定理”。人类前赴后继挑战了三个世纪,多次震惊全世界,耗尽人类众多最杰出大脑的精力,也让千千万万业余者痴迷。费马大定理的故事与数学的历史有着千丝万缕的联系&#xf…

Django - Form和ModelForm

一. form介绍 1.生成页面可用的HTML标签 2. 提供input可以提交数据 3. 对用户提交的数据进行校验 4. 保留上次输入内容 5. 提供错误信息 二. 普通方式书写注册功能 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8">&…

人工智能,“抛弃”真实数据集?

来源&#xff1a;学术头条当前&#xff0c;人工智能技术已经应用在我们日常生活中的方方面面&#xff0c;比如人脸识别、语音识别、虚拟数字人等。但普遍存在的一个问题是&#xff0c;科研人员要想通过训练一个机器学习模型来执行某一特定任务&#xff08;比如图像分类&#xf…

Django - Cookie和Session

Django - Cookie和Session cookie Django中操作CookieCookie版登陆校验Session Django中Session相关方法Session流程解析Session版登陆验证Django中的Session配置Django - Cookie和Session cookie Cookie的由来 大家都知道HTTP协议是无状态的。 无状态的意思是每次请求都是独立…

一文说清AI智能平台

来源&#xff1a;海豚数据科学实验室有一天&#xff0c;小李的领导说&#xff1a;“我们要做AI平台&#xff01;”。虽然平台产品也不是新概念了&#xff0c;随着AI技术的成熟&#xff0c;AI平台产品也越来越多&#xff0c;但光凭做平台一句话&#xff0c;小李还是犯了难——大…

2D图像转3D仅需5秒,特斯拉的自动驾驶技术有救了?

来源&#xff1a;科技智谷编译&#xff1a;徐浩75年前&#xff0c;宝丽来相机拍摄出第一张即时照片&#xff0c;是人类第一次以逼真的二维图像快速捕捉三维世界&#xff0c;具有划时代的意义。今天&#xff0c;人工智能的研究人员正在进行相反的工作&#xff0c;力求在几秒钟的…

Django - 中间件

Django - 中间件 一. 什么是中间件 官方: 中间件是一个用来处理Django的请求和相应的框架级别的钩子, 他是一个轻量, 低级别的插件系统, 用于在全局范围内改变Django的输入和输出, 每个中间件都负责做一些特定的功能. 大白话: 中间件是帮助我们在视图函数执行之前和执行之后都可…

回答薛定谔问题: 生命是什么?自由能公式

来源&#xff1a;CreateAMind回答薛定谔的问题:自由能公式麦克斯韦詹姆斯德索莫拉姆斯泰德a,b,∗保罗本杰明巴德科克c,d,e,卡尔约翰弗里斯顿f,1加拿大魁北克蒙特利尔麦吉尔大学哲学系加拿大魁北克蒙特利尔麦吉尔大学精神病学系社会和跨文化精神病学分部c墨尔本大学心理科学学院…

AlphaCode能替代人类程序员吗?网友:被替代也挺好,这样就可以少写代码多开会了...

来源&#xff1a;AI前线作者&#xff1a;Ben Dickson译者&#xff1a;王强策划&#xff1a;冬梅本文属于我们的人工智能研究论文评论系列&#xff0c;这个系列旨在探讨人工智能领域的最新研究成果。DeepMind 是最新的人工智能研究实验室。它推出了一个可以生成软件源代码的深度…

Django - 内置admin

Django内置的Admin是对于model中对应的数据表进行增删改查提供的组件&#xff0c;使用方式有&#xff1a; Django内置的Admin是对于model中对应的数据表进行增删改查提供的组件&#xff0c;使用方式有&#xff1a;复制代码依赖APP&#xff1a;django.contrib.authdjango.contri…

Auth认证模块

Auth认证模块 本文目录 1 Auth模块是什么2 auth模块常用方法3 扩展默认的auth_user表回到目录1 Auth模块是什么 Auth模块是Django自带的用户认证模块&#xff1a; 我们在开发一个网站的时候&#xff0c;无可避免的需要设计实现网站的用户系统。此时我们需要实现包括用户注册、用…

2021年图灵奖,花落高性能计算先驱、田纳西大学教授Jack Dongarra

来源&#xff1a;智源社区“我是一个数学家&#xff0c;对我来说&#xff0c;一切都是线性代数&#xff0c;但世界也正在看到这一点,”Jack Dongarra在采访中表示。“这是我们用来建造其它东西的材料。”他说&#xff0c;机器学习和人工智能中的大多数问题都可以追溯到线性代数…

万字深度好文!视觉-语言(VL)智能:任务、表征学习和大型模型

来源&#xff1a;AI科技评论编译&#xff1a;Jocelyn编辑&#xff1a;陈彩娴本文对视觉-语言&#xff08;VL&#xff09;智能按时间顺序进行了全面调研&#xff0c;并将这一领域的发展总结为三个阶段&#xff1a;第一个阶段是2014-2018年&#xff0c;其间&#xff0c;专门的模型…

day60 BBS

BBS项目目的: 带你从头到尾把django再复习一遍 公司开发项目的流程 # 1.需求分析 客户提需求但是并不是完全按照客户需求来 产品经理和架构师开发组组长 去之前架构师和开发组组长 会提前先预想一套方案 有意识的引导客户朝着自己已经想好的解决方案上去提需求 # 2.项目设计 框…

redis笔记_源码_内存分配

文件&#xff1a;zmoalloc.h zmoalloc.c 1.求两个整数的余数 eg: 求_n对sizeof(long)的余数(_n&(sizeof(long)-1)), 性能提升为50%&#xff5e;100% 左右。 转载于:https://www.cnblogs.com/water-bear/p/11598618.html

转发,脑机接口领域又一重要成果!

来源&#xff1a;传感器技术作者&#xff1a;余淼硕士学历&#xff0c;长期从事智能传感控制、信息通信领域研究工作。“ 以脑-机交互&#xff08;BCI&#xff09;为核心的神经工程技术&#xff0c;让人类真正可以做到“心想事成”。据首都医科大学官网报道&#xff0c;首都医科…

《2022城市大脑建设标准研究报告》在京正式发布

2022年3月31号&#xff0c;《2022城市大脑建设标准研究报告》在北京正式发布&#xff0c;该报告由中国指挥与控制学会&#xff0c;中国科学院虚拟经济与数据科学研究中心&#xff0c;国家创新与发展战略研究会数字治理研究中心&#xff0c;天府大数据研究院&#xff0c;远望智库…

PHP7 ini 配置大全

来自书本<<PHP7底层源码设计与实现>> 多图警告⚠️ 转载于:https://www.cnblogs.com/wlphp/p/11600566.html

涌现:21世纪科学的统一主题

来源&#xff1a;medium.com作者&#xff1a;David Pines译者&#xff1a;郭瑞东审校&#xff1a;刘志航、梁金编辑&#xff1a;邓一雪原文题目&#xff1a;Emergence: A unifying theme for 21st century science原文链接&#xff1a;https://medium.com/sfi-30-foundations-f…

福布斯:2022年计算机视觉领域五大发展趋势

来源&#xff1a;科技日报记者&#xff1a;刘霞计算机视觉&#xff08;也被称为机器视觉&#xff09;是人工智能技术最令人兴奋的应用之一。该技术旨在“教”会计算机如何“看”世界&#xff0c;它与自然语言处理及语音识别并列为机器学习领域的三大热点方向。计算机视觉技术囊…