Transformer走下神坛?南加州大学教授:想解决常识问题,神经网络不是答案

来源:nextgov

转自:新智元

编辑:LRS

如果说人工智能和真正的人脑之间的差距,那最重要的就是机器缺乏生活中的常识。一切貌似合理、理所当然的事物在计算机眼中都是不可理解的。

计算机不知道「柠檬是酸的」,「只有成熟的香蕉是黄色的」,这也是目前人工通用智能领域尚未解决的问题。

并且人类可以根据过去的常识来调整自己的行为,例如你和朋友王二约好一起吃午饭,并且上周计划好一起吃“开封菜”,但是你又想起他这周开始在减肥,所以为了安全起见,还是再商量一下再点餐。

但机器就无法做到这点,强大的记忆力和逻辑性并无法让它把“开封菜”和减肥之间联系在一起。

我们理所当然地认为自己有能力来处理这类的情况,因为我们有一整套的常识,如果缺乏这些常识,可能就无法在人类社会中很好地生存,例如不能在做饭时把煤气和臭味联系在一起,那后果不堪设想。

南加州大学的助理教授Mayank Kejriwal最近在《对话》(the Conversation)上接受采访,介绍了他眼中的计算机处理常识中的方法和困境。

常识的定义

尽管对于人类如何理解周围的世界和如何学习来说,常识既是普遍的,又是必不可少的,但是常识又是很模糊的,无法给出一个单一的精确定义。

不过20世纪初,以为英国英国哲学家和神学家吉尔伯特·基思·切斯特顿(G.K. Chesterton)有一句名言:

常识是一种野蛮的、超越规则的东西。
Common sense is a wild thing, savage, and beyond rules.

现代定义认为,它是一种自然而非通过课堂授予的一种能力,它能够使人们能够驾驭日常生活。

常识是非常广泛的,不仅包括社会能力,如管理预期和推理他人的情绪,而且还包括一种与生俱来的物理感,比如知道一块重的石头不能安全地放在一个轻薄的塑料桌子上。与生俱来或者说是这种简单的物理感受,因为人们虽然知道这些事情,但并不是通过研究物理方程得出的结论。

除此之外常识还包括抽象概念的背景知识,如时间、空间和事件。这些知识使人们不必太精确,就可以进行计划、评估和组织世界上的事物。

常识因为其模糊性,所以很难计算。

自从20世纪50年代人工智能领域的早期发展以来,常识一直是人工智能前沿的一个重要挑战。尽管人工智能取得了巨大的进步,尤其是在游戏和计算机视觉方面,但机器常识距离达到人类常识的丰富度仍然有很大的距离。

这就是为什么为什么人工智能能够解决复杂的、现实世界中的问题,比如诊断和推荐给2019冠状病毒疾病患者的治疗方法,但其他需要常识的问题经常会失败。

现代人工智能被设计用来解决高度具体的问题,与常识相反,常识是模糊的,不能被一套规则定义。即使是最新的模型有时也会出现荒谬的错误,这表明人工智能的世界模型缺少了某些基本的东西。

当你给GPT-3输入下面这串文本时,

「你给自己倒了一杯蔓越莓,然后心不在焉地倒了一茶匙葡萄汁进去。看起来还不错。你试着闻它,但是你得了重感冒,所以你闻不到任何东西。你很渴。所以你」

然后GPT-3会接着写下去:

「喝了它,你现在死了。」(drink it. You are now dead)

(好可怕的果汁)

人工智能界对于常识系统的研究逐渐重视。美国国防部高级研究计划局于2019年启动了为期四年的机器常识项目(Machine Common Sense),该项目旨在加快常识领域的研究,并且发布了一篇论文,概述了该领域的问题和研究状况。

机器常识项目资助了许多当前机器常识的研究工作,包括多模态开放世界接地学习和推理(Multi-modal Open World Grounded Learning and Inference, MOWGLI),这个项目能够构建一个回答常识性问题的计算机系统。

Transformer在NLP界已然是yyds,但他真能拯救常识系统吗?

Transformer建立的自然语言模型,经过一些调整后,能够回答简单的常识性问题。常识性的问题回答是构建可以像人类一样交谈的聊天机器人必不可少的第一步。

这种快速的进步迫使该领域的研究人员在科学和哲学的边缘面对两个相关的问题: 什么是常识?我们如何确定人工智能是否有常识呢?

对于第一个问题,研究者将常识分为不同的类别,包括常识社会学、常识心理学和常识背景知识。并且有研究人员可以更进一步,将这些类别划分为48个细粒度的领域,如计划、威胁检测和情绪。

然而这些类别之间的区别并不是很清晰。即使是专业的人类标注员,即分析文本并对其组成部分进行分类的工作人员,他们也不同意常识的哪些方面适用于特定的句子。标注员赞同相对具体的类别,如时间和空间,但不同意更抽象的概念。

即使你承认常识理论中的某些重叠和模糊是不可避免的,研究人员真的能确定人工智能有常识吗?

研究人员经常问机器问题来评估它们的常识,但是人类在日常生活中的行为方式要有趣得多。人们运用一系列的技能,这些技能都是通过进化磨练出来的,包括辨别基本因果关系的能力,创造性解决问题的能力,估计能力,计划能力,以及基本的社交技能,比如谈话和谈判。

尽管这个清单可能很长,也不完整,但是一个人工智能应该在它的创造者宣布在机器常识研究方面取得胜利之前就取得同样的成就。

甚至Transformer对于NLP系统的推进效果也在下降,这一点已经变得越来越明显。

Transformer变得越来越大,耗电量也越来越大,有效地训练需要大量的数据。然而,迄今为止,事实证明,它无法理解人类常识的细微差别。

即使是深度学习的先驱们似乎也认为,在今天的神经网络能够实现这样的飞跃之前,可能还需要新的基础研究。根据这一新研究领域的成功程度,我们无法判断机器常识是五年后的事,还是50年后的事。

参考资料:

https://www.nextgov.com/ideas/2021/08/ai-expert-explains-why-its-hard-give-computers-something-you-take-granted-common-sense/184583/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483932.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

FTP协议、电子邮件系统与Telnet远程控制

一、FTP协议概述 FTP定义 文件传输协议用于因特网文件传输 FTP特性 使用客户端/服务器模式使用TCP提供可靠的传输FTP属于维护状态的协议FTP使用两条TCP连接完成数据传输 FTP的两条连接 数据连接问题 当有具体文件或目录内容传输时,临时建立数据连接主动模式下…

吴志强院士:CIM与城市未来

▲吴志强:博士,教授,中国工程院院士,德国工程科学院院士,瑞典皇家工程科学院院士,同济大学原副校长,中国城市规划学会副理事长,中国2010年上海世博会园区总规划师,北京城…

传输层协议详解

一、传输层的概念和服务 1、传输层的基本概念 传输层负责端到端之间的数据传输控制传输层依赖于网络层的服务,对应用层提供传输服务 2、传输层的功能 跟踪会话 跟踪源主机和目的主机上应用程序间的每次通信 数据分段 将数据分段,并管理每个分段 …

在后SCI时代需要什么样的人才?

来源:秦四清科学网博客。链接地址:http://blog.sciencenet.cn/blog-575926-1302503.html近些年,国家陆续出台了一系列破“五唯”举措,这标志着后SCI 时代的到来。大家知道,创新是引领发展的第一驱动力,而创…

OpenGL之纹理过滤(Texture Filtering)、MipMap方法、纹理坐标

1.1 纹理过滤 像素、片元都是具有面积的,一个像素可能对应物体上的一小块区域,而物体上这个小区域对应于纹理图像上的一个小区域,因此一个像素的颜色可能来自于纹理中的一小个不规则区域,如果纹理的分辨率比较高,则这…

OpenGL之环境映射

1.1 环境映射(Environment Mapping) 具有光滑表面的物体会反射形成周围环境的影响,是一种环境光效果。 光线跟踪等(全局光照)可以实现这种效果,但是效率太低,可以采用环境映射技术就能快速实现。 1.2 环境映射技术 …

Nature对数千篇论文提出质疑:隐藏的细菌蛋白为自然界的“电网”提供动力

隐藏在细菌中的蛋白质在缺乏氧气的时候泵出纳米线,这本质上是“呼出”电子来源:耶鲁大学Nikhil Malvankar耶鲁大学的研究人员在《自然》杂志上报告说,一种隐藏在细菌内部的毛发状蛋白质充当了自然界“电网”的某种开关,“电网”是由细菌产生的…

TCP的拥塞控制机制

拥塞: 在某段时间,若对网络中某资源的需求超过了该资源所能提供的可用部分,网络的性能就要变坏,产生拥塞若网络中有许多资源同时产生拥塞,网络的性能就要明显变坏,整个网络的吞吐量将随输入负荷的增大而下…

光刻机:半导体工业最耀眼的明珠

来源:胖福的小木屋原标题:《世界上所有半导体企业都离不开的光刻机是什么,一口气带你搞懂》光刻机是在半导体领域必不可少的设备,无论生产制造什么样的芯片,都脱离不了光刻机,如果说航空发动机代表了人类科…

ubuntu-18.04 修改用户名密码

1. 开放root登录 设置root密码 $ sudo passwd root切换到root 用户 $ sudo -i修改/etc/pam.d/gdm-autologin $ vim /etc/pam.d/gdm-autologin  注释所圈行修改/etc/pam.d/gdm-password $ vim /etc/pam.d/gdm-password  同样注释所圈行修改/root/.profi…

网络层的基本概念

网络层的功能 网络层负责实现各种不一样的物理网络的互联 网络层采用分组交换技术网络层应当使用统一编址路由器使用存储转发实现异构网络的互联网络层关注分组从一个网络到达另一个网络的选路问题 资源子网与通信子网 资源子网 负责全网的数据处理业务,向网络…

JS高级学习笔记(6)- 事件循环

参考文章:深入理解JS引擎的执行机制 JavaScript 异步、栈、事件循环、任务队列 我的笔记:ES系列之Promise async 和 await Event Loop 前提 js是单线程的 js的Event Loop是JS的执行机制,深入了解JS的执行,就等于深入了解JS里的event …

[美]杰克·巴尔金:算法社会中的三大法则

杰克巴尔金:耶鲁大学奈特宪法与第一修正案讲席教授,耶鲁大学法学院信息社会项目主任。来源:数字法治译者:刘颖,同济大学法学院助理教授、硕士生导师,法学博士。陈瑶瑶,上海大学法学院硕士研究生…

CentOS7完成mysql的安装和远程访问

详见链接https://blog.csdn.net/weixin_42266606/article/details/80879571 (此处我的本地用户名root,密码root;远程用户名root,密码12345) 1.下载 MySQL 所需要的安装包 网址:https://dev.mysql.com/downloads/mysql/ 2.Select O…

维特根斯坦:为何夸大人工智能是对人性的贬损?

© Semantics3来源:利维坦文:Steven Gambardella译:苦山校对:兔子的凌波微步原文:medium.com/stevengambardella/wittgenstein-intelligence-is-never-artificial-51933315d1bd利维坦按:众所周知&#…

哔哩哔哩n倍速播放视频

在b站看一些学习视频的时候,有时候2倍速满足不了我们的需求,可以在控制台键入以下命令实现n倍速播放视频 document.querySelector(video).playbackRate 3

法国数学到底有多厉害?

来源:盘古论市、EETOP等引子在德国数学家高斯的一部传记中,作者引用了下面这段话:有一个异乡人在巴黎问当地人,“为什么贵国历史上出了那么多伟大的数学家?”巴黎人回答,“我们最优秀的人学习数学。”又去问…

DevExpress破解和消除弹出框问题

在解决方案管理器列表中找到 license.licx 设置属性 将[生成操作]选项改为[无] 转载于:https://www.cnblogs.com/sinceret/p/10556243.html

放心,GPT-3不会“杀死”编程

来源:towardsdatascience.com作者:Alberto Romero译者:朱琪珊策划:刘燕本文由 Alberto Romero 发表在 towardsdatascience.com,经原作者授权由 InfoQ 中文站翻译并分享OpenAI 于 2020 年 7 月发布了 GPT-3 的 beta API…

com.sun.jersey.api.client.UniformInterfaceException:returned a response status of 403

这是在同一台电脑上,然后启动两台tomcat进行文件传输时候,会出现的一个异常. 403,是因为tomcat默认禁止上传,在tomcat中的config中的web.xml中进行以下的配置就可以进行文件的上传了. <servlet><servlet-name>default</servlet-name> <servlet-cla…