图灵测试还重要吗?

640?wx_fmt=jpeg

撰文丨Harry Collins(卡迪夫大学社会学教授)

来源丨原理(ID:principia1687)

1

我们正在步入人工智能时代。随着人工智能程序越来越擅长像人类般行事,我们也越来越多地面临这样一个问题:人类的智能是否真有什么特别之处?还是说我们只是另一种类型的机器?有一天,我们所知道和所做的每件事,是否有可能被一个安装在足够复杂的机器人上的复杂计算机程序所复制?

1950年,计算机先驱和战时密码破译者图灵(Alan Turing)做出了最有影响力的尝试来解决这个问题。在一篇具有里程碑意义的论文中,他提出,通过一个简单的测试,就可以消除人类和机器智能之间的模糊性。这个“图灵测试”评估计算机模仿人类的能力,由另一个看不见机器但可以问它书面问题的人来判断。

在过去几年里,有几款人工智能软件宣称已经通过了图灵测试。这使得有些人认为,这个测试太过于容易,以至于无法用作为人工智能的有用判断。但我认为那些软件根本没有通过图灵测试,甚至在可预见的将来都不会通过。但是如果有一天,人工智能真的通过了一个设计恰当的图灵测试,那么我们就有理由开始担心我们的独特地位。

图灵测试实际上一项是针对语言流利性的测试。如果理解得当,它可以揭示的是人类最独特的方面——我们不同的文化。文化的不同导致我们在信仰和行为上表现出巨大的差异,这种差异在动物或大多数机器身上是看不到的。事实上,我们可以在计算机程序中编写这种差异,这正是赋予了计算机模仿人类能力的潜力的程序。在判断模仿的流畅性时,图灵测试让我们可以通过了解计算机在社会环境中对语言的掌握,来判断它们在人类文化中的分享的能力。

2.

图灵测试的基础是“模仿游戏”。假定在游戏中有三个人(如下图):男A、女B,以及询问者C。C独自呆在一个房间中,C与A、B的交流只能通过两个连接A、B所在房间的传真机来完成。C需要通过和A 、B进行对话,判断他们哪个是男人、哪个是女人。A的目的是模仿女人,尽量扰乱C的判断;B的目的是尽量让C相信自己是个女人。

640?wx_fmt=jpeg


现在,如果我们将A换成一台机器,再按照如上规则重新进行游戏,那么C在进行判断时的准确率是否与当A是一个男人时一样?

在1950年那个时期,图灵没能制定出可以让我们来评判今天人工智能软件的必要协议。首先,他建议测试可以在五分钟内完成。但他没有发现,判定者和人类玩家必须共享同一种文化,而计算机必须能试图模仿这种文化。这才导致了有的人声称已经通过了测试,而还有一些人则称测试过于简单,或者应该将物理能力的模拟包含在内。

3

在随着计算机科学家Joseph Weizenbaum在近50年前创建了名为ELIZA的程序后,这一点变得很明显。ELIZA被用来模拟一种被称为罗杰斯式(或以人为中心)的心理治疗师。几个与这个程序接触过的病人都以为它是真实的,从而形成了最早的关于图灵测试已被通过的说法。

但Weizenbaum很清楚,ELIZA实际上就是个笑话。这个设置甚至没有遵循图灵提供的协议,因为病人并不知道它们可能不是真的,也没有一个真正的心理治疗师同时做出反应。此外,在那项测试中并不涉及文化,因为罗杰斯治疗师需要说得尽可能少。而任何有价值的图灵测试都必须让判定者和玩家尽可能像人类一样行事。

基于这是一个关于理解文本的测试,计算机需要根据前百分之几的文字编辑的能力来进行判断。如果提的问题正确,它们可以表明计算机是否理解了其他参与者的物质文化。

4

正确的问题类型可以基于1975年的“Winograd模式”,即两个句子之间的差别仅为一两个单词,但需要具备关于这个世界的知识才能理解。这样的人工智能测试被称为Winograd模式挑战,它于2012年首次提出,是对图灵测试的一种改进。

举个简单的例子,想想下面这句有两个可能结尾的话:“这个奖杯放不进这个手提箱,因为它太小/大了。”如果最后的形容词是“小”,那么“它”指的就是手提箱;如果最后的形容词是“大”,那么“它”指的就是奖杯。

若要能理解这一点,你必须了解奖杯和手提箱的文化和现实世界。你还必须了解奖杯和手提箱的物理世界,以及你是否真的触碰过这些事物。因此,采用了这种方法的图灵测试将会使那些包含了对人工智能模仿人类身体能力的评估的测试变得多余。

这意味着一个基于Winograd模式的图灵测试比简单的五分钟对话更能评估计算机的语言和文化流利性。与此同时,它也设立了一个更高的标准。在2016年的一场相关比赛中,所有的计算机都惨败给了这个测试,没有任何来自大型人工智能公司的竞争者参与这场比赛,因为他们知道自己注定会失败。

如果把图灵测试设置为一系列对人类创造和理解文化的独特能力的严峻考验的话,那么那些所谓的已经通过了图灵测试的说法都变得毫无意义。有了恰当的协议,测试才能达到要求。再一次,图灵又是对的。而且就我们目前的情况来看,并没有明显的途径可以创造出能够充分深入参与人类文化,并通过正确的语言测试的机器。


原文标题为“Turing Test: why it still matters”

原文链接:https://theconversation.com/turing-test-why-it-still-matters-123468,中文内容有增删,仅供参考,一切内容以原文为准。

640?wx_fmt=jpeg

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/489821.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python字符串为什么不能修改_为什么在Python(\n)中更改字符串中的行不起作用?...

在大多数情况下,它可以完成任务,但有时(我很难精确地说,它依赖于什么)它会陷入一个无限循环中,因为它不切分文本字符串。在def insertNewlines(text, lineLength): """ Given text and a de…

【 Date 对象 参考手册】

转载:JavaScript Date 对象参考手册 Date 对象是 JavaScript 的一种内部数据类型。 Date 对象没有可以直接读写的属性,所有对日期和时间值的访问都是通过其方法执行的。 请从下面的表格访问有关 Date 对象的方法的详细信息。 Date 对象的方法 FF: Firefox, N: Netsc…

mysql 禁止使用enum_MySQL慎用 ENUM 字段

前言:在网上看了很多文章,大家都是推荐 MySQL 要慎用 ENUM 字段,但是原理感觉还是有点模糊。今天我们就从官网来818这些东西1、关于 ENUM 迁移的问题?这里引用别人的一段话:但ENUM带来的问题也不少,比如数据…

2019年雁栖湖会议重大科学问题面向全球发布

来源:中国科学杂志社10月13日,由中国科学院学部和北京市政府联合举办的2019年度雁栖湖会议在北京怀柔开幕。中国科学院副院长张亚平、北京市委副秘书长郑登文以及来自国内外免疫学领域的院士、著名专家学者和中国科学院大学、中国科学院微生物所的师生等…

vscode怎么安装python包_vscode如何安装python

vscode安装python的方法: 1、在vscode的扩展中输入"ext install python"安装python插件打开VScode,Ctrlp 输入 "ext install python",搜索时间可能会比较长 安装过程不能停止,否则重新安装;2、在配…

mysql关于日期的函数_MySQL中关于日期函数汇总

实际应用SELECT NOW(),DATE_FORMAT(NOW(),%Y-%m-%d) %Y-%m-%d;年月日时间模块小时分钟秒周%X 年,其中的星期日是周的第一天,4 位,与 %V 使用%x 年,其中的星期一是周的第一天,4 位,与 %v 使用%Y 年&#xff…

《 百度大脑AI技术成果白皮书》,介绍百度大脑5.0,附48页PDF下载

来源:专知【导读】百度大脑是百度AI集大成者,自2010年起开始积累基础能力,2019年升级为5.0,成为软硬件一体的AI大生产平台。百度发布《 百度大脑AI技术成果白皮书》,详细介绍了百度大脑5.0在基础层、感知层、认知层、平…

python设计个人简历_python软件工程师 个人简历模板

工作经历: 2012.11 - 至今 北京 xxx 科技有限公司 ( 6 个月) 技术部 | python 软件工程师 互联网 / 电子商务 | 企业性质:民营 | 规模: 20-99 人 工作描述: 负责工作:网站的架构、接口的设计与实…

AT91SAM9260EK-38k产生原理

9260内部有5个内部计数器&#xff0c;分别为TIMER_CLOCK1 --- TIMER_CLOCK5。通过这5个时钟可以为各种内部设备提供时钟基准。 其中&#xff0c;红外发射38K方波&#xff0c;是通过CLOCK1计数产生。 配置寄存器如下 //选择TC通道 __sys_reg(AT91_PMC_PCER) 1 <<…

telegraf输出MySQL_Grafana+influxdb+telegraf初探-快速监控主机与mysql

一、安装1.1、配置influxdb yum源[rootnode ~]# cat /etc/yum.repos.d/influxdb.repo[influxdb]name InfluxDB Repository - RHEL \$releaseverbaseurl https://repos.influxdata.com/rhel/\$releasever/\$basearch/stableenabled 1gpgcheck 1gpgkey https://repos.influx…

新能源汽车产业深度研究报告:从2.0迈入3.0时代(113页)

来源&#xff1a;华西证券1.现状&#xff1a;发展节奏加快 电动化趋势明朗1.1.全球&#xff1a;新能源汽车加速渗透 中国占比持续提升 全球新能源汽车销量保持高速增长&#xff0c;十年 CAGR 达 99.4%。2008年新能源汽车 销量仅有 0.5 万辆&#xff0c;2011 年增至 4.9 万辆&am…

linux清除configure文件_在Linux操作系统下自动生成Makefile的方法

在Linux操作系统下进行开发&#xff0c;编写Makefile似乎是不可缺少的事情。但是对于一个比较大的工程&#xff0c;编写一个符合规范的Makefile并非易事。而且由于Makefile的各种显式&#xff0c;隐式规则&#xff0c;加之平时并不经常编写Makefile&#xff0c;导致我们写一个M…

mysql工作台安装使用_如何安装MySQL工作台?

问题描述在10.04或10.10上安装MySQL工作台不是问题&#xff0c;因为deb软件包可以在MySQL的网站上找到。但是没有11.04 deb包。那么&#xff0c;如何在11.04上安装MySQL工作台并在通过apt-get update向ubuntu提供更新时自动更新它。最佳解决办法从MySQL Workbench downloads页面…

实验四——多分支结构及本章总结

1. 本次课学习到的知识点&#xff1a; &#xff01;&#xff1a;非。 &&&#xff1a;与。 ||&#xff1a;或。 &#xff08;1&#xff09;&#xff01;a&#xff1a;如果a为“真”&#xff0c;则结果为“假”&#xff1b;如果a为“假”&#xff0c;则a为“真”。 &…

华为轮值董事长郭平:打造VR/AR信息高速公路,支撑产业繁荣

来源&#xff1a;华为10月19日&#xff0c;以“VR让世界更精彩——VR5G开启感知新时代”为主题的2019世界VR产业大会在江西省南昌市举行。华为轮值董事长郭平发表了《打造VR/AR 信息高速公路&#xff0c;支撑产业繁荣》的主题演讲。郭平认为&#xff1a;VR/AR将成为5G时代的首批…

使用Ping命令解析主机名解析出来的是IPv6

如果你经常使用ping命令&#xff0c;并身处局域网&#xff0c;那么你肯定会有这样一个疑问&#xff1a;Ping计算机名为何是IPv6地址&#xff1f;问这个问题的人很少见&#xff0c;大多都是对网络知识稍有了解的人&#xff0c;所以才会闻到关于ping的问题&#xff0c;而且在这之…

mysql 扫描所有字段_select扫描mysql innodb表时,select只输出主键列,会不会扫描全表?...

题主假定按照主键检索。我们假定是等值查询。范围查询和表遍历情形可以在文末经推导得出。primary keyA set of columns—and by implication, the index based on this set of columns—that can uniquely identify every row in a table. As such, it must be a unique index…

cstring判断包含字符串_作为java程序员要知道的大厂常见的算法面试题:字符串的包含...

1.2 字符串的包含题目描述给定一长字符串a和一短字符串b。请问&#xff0c;如何最快地判断出短字符串b中的所有字符是否都在长字符串a中&#xff1f;请编写函数bool StringContain(string &a, string &b)实现此功能。为简单起见&#xff0c;假设输入的字符串只包含大写…

数字双胞胎技术和物联网如何帮助企业取得成功

来源&#xff1a;物联之家网&#xff08;iothome.com&#xff09;到2023年&#xff0c;全球数字双胞胎市场预计将达到150亿美元&#xff0c;2017年至2023年的复合年增长率&#xff08;CAGR&#xff09;为37&#xff05;。通用电气、IBM和微软等主要公司正在使用数字双胞胎技术来…

武汉凭什么被列为国家超大城市?

2014年11月&#xff0c;国务院发布国发2014第51号文件《关于调整城市规模划分标准的通知》&#xff0c;新标准将城市划分为五类七档&#xff0c;其中规定&#xff1a;城区常住人口1000万人以上的城市为超大城市。 根据该标准&#xff0c;此前北京、上海、天津、重庆、广州、深圳…