很遗憾,自然语言理解是AI尚未攻克的领域

来源: Venture Beat

作者: Pieter Buteneers

编译: 科技行者

短短几年之内,深度学习算法得到了长足发展,不仅在棋类游戏中击败了全球最顶尖的选手,也能够以等同于、甚至超越人类的准确率识别人脸。但事实证明,人类语言仍是一项独特且深邃的难题,亦是AI技术所面对的最为艰巨的挑战之一。

但是,突破能否如期而至?

一旦计算机可以有效理解人类语言内容,则必将彻底颠覆全球各品牌、企业与组织之间的交互方式。如今,大多数企业拿不出充裕的资源为每位客户提供一对一解答服务。但在语言AI真正成熟之后,企业将能够在任意时间通过任意渠道听取、理解并回应每一个问题。这是一项激动人心的发展愿景,但距离达成目标仍有漫长的道路要走。

直到2015年,人们才构建出一种足以在准确率方面与他类相匹敌的人脸识别算法。Facebook的DeepFace准确率为97.4%,仅略低于人类的97.5%。作为参考,FBI以往的人脸识别算法准确率仅为85%,意味着其做出的判断有超过七分之一概率是错的。

FBI算法是由一组工程师手工开发而成。其中每项特征(例如鼻子大小以及眼睛的相对位置)皆由手动编程而来。Facebook算法则真正实现了特征学习,其利用一种被称为卷积神经网络的特殊深度学习架构,模拟出人类视觉皮层通过复杂的多层结构处理图像内容。事实上,我们并不清楚这些皮层之间是如何联系的,因此一切“奥秘”都由算法自主探索得来。

Facebook之所以能够达成这一成就,依靠的正是实现类人级人工智能的两个基本思路:首先建立一套能够学习特征的架构,再将数百万张经过标记的高质量图像作为训练素材供其学习。

语言难关就在眼前

视觉的诞生虽然困难,但已经有数百万种物种在进化过程中攻克了这道难关。相比之下,语言似乎更为复杂。据我们所知,人类是目前唯一能够使用复杂语言交流想法的物种。

不到十年之前,出现了单凭某些词汇的出现频率即可大致推理出语义的AI算法。但这种方法显然忽视了同义词元素的存在,也无法应对某些表达在不同上下文中具有不同表意的问题。

2013年,Tomas Mikolov和他的谷歌团队创造出一种能够学习单词含义的架构。他们的word2vec算法能够将同义词相互映射,借此对大小、性别、速度等语义进行建模,甚至能够将国家与首都等特征关联起来。

但其中仍然缺少至关重要的一环——理解上下文。语言理解领域的真正突破诞生于2018年,谷歌公司在这时推出了BERT模型。Jacob Devlin和他的团队仍然沿用传统机器翻译中的架构,但向其中引入了学习句子内上下文信息的能力。

通过教育该模型填补维基百科文章中的遗漏单词,该团队得以将语言结构嵌入BERT模型。只需要使用数量有限的高质量标记数据,他们就成功完成了对BERT的调优,借此完成从为问题找到正确答案、到真正理解句子表意的多种任务。也凭借这一壮举,他们成为破解语言理解谜题的先驱:正确架构,加上大量可供学习的高质量数据。

2019年,Facebook的研究人员在此基础上又更进了一步。他们同时使用100种语言训练出类似的BERT模型。此模型能够以一种语言(例如英语)进行特征学习,再将成果应用于其他任意一种语言(例如阿拉伯语、汉语及北印度语)。这种具有语言中立性的模型能够在实际训练所选定的语种上实现与BERT完全一致的性能,并在迁移至另一种语言时将影响控制在较低程度。

这些技术本身确实给人留下了深刻印象。但在2020年初,谷歌研究人员最终得以在广泛的语言理解任务上超越了人类的表现。谷歌引入规模更大的网络架构与更多训练数据,终于将BERT架构推向了极限。如今,这套被命名为T5的架构在标记句子与寻找答案方面的表现已经超越人类。去年10月发布的多语种mT5模型已经能够在双语种间互译方面实现与人类相近的表现,更恐怖的是它能够支持多达100种语言。谷歌本周又公布了新的万亿级参数模型,整体架构规模更上一层楼,性能也进一步提升。

可能性

设想一下,未来的聊天机器人也许能够理解您用任何一种语言书写的内容,真正理解上下文并记住之前聊过的内容。这意味着我们得到的不再只是几条简单粗暴的预定义回应,而是真正的关切与解答。

搜索引擎也将能够理解您的问题,给出正确答案,而且不再纠结于您的用词是否严格准确。您可能还会迎来一位AI同事,它了解关于业务流程的所有知识。更重要的,如果能够使用正确的术语,那么单靠谷歌搜索没准就能解决客户的具体问题。连篇累牍的内部文档终将成为过去,留给AI模型快速浏览即可。

数据库的新时代即将来临。我们将彻底告别构造数据的繁琐工作——一切备忘录、电子邮件、报告都将由AI模型自动解释、存储与索引。由于数据库能够理解人类表达,您不需要求助于IT部门即可直接查询并创建报告。

这一切还只是冰山一角。目前一切依赖于人类语言理解能力的流程,都有可能被自动化功能所彻底颠覆。

没那么简单

但这里还有个问题。既然这么出色了,为什么这些算法还没得到普遍应用?因为单靠云计算资源训练T5算法,就花掉了谷歌约130万美元。幸运的是,谷歌研究人员慷慨地分享了这些模型。但如果要对当前任务进行调优,还需要额外承担一大笔资源开销,外加漫长的训练周期。

不过随着时间的推移,企业对于调优工作的不断探索,相信未来会有更多应用方案陆续涌现。另外,如果大家相信摩尔定律,那么五年左右之后我们就会迎来更复杂的语言AI应用,届时也会有新的模型全面超越T5算法。

2021年,我们距离AI技术的转折性突破还有遥远的距离。但只要能够迈过这道难关,AI技术必将释放出无穷的可能性。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/485568.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

分层结构,协议,接口,服务

发送文件前的工作: 1. 发起通信的计算机必须将数据通信的通路进行激活 2. 要告诉网络如何识别目的主机 3. 发起通信的计算机要查明目的主机是否开机,并且网络连接正常 4. 发起通信的计算机要清楚,对方计算机中文件管理程序是否做好准备工…

linux怎么抓sip包,Ubuntu下使用Wireshark进行抓包分析(含SIP和RTP包)

遇到需要在Linux下抓包分析的问题,便用到了wireshark,非常强大的抓包分析软件,直接在系统里面安装,然后使用明亮抓包即可!我这里用的是Ubuntuserver版,执行安装:1、apt-get install wireshark安装成功后使用…

jsp+javabean实现购物车

采用Model1(jspjavabean) 实现DBHelper类创建实体类创建业务逻辑类(dao) DBHelper类的设计package util;import java.sql.Connection; import java.sql.DriverManager;public class DBHelper {private static final String drive…

里程碑 | 原来大脑有两套GPS!陆军军医大学张生家团队发现海马外全新空间导航系统...

来源:iNature位置细胞,网格细胞,边界细胞和头部方向细胞的空间选择性激发是构成以海马-肠内复合体为中心的典型空间导航系统的基本构建块。虽然可以在整个大脑中找到头部方向细胞,但是海马结构外部的空间调节通常与其他表示形式&a…

php 流(Stream)

http://laravelacademy.org/post/7459.html转载于:https://www.cnblogs.com/cxscode/p/9373936.html

iar 连接linux开发板,LED裸机程序(IAR)

LED裸机程序(IAR)一、实验环境开发环境:IAR5.30开发板:UT-S3C6410开发工具:JLINK V8二、实验目的在无操作系统的开发板上,运行程序,掌握裸机程序的开发过程,熟悉IAR和JLINK的使用。三、实验步骤1、准备工作…

简易呼吸灯c语言程序,呼吸灯 - 单片机教程 - C语言网

1.双定时器呼吸灯实现呼吸灯的实现原理就是让小灯的IO端口在一段时间里PWM由大到小变化的占空比输出,接着又由小到大的占空比输出,小灯显示效果就是时亮时暗地交替闪烁。首先我们用定时器0定时0.1ms,全局变量pwm在其中断函数里执行简单的从0到…

Python学习---面向对象的学习[深入]

类的深入学习 a. Python中一切事物都是对象 b. class Foo: pass obj Foo() # obj是对象,Foo类 # Foo类也是一个对象,type的对象 c. 类都是type类的对象 type(..) “对象”都是以类的对象 类() d. 类实际上是type类型的对象,所有的…

TCP/IP模型

应用层(会话层,表示层,应用层) HTTP FTP DNS 传输层(传输层) TCP UDP 网际层(网络层) IP 网络接口层(物理层…

c语言银行卡管理系统程序设计报告,《c语言程序设计》课程设计报告-职工信息管理系统.doc...

《c语言程序设计》课程设计报告-职工信息管理系统.doc还剩24页未读,继续阅读下载文档到电脑,马上远离加班熬夜!亲,很抱歉,此页已超出免费预览范围啦!如果喜欢就下载吧,价低环保!内容…

今年,自动驾驶卡车将在无人驾驶的情况下上路

文章来源:IEEE电气电子工程师Photo: TuSimpleFirst in Freight: In 2021, San Diego–based startup TuSimple plans to deploy autonomous trucks that drive themselves from pickup to delivery without anybody on board.Tesla、Uber、Cruise和Waymo等公司承诺&…

Leetcode--102. 二叉树的层次遍历

给定一个二叉树,返回其按层次遍历的节点值。 (即逐层地,从左到右访问所有节点)。 例如: 给定二叉树: [3,9,20,null,null,15,7], 3 / \ 9 20 / \ 15 7 返回其层次遍历结果: [ [3], [9,20], [15…

C语言求一个数组中第k大的数,leetcode | Median of Two Sorted Arrays 寻找2个有序数组中第k大的值...

There are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted arrays.The overall run time complexity should be O(log(m n)).分析本题更经典通用的描述方式时:给定2个有序数组,找出2个数组中所有元素中第…

线上服务CPU100%问题快速定位实战

功能问题,通过日志,单步调试相对比较好定位。 性能问题,例如线上服务器CPU100%,如何找到相关服务,如何定位问题代码,更考验技术人的功底。 58到家架构部,运维部,58速运技术部联合进行…

最新研究:超级人工智能,从理论上就无法控制

文章来源:机器之心作者:Charles Q. Choi 编辑:泽南、杜伟近日,一项新的研究发现,从理论上来看,人类不可能控制超级人工智能。更为糟糕的是,这项研究也明确了人类无法在这种 AI 生成之时发现它…

Leetcode--5274. 停在原地的方案数

有一个长度为 arrLen 的数组,开始有一个指针在索引 0 处。 每一步操作中,你可以将指针向左或向右移动 1 步,或者停在原地(指针不能被移动到数组范围外)。 给你两个整数 steps 和 arrLen ,请你计算并返回&…

c语言多个子函数声明,C函数在多个源文件中的声明和定义

这是src1.c的内容:#include extern int w;//int go(char); // no need to declare here. WHY????main(){char af;go(a);printf("%d\n", w);}这是src2.c的内容:#include int w 99;int go(char t){printf("%c\n%d\n",t,sizeof(t)…

Leetcode--200. 岛屿数量

给定一个由 1(陆地)和 0(水)组成的的二维网格,计算岛屿的数量。一个岛被水包围,并且它是通过水平方向或垂直方向上相邻的陆地连接而成的。你可以假设网格的四个边均被水包围。 示例 1: 输入: 11110 11010…

看懂2020年智能浪潮,我们从百度和谷歌的AI足迹出发

来源: 脑极体2020年已经过去,无论我们过得顺遂平安,还是过得无比艰难,我们应该都会记住这一年。回顾2020年,在这个不同寻常的疫情之年,科技成为人类抗击疫情的关键,而人工智能技术投入抗疫战争之…

公交换乘系统c语言,公交换乘的简单实现(源码)

最初是做2004年某期《程序员》杂志上的一道题,叫“洞穴探险”,结果写着写着就做到公交换乘的思路上去了。看来做GIS做久了,都成习惯了。后来工作忙,就扔下了。最近翻看以前自娱自乐时写的东东,看到了这段代码&#xff…