对话式人工智能发展的真正限制是人类的耐心

7c6f9dc9450877cb774cc13d72300980.png

来源:AI前线 

作者:Jiang Chen,Moveworks 机器学习副总裁

译者:王强

策划:刘燕

从 Siri 到 Alexa 再到谷歌助手,今天我们已经被各种人工智能系统包围了。它们的设计目标只有一个:理解我们。

我们已经看到了很多惊人的进展。在一瞬间数以千亿计的计算能力帮助下,最新的人工智能技术能够以人类水平的准确性理解某些类型的文本。然而,当目标文本属于一长段对话时,系统面临的挑战就变得更加艰巨,因为它需要考虑对话上下文来解释用户的意思并决定该如何回应。不过,像 Facebook 的 BlenderBot 2.0 这样的聊天机器人似乎预示着人类与人工智能的互动会流畅自然许多。

但问题在于:我们给这些对话式人工智能机器人增加的复杂性越多,就越难满足我们对实时响应能力的期望。BlenderBot 2.0 就是一个完美的例子。因为它突破了 BlenderBot 1.0 的许多关键局限(包括缺乏长期记忆),所以 2.0 版本比它的前辈要复杂得多。因此,要让幕后起作用的机器学习(ML)响应速度更快就更难了。

对话式人工智能和聊天机器人的速度限制

要实现自然流畅的对话是没有什么秘密可言的。它需要一个让人头疼的庞大 ML 模型网络,为了确定下一步应该回答什么内容,网络中每一个模型都要解决一小块难题。一个模型可能会考虑用户的位置,另一个模型会考虑到互动的历史,还有一个模型需要考虑到过去类似回应引起的反馈——每个模型都会给系统增加以毫秒计的宝贵延迟。

换句话说,对话式人工智能的真正限制是我们的耐心。

“依赖地狱”的深度

我们对人工智能的期望在学术背景下完全是另一码事。在学术背景下,我们为了结果可以等待几个小时甚至几天;而在现实环境中,我们要求系统立即做出反应。特别是对于对话式人工智能机器人来说,每一项潜在的改进都必须考虑到降低延迟的目标来进行权衡。

这种延迟是所谓的“关键路径“的产物,关键路径是指:从输入(用户的信息)到输出(机器人的反应)所需的最短 ML 模型链条序列。这是一个来自项目管理的古老概念,但在试图避免不必要的步骤这方面,它对今天的 ML 网络来说是非常重要的。

那么,你该如何找到关键路径呢?这一切都归结为依赖关系,长期以来,这一直是常规软件开发领域的一个决定性问题。对于任何一种由很多部分相互连接而成的软件架构来说,改进其中某一个应用程序都可能迫使工程师更新整个系统。但有时,对应用 A 来说至关重要的更新却与应用 B、C 和 D 不兼容。

这就是所谓的“依赖地狱“。如果不去特别关注细节的话,机器学习的依赖关系会让我们面对的地狱更加深邃黑暗。

正常的软件依赖项是基于 API 的,它传达了一个特定应用程序的简单、离散的状态,例如电子表格中的一个单元格从红色变为绿色。API 允许工程师在某种程度上独立开发每个应用程序,同时让它们保持在同一页面上。但对于 ML 的依赖项来说,工程师则要处理抽象的概率分布才行,这意味着我们很难搞清楚一个模型的变化应该如何影响更大范围的 ML 网络。只有掌握了这些模型之间的细微关系,我们才能让对话式人工智能成为现实——更不用说实时体验了。

通过跳过步骤来节省时间

为了充分了解对话式人工智能的依赖关系,你需要将机器学习与人类的直觉相结合在一起。

举个例子,我们的一个对话式人工智能机器人旨在回应员工的各种请求,比如说他们想要一个 PowerPoint 许可证,或是对 PTO 政策有疑问。事实证明,即使是看起来很简单的问题也会把你带入依赖地狱的深处。PTO 问题的答案可能深藏在员工手册的第 53 页,而且对于加拿大的销售人员和西班牙的工程师来说可能还是不一样的。此外你还要忽略很多不相关的细节(比如员工的夏威夷度假计划),所以你有几十个专门的 ML 模型,它们还必须作为一个整体来运作。

诀窍在于确定哪些模型——也就是关键路径中的哪些步骤——是解决每个问题所必需的。第一步是自然语言理解,或 NLU,其目标是将非结构化文本转化为机器可操作的信息。我们的 NLU 是一个由许多 ML 模型组成的管道,可以纠正错别字、识别关键实体、从噪音中分离出信号、弄清用户的意图,等等。有了这些信息,我们就可以开始在下游筛选出不必要的模型。

这意味着在分析公司现有的实际解决方案之前,预测出目标问题有哪些有益解决方案。一名要求使用 PowerPoint 的员工可能会用到软件许可或申请表格,但他们几乎肯定不想要新办公室的地图。只要能充分利用来自 NLU 流程的信息,我们就可以通过所谓的“预触发“系统,预测哪些模型需要激活,哪些模型需要绕过。

鉴于这一过程中所涉及的概率分布的抽象性质,我们的预触发系统既依赖于机器学习的输入,也依赖于人类专家基于直觉制定的规则。归根结底,把时间花在有意义的地方既是一门艺术,也是一门科学。

为对话式AI机器人的进步留出空间

没有人知道对话式人工智能在十年后会是什么样子。然而我们所知道的是,我们现在需要优化我们的聊天机器人,为未来的进步留出空间。如果我们想获得像人类对话一样的体验,我们就必须考虑整个系统的延迟,不能毫不顾忌地增加越来越多的复杂性。

与科幻小说相反,我们在人工智能领域看到的“突破“都是对现有模型和技术的许多小的、渐进式改进累加起来的产物。优化对话式人工智能的工作并不是为了影视作品里那种效果,成果也很难在一夜之间就爆发。但是,正是这些年的不懈努力——而不是几次天才般的思想火花——让聊天机器人能够实时理解我们的意图并帮助我们。

原文链接:

https://venturebeat.com/2022/02/23/why-the-true-test-for-todays-conversational-ai-chatbots-is-time/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

55e22116100f7fb058f484801259f5a6.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482076.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Nature子刊:科学家在类脑芯片上实现类似LSTM的功能,能效高1000倍

来源:机器学习研究组订阅格拉茨技术大学的计算机科学家在 Nature 子刊上发表的一篇论文表明,他们找到了一种在神经形态芯片上模拟 LSTM 的方案,可以让类脑神经形态芯片上的 AI 算法能效提高约 1000 倍。随着智能手机的普及,手机游…

重磅!0.2nm路线图来了!详细讲解技术实现!

来源:tomshardware编译:EETOP世界上最先进的半导体研究机构 Imec 最近在比利时安特卫普举行的未来峰会上分享了其亚1nm和晶体管路线图。该路线图让我们大致了解了到 2036 年Imec将在其实验室与台积电、英特尔、三星和 ASML 等行业巨头合作研发的下一个主…

问题即答案-解决棘手问题的突破性方法

来源:混沌巡洋舰 “问题”(question) 中包含一个非常美妙的词:“ 探索”(quest)。我太喜欢这个词了。——埃利威塞尔(Elie Wiesel)有些人常常感觉一些真相事关重大,自己应…

CSS:盒子模型和清除float浮动的三种常用方法

目录 一:浮动产生原因: 二:浮动产生副作用: 三:浮动解决方法: QUESTION:CSS盒子模型清除浮动? ANSWER: 一:浮动产生原因: 一般浮动是什么情况呢?一般是一个盒子里使用了CSS fl…

逼真度超越「AI设计师」DALL·E 2!谷歌大脑推出新的文本生成图像模型Imagen

来源:AI科技评论作者:李梅、王玥编辑:陈彩娴文本生成图像模型界又出新手笔!这次的主角是Google Brain推出的 Imagen,再一次突破人类想象力,将文本生成图像的逼真度和语言理解提高到了前所未有的新高度&…

量子技术推动新的传感器热潮

IMPERIAL COLLEGE LONDON/M SQUARED来源:IEEE电气电子工程师想象一下,传感器可以探测思想的磁场、帮助月球车探测月球岩石中的氧气,或者接收来自暗物质的无线电波。正如量子计算机可以从理论上找到经典计算机无法解决的问题的答案一样&#x…

0.2nm路线图来了!详细讲解技术实现!

来源:tomshardware世界上最先进的半导体研究机构 Imec 最近在比利时安特卫普举行的未来峰会上分享了其亚1nm和晶体管路线图。该路线图让我们大致了解了到 2036 年Imec将在其实验室与台积电、英特尔、三星和 ASML 等行业巨头合作研发的下一个主要工艺节点和晶体管架构…

走向认知发展的理性建构理论

Towards a Rational Constructivist Theory of Cognitive Development Fei Xu University of California, Berkeley来源:CreateAMind本文对认知发展理论——理性建构主义进行了综述。这种观点的基本原则如下:(a)初始状态:人类婴儿以一组原型概念的原语开始生命。这些…

JavaWeb笔记:JDBC总结

JavaWeb笔记:JDBC总结 目录 JavaWeb笔记:JDBC总结 一、JDBC概述 二、开发一个JDBC程序(重要) 三、JDBC常用的类和接口详解 1、java.sql.Drivermanager类 : 创建连接 2、java.sql.Connection接口:一个连接 3、java.sql.Statement接口:…

谷歌街景15年乾坤大挪移!带你穿越法老的金字塔

来源:机器学习研究组订阅最近两年多,整个世界都被一个共同对手折腾得够呛。有人咬牙坚持、有人躺平摆烂,有人祈求上天,还有人离开了这个世界。更多的人们则逐渐意识到,原来所谓「Good Old Times」离我们竟然如此之近&a…

如何构建可信GNN?最新综述来了!可信图神经网络:维度,方法,趋势

来源:Monash University作者:He Zhang,Bang Wu前言在过去的几年里,以神经网络为首的人工智能技术通过对不同类型数据的深入挖掘已经深刻地改变了人类的生活并极大地推动了社会发展的进程 [1]。作为人工智能领域最活跃的研究方向之…

JavaWeb:XML总结

JavaWeb:XML总结 目录 JavaWeb:XML总结 一:什么是XML? 二:xml语法: 三: xml约束: 四:XML解析思想: 一:什么是XML? XML:eXtensible Markup La…

JavaWeb:tomcat服务器安装总结及Http协议

JavaWeb:tomcat服务器安装总结 目录 JavaWeb:tomcat服务器安装总结 一:服务器端概述: 二:Tomcat下载: 三:安装: 四:HTTP问题: 五:深入了解tomcat服务器&#xff1…

深度知识的6个维度:如何让人工智能真正理解世界?

智能的真正标志不是知识,而是想象力。来源:AI科技评论作者:Gadi Singer编译:王玥编辑:陈彩娴什么知识让我们变得聪明?我们用来理解世界、解释新体验和做出深思熟虑的选择的认知结构是什么?定义一…

2013年图灵奖得主Leslie Lamport:如何写出数学上完美的算法

来源:新智元图灵奖得主、分布式系统先驱、LaTeX之父Leslie Lamport认为,对于程序员而言,对数学思维的强调永远不会过分,要写出好代码,不能惧怕数学。Leslie Lamport可能不是一个家喻户晓的名字,但一提到和他…

Python绘制图形之Matplotllib绘图

Python绘制图形之Matplotllib绘图 目录 Python绘制图形之Matplotllib绘图 一、绘制二维函数图 1.1 绘制 f(x)sin2(x−2)e−x2 1.2 、绘制 sigmoid函数图: f(x)11e−x 1.3、绘制正态分布图 二、绘制三维图 2.1 绘制三维螺旋图 2.2 绘制三维线性点图 2.3 绘制三维柱状图 2…

新发现罕见生命密码:基因读取的另一套代码

来源:生物通令人震惊但让人困惑的是,我们所知的生命密码使用了61个不同的三字母密码子,只产生了20个氨基酸,这意味着许多密码子被用来描述同一件事。新的研究表明,大脑和睾丸似乎非常适应使用多种不同种类的遗传密码来…

《自然-机器智能》:神经形态技术可使大型深度学习网络节能16倍

来源: 学术头条受生物大脑机制的启发,研究人员一直在提高人工神经网络的性能效率和计算要求。一项新的研究表明,对于大型深度学习网络,神经形态技术的能源效率有望达到其他人工智能系统的 16 倍。格拉茨技术大学(TU Gr…

康奈尔计算计学院院长Kavita Bala:「元宇宙」算什么?上帝之眼或将通过 AI 诞生...

来源:AI科技评论编译:王玥编辑:陈彩娴在今年斯坦福HAI实验室的春季会议上,康奈尔计算机学院院长Kavita Bala以“视觉外观和理解:从微米分辨率到世界级”为题,就她在数字化现实世界方面的研究进行了精彩的演…

王浩:哥德尔思想概说

来源:本文原文刊于《科学文化评论》2004年第6期撰文:王浩翻译:邢滔滔译者按本文选自王浩最后一本著作A Logical Journey—From Gdel to Philosophy (Cambridge: The MIT Press, 1996)的引言部分,有删节,题目…