语言处理想突破,三座大山必须过

640?wx_fmt=png

来源:大数据文摘

编译:李佳、汤圆、钱天培


“我的飞机什么时候到?”


把这个问题抛给智能机器人助手。几乎可以肯定,机器立马就懵逼了。


“我”是谁?“飞机”是航班还是淘宝上订的模型玩具呢?“到”又是到哪呢?


如果是人类来回答这个问题,即使在情景不明确的情况下也能在快速澄清后给出回答,但对机器来说,除非依赖大量人为制定的规则,回答这样的问题难度堪比“哥德巴赫猜想”。


面对自然语言处理发展(NLP)存在的诸多难题,该领域的大牛、Salesforce的首席科学家Richard Socher在近日指出:NLP领域的发展要过三座大山。


困扰NLP领域的这三座大山究竟是什么?一起来听大佬说。


640?wx_fmt=jpeg


一直以来,语言都被认为是人类的独特能力,是智慧的表现。但最近,自然语言处理技术的发展似乎也将语言能力赋予给了机器。


帮你打电话订餐,给你讲故事,解决各种刁钻的冷知识问答…机器的语言能力已经无限接近人类水平。


现在你可以走进昏暗的客厅,让Alexa把智能灯的亮度提高到75%。你也可以询问他世界另一边的天气情况。在Google最近的Duplexde,AI助理已经能够给理发店打电话,为你预约剪发。


曾经被视为科幻的场景现在变为了现实,但为了维持真正的人机关系,机器必须能够与人进行更直观、理解上下文和自然的对话--这仍然是一个挑战。我致力于研究NLP,但是就像AI一样,我们还在这个旅程的开始阶段。


语言是分享信息和与周围连接的一种机制,但是机器需要理解语言的复杂性以及作为人类是如何使用语言进行交流的。情感分析、问题回答和联合多任务学习方面的进步使AI能够真正理解人类以及我们的交流方式。


情感分析


640?wx_fmt=png


语言本身就是复杂的。它不断发展,而且细致入微,一般人需要数年才能掌握。通过情绪分析,我们可以使用AI来理解特定内容,比如品牌或电影评价是正面的、负面的还是中性的。


我们也能弄清楚演讲者的态度和意图(她是生气,高兴,惊讶还是准备好要买东西了?)。从客户服务到在线社区调节再到算法交易,能够即时分析数千条推特和数百条产品评论来理解公众对一个品牌的看法,这对于企业来说是非常有价值的。


情感分析技术已经存在了一段时间,但并不总是非常精准。随着NLP的进展,这种情况正在发生变化。在我担任首席科学家的Salesforce,我们的AI(叫做Einstein)允许品牌能够通过电子邮件,社交媒体,和聊天短信得到实时的情感分析,为客户提供更好的体验。


准确的情感分析,例如,服务代理可帮助了解应优先服务哪些不满意的客户,或者应向谁提供优惠。也可识别产品缺陷,衡量产品满意度,通过社交平台改变人们对品牌的认知。其他科技公司也提供类似服务。


对于情感分析来说,理解上下文也是很重要的。假设你有一家肥皂公司,有人在推特上说:“这种肥皂对婴儿来说真的很棒。”这可以是对儿童肥皂的积极支持,也可能是暗讽这对孩子来说很可怕。


这句陈述可能包含很多上下文,但又很简单!使用AI分析某一句子结构的所有可能性,并理解一个人在特定语境下的用意,是NLP研究的重大挑战。它既需要标记数据来改进模型培训,也需要新的模型在学习上下文的同时在许多不同类型的任务之间共享知识。


问  答


640?wx_fmt=png


随着NLP更好地解析文本的含义,帮助管理我们生活的数字助理智能将会提高。Siri和Google Assistant等应用程序可为常见问题提供优质答案,并执行简单的命令。理想情况下,我们应该能够问电脑任意问题,并且得到好的答案。


提供更好答案的一种方式是确保计算机理解问题。如果你问“我的飞机什么时候到达?”计算机怎么知道是在谈论你的航班还是从亚马逊订购的木工工具呢?


通过对语义的更深入理解,再加上对上下文数据的更好使用,计算机在判断语义这方面正变得越来越好。我们正在研究如何使用NLP学习每一层上下文,这样AI就可以同时处理所有内容,而不会错过重要的信息。


例如,动态共聚焦网络( dynamic coattention networks可以根据不同的问题对单个文档进行不同的解释,比如,面对一篇体育报道,在回答“哪位运动员获得了冠军?”和“最年轻的参赛者是几岁?”这两个问题是,机器就能对这篇报道作出不同的理解,从而反复假设多个答案,最终得到最好、最准确的结果。


联合多任务学习


640?wx_fmt=jpeg


科学界善于构建能很好地执行单个任务的人工智能模型。但是,更直观、会话式的并联系上下文的界面则需要一个不断学习的AI模型,它能够将新任务与旧任务集成起来,并在这个过程中学习执行更加复杂的任务。总体上来说,这对所有AI都是适用的,但在语言方面尤其如此,因为语言需要灵活性。


“谁是我的客户?”这是一个十分简单的任务:创建客户列表。但是,“谁是太平洋西北地区对某一特定产品的最佳潜在客户呢”?这样的问题增加了一层复杂性,需要大量的集成任务来提供答案,例如:如何定义“最佳”?客户定位在哪里?是什么因素导致客户对产品感兴趣的?每增加一个因素,问题的复杂性都会急剧增加。


Salesforce研究公司最近进行了一项名为“自然语言十项全能”的研究,该研究将多个任务转化为问答的形式,从而在一个单模型中解决了NLP最困[1]难的10项任务:问题回答,机器翻译,摘要,自然语言推理,情感分析,语义角色标注,关系提取,目标导向对话,数据库查询生成,代词消解。


使用多任务问答模型,将每个任务作为一种问答形式,单个模型在没有任何特定参数或模块的情况下共同学习和处理不同的任务。这不仅意味着数据科学家不再需要为每项任务建立、训练和优化单个模型,而且还意味着该模型具有零射击(zero-shot)学习能力---换句话说就是该模型可以处理以前从未见过或专门训练过的任务。


随着研究人员继续改进这样的模型,我们会看到AI界面在承担更复杂任务时变得更聪明。


虽然我们已经研究NLP很长时间了,但我们要走的路还长着呢。希望随着NLP技术的提升,人类与机器的交互形式最终能够迎来质的飞跃。


相关报道:

https://hbr.org/2018/07/ais-next-great-challenge-understanding-the-nuances-of-language


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/494423.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CSDN每日打卡已经2周,进展如何?(送两个CSDN背包)

🍅 作者主页:不吃西红柿 🍅 简介:CSDN博客专家 & 总榜前十🏆、HDZ核心组成员。欢迎点赞、收藏、评论 🍅 粉丝专属福利:知识体系、面试题库、技术互助、简历模板。文末公众号领取 点赞评论 …

趋势 | 人工智能领域十大最具成长性技术展望

来源:搜狐日前,在2018世界机器人大会基础技术与创新论坛中,中国电子学会发布了《新一代人工智能十大成长性技术展望》。经调研走访了一批在新一代人工智能技术及产业方面具备领先水平和特色的龙头企业,拜访了来自于知名高校、研究…

CTex + Texmaker

CTex 套装提供了一个Latex编译环境和相关的库,最大的优点是自动部署,直接就可以用。但是CTex自带的WinEdt和开源的Texmaker比起来在设计方面显得比较粗陋,影响工作效率。 Texmaker 本身只是一个前台软件,但是设计精良。如果已经安…

android之phonegap入门

利用phoneGap可以利用HTML开发安卓应用,是web app的一种,可以有效的提高开发效率,降低开发成本 。 第一步: 开发环境配置以及基本操作请参考其它文档. 新增一个名为 phoneGap 的android项目,将主activity命名为:PhoneGapActivi…

全球第二家 亚马逊“喜提”万亿美金市值 AI或是最大功臣

亚马逊创始人杰夫贝佐斯(Jeff Bezos)来源:网易智能摘要:9月5日消息,美国当地时间周二,全球电商巨头亚马逊(Amazon)股价一度触及史上最高点,促使亚马逊市值短暂达到1万亿美元。不过,在…

苹果/三星/华为纷纷布局人工智能 将AI作为公司发展新动力

来源:手机报在线摘要: 目前,以苹果、三星和华为为代表的手机厂商除了继续探索人脸识别、屏下指纹和柔性显示屏等技术外,也将目标瞄向了人工智能,纷纷将“AI拍照”、“AI芯片”等作为营销热门话题,并通过大力…

量子通信产业化初试,中国筹建千亿级国家实验室

来源:第一财经摘要:一个涉及多地的量子信息科学国家实验室(下称“国家实验室”)正在筹建,长期投资将达千亿元。第一财经从2018年国际量子密码会议上了解到,中国正在筹建的国家实验室涉及合肥、上海和北京等…

Android之自定义控件入门

本文主要讲述了实现安卓button点击变色与利用ViewPager实现图片自动轮播效果 我伞可以看到在很多应用中&#xff0c;安卓按钮按下时与正常时状态是不同的&#xff0c;这种效果也很容易达到。 第一步&#xff1a;创建XML文件定义不同事件的不同效果 <?xml version"1…

理性解读中国科技实力:不震惊式吹捧,也不全盘抹杀

来源&#xff1a;风云之声&#xff08;ID:fyvoice&#xff09;关于中国科技成果&#xff0c;大家一直都在讨论&#xff0c;网上也有很多评论文章。有的&#xff0c;把中国科技实力吹上天&#xff1b;有的&#xff0c;则干脆贬入地。中国在很多领域确实做得不错&#xff0c;与此…

Unity(四):使用场景Ⅰ:建立类型映射

在之前的一篇文章“Unity(三)&#xff1a;快速入门”中&#xff0c;给出了一个简单的示例&#xff0c;让我们对Unity有一个感性的认识。但是&#xff0c;Unity到底是做什么用的呢&#xff1f;一个简单示例并不能解答这个问题。 总的来看&#xff0c;Unity的使用场景主要有以下几…

科技创新2030---“新一代人工智能”重大项目2018年度项目申报指南征稿

来源&#xff1a;财政资金申请摘要&#xff1a; “新一代人工智能”重大项目的凝练布局和任务部署已经战略咨询与综合评审特邀委员会咨询评议&#xff0c;并报国务院批准实施。根据《国务院关于改进加强中央财政科研项目和资金管理的若干意见》&#xff08;国发〔2014〕11号&…

一旦上云,欲罢不能,带大家薅一薅“云羊毛”

一旦上云&#xff0c;欲罢不能。相对于传统服务器&#xff0c;云服务器因为不需要去拉网线、搭机房、交电费等等问题&#xff0c;云服务器提供商往往会提供一整套完整的解决方案&#xff0c;帮助企业和个人用户&#xff0c;快速实现业务部署。 近年来&#xff0c;各大厂也在积…

Android之自定义控件深入

本文主要讲述两个知识点:popwindow的使用和通过继承View实现一个自定义控件&#xff0c;实现点击&#xff0c;手动按钮的效果. popwindow的使用 //定义 popupWindowpopWin new PopupWindow(MainActivity.this);popWin.setWidth(input.getWidth()); //设置宽度popWin.setHeig…

麒麟芯片AI首席科学家,解读AI芯片如何让手机更智能

来源&#xff1a;华为摘要&#xff1a;8月31日&#xff0c;华为发布了新一代顶级人工智能手机芯片——麒麟980&#xff0c;成为全球首款采用7nm制程工艺的手机芯片。麒麟980能做到人脸识别、物体识别、物体检测、图像分割、智能翻译等&#xff0c;实现AI识别质的飞跃。今天&…

协议森林14 逆袭 (CIDR与NAT)

作者&#xff1a;Vamei 出处&#xff1a;http://www.cnblogs.com/vamei 严禁任何形式转载。 IPv4由于最初的设计原因&#xff0c;长度只有32位&#xff0c;所以只提供了大约40亿个地址。这造成了IPv4地址的耗尽危机。随后&#xff0c;IPv6被设计出来&#xff0c;并可以提供足够…

认知神经科学:美陆军高度关注的人工智能与生物科技的交叉学科领域

来源&#xff1a;天大神经工程近年来&#xff0c;随着“第三次抵消战略”的深入推进&#xff0c;美军重点部署人工智能、生物科技等前沿技术领域发展&#xff0c;寻求获取新的领先优势。作为人工智能与生物科技的交叉学科领域&#xff0c;认知神经科学具有颠覆未来作战样式的巨…

Android之自定义属性

安卓自定义属性主要有3个步骤 在values文件夹新建attrs.xml文件中声明属性&#xff0c;包括属性名和格式&#xff0c;format常用属性有string ,integer,reference等 <?xml version"1.0" encoding"utf-8"?> <resources><!-- 声明属性集…

log4j的配置方法

一、 介绍 Log4j是Apache的一个开放源代码项目&#xff0c;通过使用Log4j&#xff0c;我们可以控制日志信息输送的目的地是控制台、文件、GUI组件、甚至是套接口服务 器、NT的事件记录器、UNIX Syslog守护进程等&#xff1b;我们也可以控制每一条日志的输出格式&#xff1b;通…

中国智能制造发展趋势!

来源&#xff1a;中国电子信息产业发展研究院赛迪顾问认为&#xff0c;我国智能制造发展有三个趋势&#xff0c;即企业向系统方案解决供应商转型&#xff0c;生产更加柔性化、定制化&#xff0c;“互联网”促进价值链向价值网转变。一、智能制造装备企业逐步向系统方案解决供应…

Android开发中目前流行控件和知识点总结

1、SlidingMenu 滑动菜单 应用案例&#xff1a;Facebook 、 Path 2.0 、人人、网易新闻 下载地址&#xff1a; https://github.com/jfeinstein10/SlidingMenu 2、PullToRefresh 下拉刷新 应用案例&#xff1a;新浪微博 等等 &#xff0c;这个很长用哦&#xff01; 下载地址&…