可应用于实际的14个NLP突破性研究成果(三)

论文摘要

当前最先进的语义角色标记(SRL)使用深度神经网络,但没有明确的语言特征。之前的工作表明,抽象语法树可以显著改善SRL,从而提高模型准确性。在这项研究中,我们提出了语言学的自我关注(LISA):该神经网络模型将 multi-head self-attention 与多任务学习相结合,包括依赖解析、词性标注、谓词检测和语义角色标记。与先前需要大量预处理来准备语言特征的模型不同,LISA 可以仅使用原始的 token 对序列进行一次编码,来同时执行多个预测任务。此外,如果已经有高质量的语法分析,则可以在测试时加入,而无需重新训练我们的SRL模型。在CoNLL-2005 SRL的实验中,LISA使用预测谓词和标准字嵌入帮助模型实现了最新的最先进性能。LISA还通过上下文编码(ELMo)词表示超出了最新技术水平。

总结

来自UMass Amherst信息与计算机科学学院和Google AI语言的研究人员介绍了基于语言学的自我注意(LISA),这是一种结合了深度学习和语言形式主义的神经网络模型,因此它能够更有效地利用句法解析来获得语义。实验表明,LISA不仅在新闻领域应用表现优秀,它还在分析写作风格方面取得了最先进的表现,而且还可以很好地概括在不同领域的写作风格,如新闻和小说写作。

 

论文的核心思想是什么?

·       基于Transformer编码器的语言学自我关注(LISA)模型。

·       网络的输入可以是一系列标准的预训练GloVe字嵌入,但是通过预先训练的ELMo表示与任务特定的学习参数相结合,可以实现更好的性能。

·       为了将语言知识传递到后面的层次,研究人员建议训练自我关注机制以处理与句子的句法结构相对应的特定标记。此外,可以在测试时执行辅助解析信息的注入,而无需重新训练模型。

·       遵循多任务学习方法,共享语义角色标记(SRL)模型中较低层的参数以预测词性和谓词。

 

取得了什么关键成就?

·       开发一种将语法集成到神经网络模型中的新技术。

·       在语义角色标记中实现最新的最先进性能:

1、使用GloVe嵌入:在新闻领域上获得+2.5 F1积分,在域外文本上获得+ 3.5F1分数;

2、使用ELMo嵌入:在新闻上获得+1.0 F1点,在域外文本上获得+2.0F1分数。

AI社区对其评价是什么?

1.该论文被EMNLP 2018评为最佳长篇论文奖,EMNLP 2018是自然语言处理领域的领先会议。 

未来的研究领域是什么?

·       提高模型的解析精度。

·       开发更好的训练技巧。

·       适应更多任务。

什么是可能的商业应用?

1、语义角色标记对许多下游NLP任务很重要,包括:

§  信息提取;

§  问题回答;

§  自动摘要;

§  机器翻译。

你在哪里可以得到实现代码?

1.本研究论文的实施可从这里获得。

9.一种用于学习语义任务嵌入的分层多任务方法,作者:VICTOR SANH,THOMAS WOLF和SEBASTIAN RUDER

论文摘要

我们已经投入了大量精力来评估是否可以利用多任务学习在各种自然语言处理的应用中使用丰富表示。然而,我们真正缺乏的是对多任务学习具有显著影响的设置的理解。在这篇论文中,我们介绍了在一个精心挑选在多任务学习设置中训练的分层模型。该模型以分层方式进行训练,通过监督模型底层的一组低级任务和模型顶层的更复杂任务来归纳偏差。该模型在许多任务上实现了最优秀的结果,例如命名实体识别。分层训练监督在模型的较低层引入一组共享语义表示,我们已经证实,当我们从模型的底层移动到顶层时,层的隐藏状态往往代表更复杂的语义信息。

总结

研究人员为一组相互关联的NLP任务引入了一种多任务学习方法:命名实体识别,实体指代识别,共指消解和关系提取。他们证实,以分层方式训练的单一模型可以解决上述的四项任务。此外,与单任务模型相比,多任务学习框架显着加快了训练过程。

本文的核心思想是什么?

·       多任务学习方法可以有效地用于一组相互依赖的NLP任务。

·       四个基本语义NLP任务:命名实体识别,实体指代识别,共指消解和关系提取相互受益,因此可以组合在单个模型中。

·       该模型假定所选语义任务之间存在层次结构:某些任务更简单,需要对输入进行较少的修改,因此可以在神经网络的较低层进行监督学习,而其他任务则更加困难,需要更复杂的处理输入,因此,应该在神经网络的更高层监督学习。

什么是关键成就?

·       分层多任务学习模型(HMTL)在4个任务中的挑战了其中三个最先进的结果,即命名实体识别,关系提取和实体指代检测任务。

·       与单任务模型相比,多任务学习框架大大加快了训练速度。

AI社区对其的看法是什么?

1.该论文将在2019年1月的AAAI会议上发表。

未来的研究领域方向是什么?

·       将多任务学习模型与预训练的BERT编码器相结合。

·       搜索多任务学习的其他设置。

什么是可能的商业应用?

1、企业可以利用这种多任务学习方法的优势,即高性能和高训练速度,来增强:

§  聊天机器人和语音助理的表现;

§  在文件中查找相关信息;

§  分析客户评论等;

你在哪里可以得到实现代码?

1.你可以在GitHub上的获得这篇研究论文的代码。

10. 了解你不知道的事情:SRANAD的无法回答的问题,作者:PRANAV RAJPURKAR,ROBIN JIA和PERCY LIANG

论文摘要

提取阅读理解系统通常可以在上下文文档中找到问题的正确答案,但是它们也倾向于对在上下文中没有陈述正确答案的问题做出不可靠的猜测。现有数据集太专注于可回答的问题,为了解决这些弱点,我们提供了SQuAD 2.0,这是斯坦福问答数据集(SQuAD)的最新版本。SQuAD 2.0将现有的SQuAD数据与众包工作者写的50000多个无法回答的问题结合起来,看起来类似于可回答的问题。为了在SQuAD 2.0上做得好,系统不仅要在可能的情况下回答问题,还要确定段落何时不支持答案并且不回答问题。

总结

斯坦福大学的一个研究小组扩展了著名的斯坦福问答数据集(SQUAD),增加了超过5万个个无法回答的问题。这些问题的答案无法在段落中找到,但问题与可回答的问题非常相似。更重要的是,段落包含对这些问题的合理(但不正确)答案。这使得新的SQuAD 2.0对现有的最先进模型极具挑战性:在引入无法回答的问题之后,一个强大的神经系统在之前版本的SQuAD上达到86%的准确率,而现在只有66%。

本文的核心思想是什么?

·       当前的自然语言理解(NLU)系统远非真正的语言理解,其中一个根本原因是现有的Q&A数据集关注的是在上下文文档中保证正确答案存在的问题。

·       要真正具有挑战性,应该创建无法回答的问题,其中:

§  它们与支持段落相关;

§  该段包含一个似是而非的答案,其中包含与问题要求相同类型的信息,但不正确。

什么是关键成就?

·       通过53777个新的无法回答的问题扩展SQuAD,从而构建具有挑战性的大规模数据集,迫使NLU系统学习何时无法根据上下文回答问题。

·       通过显示现有模型66%的准确性,为NLU系统创造新的挑战。

·       显示合理的答案确实可以作为NLU系统的有效干扰者。

AI社区对其的看法是什么?

·       该论文被2018年计算语言学协会(ACL)公布为最佳短篇论文。

·       新的数据集增加了NLU领域的复杂性,实际上可以为该研究领域带来巨大的绩效训练。

未来的研究领域是什么?

1.开发“知道他们不知道的东西”的新模型,从而更好地理解自然语言。

可能的商业应用是什么?

1.在这个新数据集上训练阅读理解模型应该可以提高他们在现实情况下的表现,而这些情景往往无法直接获得答案。

 


原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/519841.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

服务器cpu虚拟插槽,服务器更换cpu插槽

服务器更换cpu插槽 内容精选换一换弹性云服务器创建成功后,您可以根据需求,修改云服务器的名称。系统支持批量修改多台弹性云服务器的名称,修改完成后,这些弹性云服务器的名称相同。登录管理控制台。单击管理控制台左上角的&#…

云+X案例展 | 民生类:贝斯平云助力500强跨国企数字化转型

本案例由贝斯平云投递并参与评选,CSDN云计算独家全网首发;更多关于【云X 案例征集】的相关信息,点击了解详情丨挖掘展现更多优秀案例,为不同行业领域带来启迪,进而推动整个“云行业”的健康发展。在全球化的科技进步和…

基于Alluxio系统的Spark DataFrame高效存储管理技术

介绍 越来越多的公司和组织开始将Alluxio和Spark一起部署从而简化数据管理,提升数据访问性能。Qunar最近将Alluxio部署在他们的生产环境中,从而将Spark streaming作业的平均性能提升了15倍,峰值甚至达到300倍左右。在未使用Alluxio之前&#…

云+X案例展 | 金融类:青云QingCloud助力泰康人寿云计算演进之路

本案例由荣之联投递并参与评选,CSDN云计算独家全网首发;更多关于【云X 案例征集】的相关信息,点击了解详情丨挖掘展现更多优秀案例,为不同行业领域带来启迪,进而推动整个“云行业”的健康发展。泰康保险泰康云平台 青…

阿里云Kubernetes容器服务上体验Knative

概述 Knative Serving是一种可缩放至零、请求驱动的计算运行环境,构建在 Kubernetes 和 Istio 之上,支持为 serverless 应用、函数提供部署与服务。Knative Serving的目标是为Kubernetes提供扩展功能,用于部署和运行无服务器工作负载。 下面…

IoT Studio + LoRa打造“又猛又持久”的智能厕所

概述 为了增加厕所使用效率,减少被味道“熏陶”的等待时间,同时也为了增加厕所的清洁效率,我们决定做一个非侵入式的智能厕所改造方案。它可以通过红外热释电检测每个坑位有没有人,在web/app上实时显示,方便如厕人员查…

分布式事务中间件Fescar—全局写排它锁解读

前言 一般,数据库事务的隔离级别会被设置成 读已提交,已满足业务需求,这样对应在Fescar中的分支(本地)事务的隔离级别就是 读已提交,那么Fescar中对于全局事务的隔离级别又是什么呢?如果认真阅…

萤石网络摄像头服务器稳定吗,萤石摄像头画面稳定性如何?

稳定性很好,体现在:1、C1S互联网摄像头提供400万像素的摄像头,拥有双向实时语音功能,包括内置温湿度传感器、内置备用电池以及“放大镜”功能。2、萤石爱家神器C2采用内置6块光学镜片的监控镜头,720P图像会保证视频画面…

GTC CHINA 2019 | 黄仁勋发表主题演讲,多项创新技术与合作全面助力 AI 加速落地

近日,NVIDIA 创始人兼首席执行官黄仁勋在中国苏州举办的 GTC China 大会上发表主题演讲,宣布多项创新技术与合作,并阐述了 NVIDIA 如何助力 AI 加速进入大规模应用。 GTC China 是 NVIDIA 每年在中国最重要的大会,今年更是吸引了 …

Kubernetes 调度器实现初探

Kubernetes 调度器 Kubernetes 是一个基于容器的分布式调度器,实现了自己的调度模块。 在Kubernetes集群中,调度器作为一个独立模块通过pod运行。从几个方面介绍Kubernetes调度器。 调度器工作方式 Kubernetes中的调度器,是作为单独组件运…

NVIDIA发布先进的软件定义自主机器平台DRIVE AGX Orin

近日,NVIDIA发布了用于自动驾驶和机器人的高度先进的软件定义平台——NVIDIA DRIVE AGX Orin™。 该平台内置全新Orin系统级芯片。该芯片由170亿个晶体管组成,凝聚着NVIDIA团队为期四年的努力。Orin系统级芯片集成了NVIDIA新一代GPU架构和Arm Hercules C…

OceanBase在蚂蚁金服的智能运维实践之路

OB君:蚂蚁金服资深技术专家虞舜将在本文为大家分享蚂蚁金服数据库所面对的业务挑战,解读OceanBase的自治数据库体系,解密OceanBase在天猫双11大促期间的稳定性解决方案,探索OceanBase在蚂蚁金服的智能运维实践之路。本文整理自Oce…

机器人技术大提升:NVIDIA为构建自主机器统一平台树立里程碑

近日,NVIDIA发布了全新版本Isaac软件开发套件(SDK),为机器人提供更新的AI感知和仿真功能。 NVIDIA创始人兼首席执行官黄仁勋在NVIDIA最新的GPU技术会议(GTC CHINA 2019)上宣布了该消息。在建立统一的机器人…

DLA实现跨地域、跨实例的多AnalyticDB读写访问

1. 介绍 实时数据仓库ADB(AnalyticDB)云产品:https://www.aliyun.com/product/ads数据湖分析服务DLA(Data Lake Analytics)云产品:https://www.aliyun.com/product/datalakeanalytics数据湖分析DLA简介&am…

Data Lake Analytics: 以SQL方式查询Redis数据

Data Lake Analytics 作为云上数据处理的枢纽,最近加入了对于Redis 的支持, 这篇教程带你玩转 DLA 的 Redis 支持。 创建数据库 在 DLA 里面创建一个底层映射到 Redis 的数据库的语法如下: CREATE DATABASE redis_test WITH DBPROPERTIES (catalog redis,locati…

云上中国年,阿里云CDN猪年春节高峰流量再创新高

虽然科技拉近了时空距离,但是大部分中国人还是在春节前穿越了千山万水,为的就是能与家人吃一顿年夜饭,这是中国人不变的情结。 过春节,红包可是少不了的关键词,互联网赋予了红包更多元的意义。各大平台每年都会有新玩…

分布式事务中间件 Fescar—RM 模块源码解读

前言 在SOA、微服务架构流行的年代,许多复杂业务上需要支持多资源占用场景,而在分布式系统中因为某个资源不足而导致其它资源占用回滚的系统设计一直是个难点。我所在的团队也遇到了这个问题,为解决这个问题上,团队采用的是阿里开…

腾讯多媒体实验室:基于三维卷积神经网络的全参考视频质量评估算法

腾讯有多个视频业务线,点播视频有腾讯视频、企鹅影视,短视频有微视、K歌,直播类有Now直播、企鹅电竞,实时传输类有QQ和微信的音视频通话、无线投屏和腾讯会议等。 用户对不同的产品有不同程度的期待:比如理想网络环境…

使用 QuickBI 搭建酷炫可视化分析

随着各行各业大数据的渗透,BI 类数据分析需求与日俱增,如何让可视化更好的展现数据的价值,是 BI 类产品一直努力的方向。对此国内外的BI产品都有自己的方法,如国外大牌的 PowerBI、Tableau,还有国内的 FineBI、BDP、Qu…