一文概述 2018 年深度学习 NLP 十大创新思路

640?wx_fmt=jpeg

来源:AI科技评论

摘要:Sebastian Ruder 是一位 NLP 方向的博士生、研究科学家,最近,他基于十几篇经典论文盘点了 2018 年 NLP 领域十个令人激动并具有影响力的想法,并将文章发布在 Facebook 上。


今年,我发现了 十个令人激动并具有影响力的想法,并将其汇总成了这篇文章。在未来,我们可能还会对它们有更多了解。


对于每个想法,我都挑选 1-2 篇对该想法执行良好的论文。我试图保持这份清单的简洁性,因此如果没有覆盖到所有相关工作,还请大家见谅。这份清单包含主要与迁移学习相关的想法及其概述,不过也必然会带有一定的主观性。其中的大部分(一些例外)并不是一种趋势(但我预测其中的一些想法在 2019 年会变得更具趋势性)。


1)无监督的机器翻译翻译(Unsupervised MT)


ICLR 2018 收录的两篇关于无监督机器翻译翻译的论文(https://arxiv.org/abs/1710.11041)中,无监督机器翻译的整个过程的表现好得让人感到惊讶,但结果却不如监督系统。在 EMNLP 2018,两篇同样来自这两个团队的论文(https://arxiv.org/abs/1809.01272)显著改进了之前的方法,让无监督的机器翻译取得了进展。代表性论文:


《基于短语和神经的无监督机器翻译》(EMNLP 2018)


  • Phrase-Based & Neural Unsupervised Machine Translation

  • 论文地址:https://arxiv.org/abs/1804.0775


这篇论文很好地为无监督机器翻译提取了三个关键要求:良好的初始化、语言建模以及你想任务建模(通过反向翻译)。我们在下文中会看到,这三项要求同样对其他的无监督场景有益。反向任务建模要求循环的一致性,其已在不同方法(尤其是 CycleGAN,https://arxiv.org/abs/1703.10593)中得到应用。这篇论文甚至在两个低资源语言对——英语-乌尔都语以及英语-罗马尼亚语上进行了广泛的实验和评估。未来我们有希望看到更多针对资源匮乏类语言的工作。


640?wx_fmt=jpeg

无监督机器翻译三项原则的插图说明:A)两个单语数据集;B)初始化;C)语言建模;D)反向翻译 (Lample et al., 2018)。


2)预训练的语言模型(Pretrained language models)


使用预训练的语言模型可能是今年最重要的 NLP 趋势,因此我在这里就不过多描述。针对预训练的语言模型,这里有很多让人印象深刻的方法:ELMo(https://arxiv.org/abs/1802.05365), ULMFiT(https://arxiv.org/abs/1801.06146)、 OpenAI Transformer 以及 BERT(https://arxiv.org/abs/1810.04805)。代表性论文:


《深度的语境化词语表示》(NAACL-HLT 2018)


  • 《Deep contextualized word representations》

  • 论文地址:https://arxiv.org/abs/1802.05365


这篇论文介绍了 ELMo,颇受好评。除了实证结果让人印象深刻,这篇论文的详细的分析部分也非常显眼,该部分梳理了各类因素的影响,并且分析了在表示中所捕获的信息。词义消歧(WSD)分析自身(下图左)也执行得很好。这两者都表明,机器学习本身就提供了接近最新技术的词义消歧和词性标注性能。


640?wx_fmt=jpeg


与基线相比的第一层和第二层双向语言模型的词义消歧(左)和词性标注(右)结果(Peters et al., 2018)。


3)常识推理数据集(Common sense inference datasets)


将常识融入模型是向前发展的最重要方向之一。然而,创建好的数据集并不容易,甚至最常用的那些好的数据集还存在很大的偏差。今年出现了一些执行良好的数据集,它们试图教模型一些常识,比如同样都源自华盛顿大学的 Event2Mind(https://arxiv.org/abs/1805.06939)和 SWAG(https://arxiv.org/abs/1808.05326)。其中,SWAG 学到常识的速度出乎意料地快。代表性论文:


《视觉常识推理》(arXiv 2018)


  • Visual Commonsense Reasoning 

  • 论文地址:http://visualcommonsense.com/


这是第一个包含了每个答案所对应的基本原理(解释)的视觉 QA 数据集。此外,问题要求复杂的推理。创建者通过确保每个答案正确的先验概率为 25%(每个答案在整个数据集中出现 4 次,其中,错误答案出现 3 次,正确答案出现 1 次)来不遗余力地解决可能存在的偏差;这就要求使用计算相关性和相似性的模型来解决约束优化问题。我希望,在创建数据集时预防可能的偏倚可以成为未来研究人员们的常识。最终,看看数据精彩地呈现出来就可以了。


640?wx_fmt=jpeg

VCR:给定一张图片、一个区域列表和一个问题,模型必须回答这个问题,并给出一个可解释其答案为何正确的理由。 (Zellers et al., 2018).


4)元学习(Meta-learning)


元学习已在小样本学习、强化学习和机器人技术中得到广泛应用——最突出的例子是与模型无关的元学习(MAML,https://arxiv.org/abs/1703.03400),但其很少在 NLP 中得到成功应用。元学习对于训练示例数量有限的问题非常有用。代表性论文:


《低资源神经机器翻译的元学习》(EMNLP 2018)


  • Meta-Learning for Low-Resource Neural Machine Translation

  • 论文地址:http://aclweb.org/anthology/D18-1398


作者使用 MAML 方法学习翻译的良好初始化,将每一个语言对都视为单独的元任务。适应低资源语言对,可能是对 NLP 中的元学习最有用的设置。特别地,将多语种迁移学习(例如多语种 BERT,https://github.com/google-research/bert/blob/master/multilingual.md)、无监督学习和元学习结合起来是一个有前景的研究方向。


640?wx_fmt=jpeg

迁移学习、多语言迁移学习与元学习之间的区别。 实线:初始化学习。 虚线:调整路径 (Gu et al., 2018).


5)稳健的无监督方法(Robust unsupervised methods)


今年,我们(http://aclweb.org/anthology/P18-1072)和其他研究者(http://aclweb.org/anthology/D18-1056)都已经观察到,当语言不同时,无监督的跨语言词向量方法就会失效。这是迁移学习中的常见现象,其中源和目标设置(例如,域适应中的域 https://www.cs.jhu.edu/~mdredze/publications/sentiment_acl07.pdf、连续学习https://arxiv.org/abs/1706.08840 和多任务学习 http://www.aclweb.org/anthology/E17-1005 中的任务)之间的差异会导致模型的退化或失败。因此,让模型对于这些变化更加稳健非常重要。代表性论文:


《用于完全无监督的跨语言词向量的稳健自学习方法》(ACL 2018)


  • A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings

  • 论文地址:http://www.aclweb.org/anthology/P18-1073


该论文利用他们对问题的理解来设计更好的初始化,而不是在初始化上应用元学习。特别地,他们将两种语言中与相似词具有相似的词分布的词进行配对。这是利用领域专业知识和分析见解来使模型变得更稳健的非常好的案例。


640?wx_fmt=png

三个词的相似度分布。 等效翻译(「two」和「due」)的分布比非相关词(「two」和「cane」——意思是「dog」)的分布更为相似。(Artexte et al., 2018)


6)理解表示(Understanding representations)


研究者们未来更好地理解表示,已经做了很多努力。特别是「诊断分类器」(diagnostic classifiers,https://arxiv.org/abs/1608.04207)(旨在评估学习到的表示能否预测某些属性的任务) 已经变得非常常用(http://arxiv.org/abs/1805.01070)了。代表性论文:


《语境化词向量解析:架构和表示》(EMNLP 2018)


  • Dissecting Contextual Word Embeddings: Architecture and Representation

  • 论文地址:http://aclweb.org/anthology/D18-1179


该论文对预训练语言模型表示实现了更好的理解。作者在精心设计的无监督和有监督的任务上对词和跨度表示进行了广泛的学习研究。结果表明:预训练的表示可以在较低的层中学习到低级形态和句法任务相关的任务,并且可以在较高的层中学习到更长范围的语义相关的任务。


对我来说,这个结果真正表明了,预训练语言模型确实捕获到了与在 ImageNet 上预训练的计算机视觉模型(https://thegradient.pub/nlp-imagenet/)相类似的属性。


640?wx_fmt=png

BiLSTM 和 Transformer预训练表示在词性标注、选区分析和无监督共指解析((从左到右)上每层的性能。 (Peters et al., 2018)


7)巧妙的辅助任务(Clever auxiliary tasks)


在许多场景下,我们看到研究者越来越多地将精心挑选的辅助任务与多任务学习一起使用。一个好的辅助任务来说,它必须是易于获取数据的。最重要的例子之一是 BERT(https://arxiv.org/abs/1810.04805),它使用下一个句子的预测(该预测方法在 Skip-thoughts,https://papers.nips.cc/paper/5950-skip-thought-vectors.pdf 以及最近的 Quick-thoughts,https://arxiv.org/pdf/1803.02893.pdf 中应用过)来产生很大的效果。代表性论文:


《语义结构的句法框架》(EMNLP 2018)


  • Syntactic Scaffolds for Semantic Structures

  • 论文地址:http://aclweb.org/anthology/D18-1412


该论文提出了辅助任务,它通过预测每个跨度对应的句法成分类型,来对跨度表示进行预训练。辅助任务虽然在概念上非常简单,但它为语义角色标注和共指解析等跨级别预测任务带来了大幅的改进。这篇论文表明,在目标任务(这里是指跨度任务)所要求的级别上所学到的特定的表示是效益巨大的。


pair2vec:用于跨句推理的组合词对嵌入(arXiv 2018)


  • pair2vec: Compositional Word-Pair Embeddings for Cross-Sentence Inference

  • 论文地址:https://arxiv.org/abs/1810.08854


类似地,本论文通过最大化词对与其语境间的点互信息(pointwise mutual information),来对词对表示进行预训练。这就激励了模型学习更有意义的词对表示,而不使用语言建模等更通用的目标。在 SQuAD 和 MultiNLI 等要求跨句推理的任务中,预训练表示是有效的。


我们可以期望未来,看到更多的预训练任务,能够捕获特别适用于某些下游任务的属性,并且能够与语言建模等更多通用任务相辅相成。


640?wx_fmt=jpeg

OntoNotes的句法、PropBank和共指注释。PropBank SRL参数和共指提及被标注在了句法成分的顶部。几乎每一个参数都与一个句法成分有关。 (Swayamdipta et al., 2018)


8)半监督学习和迁移学习相结合(Combining semi-supervised learning with transfer learning)


伴随着迁移学习的最新进展,我们不应该忘记使用特定的目标任务数据的更明确的方法。事实上,预训练表示与许多半监督学习方法是相辅相成的。我们已经探索了一种半监督学习的特殊方法——自我标注的方法(http://aclweb.org/anthology/P18-1096)。代表性论文:


《基于交叉视点训练的半监督序列建模》(EMNLP 2018)


  • Semi-Supervised Sequence Modeling with Cross-View Training

  • 论文地址:http://aclweb.org/anthology/D18-1217


这篇论文表明,一个能确保对输入的不同视点的预测与主模型的预测一致的概念上非常简单的想法,可以在大量的任务上得到性能的提高。这个想法与词 dropout 类似,但允许利用未标记的数据让模型变得更稳健。与 mean teacher(https://arxiv.org/abs/1703.01780)等其他自集成模型相比,它是专门针对特定的 NLP 任务设计的。


随着对半监督学习的研究越越来越多,我们将有望看到有更多明确地尝试对未来目标预测进行建模的研究工作。


640?wx_fmt=png


辅助预测模块看到的输入:辅助1 :They traveled to __________________. 辅助2:They traveled toWashington _______. 辅助3: _____________ Washingtonby plane.辅助4:_____________ by plane。 (Clark et al., 2018)


9)大型文档的问答和推理(QA and reasoning with large documents)


随着一系列新的问答(QA)数据集(http://quac.ai/)的出现,问答系统有了很大的发展。除了对话式问答和多步推理,问答最具挑战性的方面是对叙述和大体量信息进行合成。代表性论文:


《叙述答阅读理解挑战》(TACL 2018)


  • The NarrativeQA Reading Comprehension Challenge 

  • 论文地址:http://aclweb.org/anthology/Q18-1023


这篇论文基于对完整的电影剧本和书籍的提问和回答,提出了一个具有挑战性的新的问答数据集。虽然依靠当前的方法还无法完成这项任务,但是模型可以选择使用摘要(而不是整本书籍)作为选择答案(而不是生成答案)的语境。这些变体让任务的实现更加容易,也使得模型可以逐步扩展到整个语境设置。


我们需要更多这样的数据集,它们能体现具有挑战性的问题,并且有助于解决这些问题。


640?wx_fmt=jpeg

QA 数据集比较


10)归纳偏差(Inductive bias)


CNN 中的卷积、正则化、dropout 以及其他机制等归纳偏差,是神经网络模型的核心部分,它们充当调节器的角色,使模型更具样本效率。然而,提出一个应用更加广泛的归纳偏差方法,并将其融入模型,是具有挑战性的。代表性论文:


《基于人类注意力的序列分类》(CoNLL 2018)


  • Sequence classification with human attention 

  • 论文地址:http://aclweb.org/anthology/K18-1030


这篇论文提出利用视觉跟踪语料库中的人类注意力,来 RNN 中的注意力进行规则化处理。鉴于 Transformer 等当前许多模型都使用注意力这一方法,找到更有效得训练它的方法是一个重要的方向。同时,论文还证明了另外一个案例——人类语言学习可以帮助改进计算模型。


《语义角色标注的语言学信息的自我注意力》(EMNLP 2018)


  • Linguistically-Informed Self-Attention for Semantic Role Labeling

  • 论文地址:http://aclweb.org/anthology/D18-1548


这篇论文有很多亮点:一个在句法和语义任务上进行联合训练的 Transformer 模型;在测试时注入高质量语法分析的能力;以及域外评估。论文还通过训练注意力头来关注每个标注的句法 parents,来使转换器的多头注意力统一对句法更加敏感。

未来我们有望看到更多针对输入特定场景,将 Transformer 注意力头用作辅助预测器的案例。


640?wx_fmt=jpeg

PropBank语义角色标注的十年。语言学信息的自我注意力( LISA )与其他域外数据方法的比较。 (Strubell et al., 2018)


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。


  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/492994.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

斯坦福重磅报告:2030年的人工智能与生活

来源:元浦说文摘要:本文节选自斯坦福大学「人工智能百年研究」的首份报告:《2030 年的人工智能与生活》,这篇报告是计划持续至少 100 年的研究系列中的第一篇。该报告描述了目前人工智能相关技术、法律以及道德上的挑战&#xff0…

万物智联时代——2018年AIOT产业蓝皮书正式发布

来源:物联网资本论摘要:纵观2018年AIOT行业,可以说大事不断,阿里巴巴正式宣布将全面进军物联网,“中兴事件”持续发酵也使得半导体行业受到广泛关注,NB-IoT模组价格进一步下调补贴后已进入20元大关等等。作…

2018微信年度数据报告:00后最爱表情捂脸哭 80后呲牙笑

来源 :腾讯科技摘要:腾讯科技讯 1月9日消息,在今日举行的2019微信公开课PRO上,微信发布了《2018微信年度数据报告》。报告显示,2018年,微信每个月有10.82亿用户保持活跃,每天有450亿次信息发送出…

行业变革的镜子:2018年融资最多的24家美国创业公司

来源:资本实验室据Crunchbase统计,2018年融资最多的24家美国创业公司融资总额达到103.66亿美元,累计融资超过232亿美元。这24家公司为我们提供了非常丰富的数据和视角,让我们得以观察到新技术与新商业模式对传统行业的颠覆正在加速…

一打在2019年亮相的迷人科技项目:飞行汽车、子弹头列车、登月、……

来源:IEEE电气电子工程师学会以色列要登月!以色列的SpaceIL计划在2019年上半年向月球发射一个月球着陆器。该公司最初成立的目的是角逐Google的月球XPrize大奖,但比赛截止日期已过,奖金无人认领。SpaceIL的着陆器将搭一颗印尼电信…

深度学习在目标视觉检测中的应用进展与展望

作者:张慧,王坤峰,王飞跃来源:王飞跃科学网博客摘要:目标视觉检测是计算机视觉领域的一个重要问题,在视频监控、自主驾驶、人机交互等方面具有重要的研究意义和应用价值.近年来,深度学习在图像分类研究中取得了突破性进…

云计算与边缘计算协同发展的一些思考

来源:云计算开源产业联盟摘要:从边缘计算诞生开始,就一直有声音说边缘计算是云计算的“终结者”。但经过时间的验证,云计算和边缘计算的关系更加清晰:由于边缘计算解决了在边缘资源中云计算应用的应用问题,…

腾讯和头条,构建类脑神经元网络的两条路线之争

作者:计算机博士,《互联网进化论》作者刘锋前言:在中国的社交网络领域,今日头条(抖音)等异军突起,对腾讯的优势地位产生了挑战,在这篇文章中用互联网大脑模型,分析了腾讯…

5G年终盘点:2018,意难平

来源:C114中国通信网2018,对于5G来说是动荡的一年。2017年底,在国际电信标准组织3GPP RAN第78次全体会议上,5G NR首发版本正式发布,这是全球第一个可商用部署的5G标准。5G自此走近大众视野,开始被频繁地提起…

BEGINNING SHAREPOINT#174; 2013 DEVELOPMENT 第3章节--SharePoint 2013 开发者工具 站点设置

BEGINNING SHAREPOINT 2013 DEVELOPMENT 第3章节--SharePoint 2013 开发者工具 站点设置 你应该熟悉(假设还咩有)的SharePoint主要部分之中的一个是站点设置。你可用点击右手角落的齿轮图标,点击站点设置来訪问站点设置。在此页面你会发现大部…

一文读懂柔性电子传感器

来源:传感器技术目前,许多智能化的检测设备已经大量地采用了各种各样的传感器,其应用早已渗透到诸如工业生产、海洋探测 、环境保护 、医学诊断 、生物工程 、宇宙 开发 、智能家居等方方面面。 随着信息时代的应用需求越来越高,对…

《金狐系统维护盘》六周年纪念版UD/ISO +PE维护

本版的定位是“重维护,求兼容”,包含Windows 2003 PE维护版和Windows 8 PE X64维护版及功能相当强大的DOS工具MaxDOS9.3增强版,不带三卡驱动,体积小巧(370mb),从茫茫网海里精心挑选50几款精品维…

C++模版类的简单使用

声明转载自:http://blog.csdn.net/hackbuteer1/article/details/6735704 1、模板的概念 我们已经学过重载(Overloading),对重载函数而言,C的检查机制能通过函数参数的不同及所属类的不同。正确的调用重载函数。例如,为求两个数的最大值&…

智慧城市领域又出最新报告——智慧交通将迎来大爆发

来源:雷锋网近日,智慧城市领域又出了一份新的重磅报告——来自全球第二大市场研究机构MarketsandMarkets。综合整体报告来看,其中的几个观点,对于国内智慧城市产业非常有借鉴意义。预测的增长数据报告称,2018年全球智慧…

回顾2018,正在改变未来游戏规则的技术

来源:资本实验室回顾2018年,基于数字化的新技术继续推动着各行的的变革。人工智能、基因技术、物联网、3D打印、区块链……这些技术的应用在改变传统行业游戏规则的同时,给我们提供了关于未来技术应用的想象空间。当然,在看到美好…

jQuery之防止【冒泡事件】,阻止默认行为 【return false】 event.stopPropagation event.preventDefault...

知识点: event.stopPropagation() 阻止冒泡 event.preventDefault() 阻止默认事件,比如button提交后跳转到链接页面 两者都可以用 return false 代替。 冒泡事件就是点击子节点,会向上触发父节点,祖先节点的点击事件。 下面是h…

2018年世界科技发展回顾

来源:科技日报摘要:本文从科技政策、基础研究、信息技术、人工智能与先进制造、空间技术、能源环保等六个领域,回顾了2018年世界主要国家的科技发展。2019年或许会很不平常,只因2018年世界主要国家之间关系风云变幻,让…

给destoon商城的列表中和首页添加购物车功能

如何给destoon商城的列表中和首页添加购物车功能? 目前加入购物车的功能只存在商城的详细页面里,有时候我们需要批量购买的时候,希望在列表页就能够使用这个加入购物车的功能。 修改步骤见下: 例如在商城频道的首页和列表页加这个…

leetcode N-Queens

转载自:http://www.cnblogs.com/TenosDoIt/p/3801621.html N-Queens The n -queens puzzle is the problem of placing n queens on an n n chessboard such that no two queens attack each other. Given an integer n , return all distinct solutions to the …

CES新观察:智能应用全面开花 “陆海空”新品值得关注

来源:网易科技2019年国际消费性电子展(以下简称“CES展”)即将在美国拉斯维加斯落下帷幕,今年是CES走过的第52个年头,虽然已过了“知天命”的年纪,但这丝毫没有影响其在科技行业的影响力和创新力&#xff0…