OpenAI最新研究:如何通过无监督学习提升「自然语言理解能力」?

640?wx_fmt=png

来源:amazonaws.com

摘要:长期以来,使用无监督(预)训练来提高区别性任务的性能表现一直是机器学习研究的一个重要目标。最近,OpenAI通过使用一个具有可扩展性的任务不可知系统,在一系列不同的自然语言任务上实现了当前最先进的研究成果。而该系统将两种现有的方法进行了联合,即transformers和无监督预训练。接下来,我们就来了解一下。


一般来说,自然语言理解涵盖各种各样的任务,如文本蕴涵(textual entailment)、问题回答(question answering)、语义相似度评估(semantic similarity assessment)和文档分类(document classification)。尽管大型未标记的文本语料非常丰富,但用于学习这些特定任务的已标记数据却很少,从而使得那些经过区别性训练的模型充分发挥其作用变得具有挑战性。我们研究证明,在这些任务上的巨大收益可以通过对未标记文本的不同语料库中的语言模型进行生成式预训练,然后在每个特定任务上进行区别性微调来实现。


与以往的方法相比,我们在微调过程中利用任务感知输入转换来实现有效的迁移,同时需要对模型体系结构进行最小程度化的更改。我们在大量的自然语言理解基准上展示了我们所提出方法的有效性。我们的通用任务不可知模型(task-agnostic model)的性能表现要远远优于那些使用针对每项任务专门设计的体系结构进行区别性训练的模型,在所研究的12项任务中,有9项都显著地对现有的最先进技术有了改进。


例如,我们在常识推理(commonsense reasoning)(Stories Cloze Test)方面实现了8.9%的绝对性改进,在问题回答(RACE)方面的改进为5.7%,在文本方面(MultiNLI)改进为1.5%。


640?wx_fmt=png

图1:(左)本研究中使用的Transformer架构和训练目标。(右)在不同任务中用于微调的输入变换。我们将所有结构化输入转换为标记序列,以便由我们的预训练的模型进行处理,然后再用线性+ softmax层进行处理。


可以这样说,从原始文本中进行有效学习的能力对于缓解自然语言处理(NLP)中对监督学习的依赖具有至关重要的作用。大多数深度学习方法都需要大量的手动标记数据,而这限制了它们在许多缺乏注释资源的领域内的适用性。在这些情况下,可以利用未标记数据中语言信息的模型为收集更多注释提供了一个有价值的替代性选择方法,而这些注释可能是非常耗时且昂贵的。


此外,即使在有相当多的监督可用的情况下,以无监督的方式学习良好的表征也可以提供显著的性能提升。到目前为止,最令人信服的证据就是,使用了大量的预训练词嵌入(word embeddings)以提高一系列NLP任务的性能改进。 


然而,对于未标记文本中词级以上信息的利用是具有挑战性的,主要有两个原因。首先,不清楚什么类型的优化目标在学习那些对于迁移有用的文本表征时是最有效的。最近的研究着眼于各种目标,如语言建模、机器翻译、以及语篇连贯(discourse coherence),且每种方法在不同任务上的性能表现都要优于其他方法;其次,对于最有效的方法而言并没有达成一种共识从而将这些已学习的表征迁移到目标任务中。


现有技术涉及到一种使用错综复杂的学习方案和添加辅助学习目标,对模型架构进行特定于任务的更改的组合。这些不确定性使得难以为语言处理开发出一种有效的半监督学习方法。


640?wx_fmt=png

图2:我们实验中所使用的不同任务和数据集列表。


在本文中,我们使用无监督预训练和监督微调的组合,探索了一种用于语言理解任务的半监督方法。我们的目标是学习一种通用的表征方式,而这种表征能够几乎不做任何调整就迁移到各种各样的任务中。我们假设可以访问大量未标记文本的语料库以及若干个具有手动注释的训练样本(目标任务)的数据集。


我们的设置不要求这些目标任务与未标记的语料库处于相同的域中。我们采用了一个两阶段的训练程序。首先,我们在未标记的数据上使用一个语言建模目标来学习神经网络模型的初始参数。随后,我们使用一个相应的监督目标将这些参数调整为目标任务中。


对于我们的模型体系结构,我们使用的是Transformer,它已被证明在诸如机器翻译、文档生成和句法分析等各种任务中的性能表现非常好。这种模型选择为我们提供了一个更加结构化的记忆,用于处理文本中的长期依赖关系,与循环网络等替代方案相比,它可在各种任务中实现具有鲁棒性的迁移性能。


在迁移过程中,我们利用来自遍历式方法(traversal-style approaches)的特定于任务的输入调整,它将结构化文本输入作为单个连续的标记序列进行处理。正如我们在实验中所展示的那样,这些适应性调整使得我们能够对已预训练模型的体系结构进行最小限度的更改,从而进行有效的微调。


640?wx_fmt=png

图3:(左)从RACE和MultiNLI上的预训练语言模型迁移越来越多层的效果。(右图)显示了随着LM预训练函数的更新,不同任务中零样本性能表现的演变情况。每个任务的性能在随机猜测基线和单一模型当前最先进的技术水平之间进行归一化。


在本文中,我们在四种语言理解任务上——自然语言推理、问题回答、语义相似度和文本分类,对我们所提出的方法进行了评估。我们的通用任务不可知模型的性能表现要远远胜过那些使用针对每项任务专门设计的体系结构进行区别性训练的模型,在所研究的12项任务中,有9项都对现有的最先进技术进行了显著改进。


例如,我们在常识推理(Stories Cloze Test)获得了8.9%的改进、在问题回答(RACE)获得了5.7%的改进、在文本蕴涵(MultiNLI)获得了1.5%的改进,以及在最近引入的GLUE多任务基准上获得了5.5%的改进。我们还在四种不同的环境设置中分析了预训练模型的零样本(zero-shot)行为,并证明它为下游任务获取有用的语言知识。


我们引入了一个框架,通过生成式预训练和区别性微调,用单个任务不可知模型实现强大的自然语言理解。通过对具有长距离连续文本的多样语料库进行预训练,我们的模型获得了重要的世界知识和处理远程依赖的能力,而这种能够随后将成功地迁移到解决诸如问题回答、语义相似度评估、蕴涵确定、文本分类等区分性任务,改进我们所研究的12个数据集中的9个当前最先进技术的性能表现。


长期以来,使用无监督(预)训练来提高区别性任务的性能表现一直是机器学习研究的一个重要目标。而我们的研究表明,实现显著的性能收益确实是可能的,并提供了一些有关对于什么样的模型(Transformers)和数据集(具有长距离依赖关系的文本)来说,使用这种方法将最有效的提示。我们希望这将有助于开展在自然语言理解和其他领域中对无监督学习的新研究,从而进一步提高我们对无监督学习将如何以及何时发挥作用的理解。


原文链接:https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/495416.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

安卓逆向_15( 一 ) --- JNI 和 NDK

From:较详细的介绍JNI:https://blog.csdn.net/lizhifa2011/article/details/21021177 From:https://www.jb51.net/article/126111.htm NDK 官方文档:https://developer.android.google.cn/training/articles/perf-jni JNI / NDK …

Nature:科学家成功绘制出大脑神经细胞“地图”

图片来源:Thomas Hainmller, Marlene Bartos来源:生物谷摘要:最近,一项刊登在国际杂志Nature上的研究报告中,来自弗莱堡大学的科学家们通过研究开发出了一种新型模型来解释大脑如何储存一些“有形事件”(ta…

互联网的大脑模型与原子的太阳系模型,科学史上的巨系统对比

作者:刘锋 计算机博士,互联网进化论作者科学探索中,有两种重要的促进力量,第一种是认同,会帮助研究者增强对探索方向的信心和勇气,第二种是批判,会帮助研究者获知探索路上的障碍和陷阱。10年前…

安卓逆向_15( 二 ) --- Android Studio 3.6.3 JNI 环境配置 和 so 生成开发 demo

From:Android Studio 3.0 JNI 的实现:https://blog.csdn.net/ziyoutiankoong/article/details/79696279 Android Studio 生成so包和.H文件给jni调用产生新so包。(即so包调so包):https://blog.csdn.net/sxh_android/article/details/80694291…

卡内基梅隆大学机器学习系副主任邢波:AI落地现在最缺的是思维方式

来源:亿欧摘要:邢波认为:人工智能现在最缺的不是算法和知识,而是落地应用的思维方式;数据如何被处理、系统如何被调试、资源如何配置,目前阶段还处于黑箱,很混沌的状态;人工智能未来…

安卓逆向_15( 三 ) --- Android NDK 开发【 jni 静态注册、JNI_OnLoad 动态注册】

Android Studio开发JNI示例:https://blog.csdn.net/wzhseu/article/details/79683045 JNI_动态注册_静态注册.zip : https://pan.baidu.com/s/1wpTYA9euSdPqE1Z2bA_BHA 提取码: 7h97 错误: 编码GBK的不可映射字符 ( https://blog.csdn.net/talenter111/article/de…

学界 | DeepMind等机构提出「图网络」:面向关系推理

来源:机器之心摘要:近日,由 DeepMind、谷歌大脑、MIT 和爱丁堡大学等公司和机构的 27 位科学家共同提交的论文《Relational inductive biases, deep learning, and graph networks》引起了人们的关注。深度学习虽然精于分类,但一直…

ARM 汇编基础教程番外篇 ——配置实验环境

From:https://zhuanlan.zhihu.com/p/29145513 win10 arm 汇编环境 Windows 平台下搭建 ARM 汇编集成环境:https://jingyan.baidu.com/article/4b52d70288bfcdfc5c774ba5.html 要调试 ARM 程序,我们需要: 能运行 ARM 程序的运行环…

asp.net调试方法

1、先将网站设为启动项目。 2、选择“启动选项”。 3、进行设置: 然后调试,在浏览器输入网址,此时如果遇到“断点”程序将自动停止运行,即可进行调试,查看运行中的变量的值。 转载于:https://www.cnblogs.com/gwjtssy/…

基因对智力的预测能力不到7%,别迷信它

图片来源:The Conversation撰文 Carl Zimmer翻译 李杨审校 贾晓璇编辑 魏潇2016 年我在写一本关于遗传的书时,曾对自己的基因组进行了测序。一些科学家还好心地指出了我基因组图谱的一些有趣特征,教我如何自己读取数据。从那以后,…

ARM 汇编语言入门

[翻译]二进制漏洞利用(二)ARM32位汇编下的TCP Bind shell:https://bbs.pediy.com/thread-253511.htm ARM汇编语言入门 From:ARM汇编语言入门(一):https://zhuanlan.zhihu.com/p/109057983 原文…

图灵奖演讲2018,59页PPT迎接芯片体系结构的新黄金时代

来源: 计算所控制计算实验室6月4日,在今年的国际计算机体系结构大会ISCA2018的图灵奖演讲会上,ACM/IEEE邀请了2017年图灵奖获得者John Hennessy与David Patterson联合进行了一场关于未来计算机体系结构发展道路探索的精彩演讲。二位图灵奖得主…

ARM 指令集 和 Thumb 指令集

From:https://gitee.com/lsliushuang/ASM/blob/master/arm汇编.txt ARM 汇编指令集汇总:https://blog.csdn.net/qq_40531974/article/details/83897559 ARM 指令集详解(超详细!带实例!):https://blog.csdn.net/micke…

花旗银行将因人工智能裁员50%,失业风波究竟要持续多久

来源:ofweek摘要: 在这个人工智能随时可能会取代人类工作的年代里,人们对自己的工作的未来应该去了解和重视,尤其是数字类别的行业,像是会计、税务、收费站是最早被人工智能替代的一批。在这个人工智能随时可能会取代人…

Python 程序的抽样分析器 - Py-Spy

From:https://python.freelycode.com/contribution/detail/1320 GitHub 地址:https://github.com/benfred/py-spy Py-Spy 是 Python 程序的抽样分析器。 它允许您可视化 Python 程序正花费时间在哪部分,而无需重新启动程序或以任何方式修改代…

微观世界探索者:15家值得关注的纳米技术公司

来源:资本实验室摘要:纳米技术就像微观世界的魔术,让人类得以前所未有地深入到物质的分子与原子层面,探索生物、化学、物理等各领域的融合。资本实验室今日投资关注聚焦前沿科技创新与传统产业升级纳米技术就像微观世界的魔术&…

DeepMind新论文:给侧面照片,AI给你脑补出正面

来源:澎湃新闻摘要:大家在学生时代可能都面对过这些涉及空间想象的几何题。从根本上,它们考验的是2D图像和3D场景间的转换能力。如今,人工智能也成功打破了这种“次元壁”。用小立方体搭一个几何体,使它的主视图和俯视…

安卓逆向 和 手游辅助 学习 路线

From:https://zhuanlan.zhihu.com/p/95915254 知乎:Android 逆向分析学习路线?:https://www.zhihu.com/question/25626303 入门篇 --- 学习Android安全和逆向开发的路线总结:https://www.52pojie.cn/thread-1065039-…

可交互的对抗网络如何增强人类创造力?

编译:集智翻译组来源:distill.pub作者:Shan Carter,Michael Nielsen原题:Using Artificial Intelligence to Augment Human Intelligence摘要:计算机不仅可以是解决数学问题的工具,还可以是拥有…

ARM 寄存器 详解

From( ARM 寄存器详解 ):https://blog.csdn.net/sandeldeng/article/details/52954781 ARM 汇编基础教程:2.数据类型和寄存器:https://www.52pojie.cn/thread-797306-1-1.html ARM 的 寄存器 ARM 工作状态 和 工作模式…