NLP 解决方案是如何被深度学习改写的?

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

作者:杨晓凡

摘要:英特尔人工智能产品事业部,数据科学主任 Yinyin Liu 近日撰写了一篇文章,介绍了深度学习为自然语言处理带来的种种变化。有趣的大趋势是首先产生在 CV 领域的技术也不断用于 NLP,而深度学习解决方案的构建方式也随着时间在进化。


自然语言处理(NLP)是最常见的人工智能的应用方式之一,它通过消费者数字助理、聊天机器人以及财务和法律记录的文本分析等商业应用变得无处不在。随着硬件和软件能力的提升,以及模块化 NLP 组件的发展,Intel 的技术也使得各种各样的 NLP 应用成为可能。


深度学习性能的上升趋势


近年来,许多 NLP 领域的进展都是由深度学习领域的普遍进步驱动的。深度学习拥有了更强大的计算资源,可以运用更大的数据集,并且在神经网络拓扑结构和训练范式方面有所发展。这些深度学习的进步始于推动计算机视觉应用的改进,但是也让自然语言处理领域极大地获益。


在深度学习的网络层方面,为了使得信号和梯度能够更容易地传递到深度神经网络的每一层,残差结构单元(residual layer)、highway 层(全连接的 highway 网络)以及稠密连接(dense connections)结构应运而生。有了这些网络层,目前最先进的计算机视觉技术通过利用深度学习网络的表示能力得以实现。同时,他们也在许多自然语言处理任务上提高了模型的性能。例如,将稠密连接的循环层用于语言模型(Improving Language Modeling using Densely Connected Recurrent Neural Networks,https://arxiv.org/abs/1707.06130  )。


640?wx_fmt=jpeg


有实证研究中比较了卷积层、循环层或者一种结合了这两种思想的时序卷积层的表现,时序卷积层在一系列的语言数据集上取得了目前最好的效果(Convolutional Sequence to Sequence Learning,https://arxiv.org/abs/1705.03122;An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling,https://arxiv.org/abs/1803.01271)。有这些不同类型的层可供灵活使用,使得开发者能够在处理特定的自然语言处理问题时尝试各种各样的选项。


在深度学习的拓扑结构方面,一个自编码器(auto-encoder)模型可以被改进为一个序列到序列(seq2seq)模型用于处理顺序语言数据。注意力机制(attention mechanism)解决了随着时间的推移,解码网络应该如何对输入的编码做出响应。指针网络(Pointer network),作为注意力模型的一种变体,专门用于在输入序列中寻找词语的位置,它为机器阅读理解和文本摘要提供了一种新的处理机制(Machine Comprehension Using Match-LSTM and Answer Pointer,https://arxiv.org/abs/1608.07905;Get To The Point: Summarization with Pointer-Generator Networks,https://arxiv.org/abs/1704.04368)。通过增加快速权重(fast weights),(Fast Weights to Attend to the Recent Past,https://arxiv.org/abs/1610.06258)短期联想记忆的概念可以和长期序列的学习结合到一起。


640?wx_fmt=jpeg


在训练范式方面,无监督学习利用训练数据本身和迁移学习技术去构建数据表示,迁移学习可以把学到的将表征用于一个又一个的任务,都是从计算机视觉领域获得启发,推动了自然语言处理技术的进步。


由于这些深度学习模型共用了许多底层的组件,基于深度学习的自然语言处理解决方案可以与计算机视觉和其它人工智能功能的解决方案共用软件和硬件。对于深度学习的通用软件栈的优化也可以为深度学习自然语言处理解决方案的性能带来改善。英特尔的人工智能硬件和软件组合解决方案为这些在英特尔架构的系统上运行的深度学习进展提供了很好的示例。最近,在我们的硬件和对广泛使用的深度学习框架的优化上的工作提供了为在英特尔至强可扩展处理器上运行普遍使用的模型和计算任务优化后的工作性能。英特尔也积极地将他们的这些努力回馈到开放的框架中,这样一来,每个开发者都能很直接地获得这些经验。


为自然语言处理用例构建一个灵活的、模块化的栈


由于基于深度学习的自然语言处理模型通常拥有共用的构建模块(例如:深度学习网络层和深度学习拓扑结构),这让我们在构建自然语言处理用例的基础时拥有了一个全新的视角。一些底层的功能在很多种应用中同时被需要。在一个开放的、灵活的栈中获得基本组件对于解决各种各样的自然语言处理问题是十分恰当的。


640?wx_fmt=jpeg


相比之下,传统的机器学习或者深度学习的做法都是每一次只考虑某一个特定问题。而如今,由于深度学习社区已经提供了许多有用的基础功能模块,企业中的用户和数据科学家们就可以考虑其它的方面,在学习、构建起基础以后,着眼于如何把它们应用于各种不同的问题。


这种转换的好处主要有这么几点。首先,这些可以复用的组件可以帮助我们逐步构建「结构性资产」。通过重复应用之前已经构建好的东西,我们可以做得更快、评价得更快。其次,这些构建在英特尔的统一软硬件平台上的功能和解决方案可以持续不断地从英特尔未来的开发和改进中受益。另外,用现有的基础设施做实验可以拓展出令人惊喜的新的解决方案或者新的应用,这是更早时候的仅关注于问题本身的思考方式所无法带来的。


一个灵活的、模块化的栈还能使用户可以将传统的自然语言处理方法和基于深度学习的方法结合起来,并为不同的用户群提供不同层次的抽象。许多不同的企业用例表明了自然语言处理和它的基本组件的潜力。下面,我们为您提供了几个例子,但是显然还有很多别的可能性。


主题分析


金融业面临着巨大的知识管理挑战,这是由每天必须处理和理解的文件的数量(太大)所造成的。从一页又一页的文本中提取出诸如「某种特定产品的竞争力」这样的关键的见解是十分困难的。


自然语言处理主题分析技术现在可以被用来快速分析大量的文档,并且识别文档中不同的部分所关联的主题。不同的用户会关注不同的话题,例如:某个公司的价值、竞争力、领导力或者宏观经济学。自然语言处理主题分析让用户能够筛选出特定的感兴趣的主题,并且获得更加浓缩的信息。


为了利用大量未标记的数据,模型可以用内容类似的文本进行预训练,之后这些数据表示可以被迁移至主题分析或者其它附加的任务中。早前的一篇博客介绍了这种解决方案中涉及到的一些方法的概述。为了实现这种方案,从自然语言处理构建模块的角度来说,我们使用了序列到序列(seq2seq)的拓扑结构,长短期记忆网络(LSTM),词嵌入来自迁移学习,而后进行精细调节(fine-tune),还可以与命名实体识别等组件结合在一起。


640?wx_fmt=jpeg


趋势分析


诸如医疗保健、工业制造、金融业等行业都面临着从大量的文本数据中识别基于时间的趋势的挑战。通过将文本正则化、名词短语分块和抽取、语言模型、语料库的词频-逆文本频率指数(TF-IDF)算法,以及使用词向量的分组等技术,我们可以快速的生成一个解决方案,它可以从一组文档中抽取关键词和重要性估计。接着,随着时间的推移,通过比较这些抽取出来的关键词,我们能够发现有用的趋势,例如:天气变化如何能够造成库存的短缺,或者哪些领域的学术研究随着时间的推移会吸引更多的贡献和注意。


情感分析


情感分析功能通常被用于竞争力分析、沟通策略优化、以及产品或市场分析。一个提供了细粒度的情感分析的解决方案能够为企业用户提供可行的见解。例如:这种更有针对性的情感分析可以发现,关于一个特定商品的评论普遍是对于它的能耗的正面看法以及对它的可靠性的负面看法。对于这种细粒度的情感分析,我们使用了诸如词性标注(POS tagging)、文本正则化、依存分析和词汇扩展等组件。对于不同的领域,相同的的那次可能传递不同的情感,所以允许领域自适应的机制也是十分关键的。


多功能体系架构上灵活的构造模块


当我们看到巨大的自然语言处理市场中的种种规划时,我们应该如何构建解决方案、软件、硬件来利用这些机会并使它们成为可能?在英特尔,我们希望构建能够持续创新和改进的技术,这能够给我们一个用于研究、实践并应用算法的开放的、灵活的平台,这种技术还能够高效地扩展到多种应用程序中,最终形成影响深远的商业见解。


在英特尔人工智能实验室,我们的自然语言处理研究人员和开发者正在构建一个开放的、灵活的自然语言处理组件库,以便为我们的合作伙伴和客户实现多种自然语言处理用例。它使我们能够高效地将我们灵活、可靠高性能的英特尔架构为这些自然语言处理应用、其他的人工智能和先进分析工作流提供了硬件、框架工具和软件层。我们将继续努力优化这些组件,以提高深度学习的能力。


640?wx_fmt=png

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/495778.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CompletableFuture详解~思维导图

#原图 System.out.println("https://www.processon.com/view/621a1b361e08533fc3afaa44?fromnew1");

如何在SharePoint 2010项目中引用UserProfiles.dll

如果需要进行SharePoint的UserProfile开发的话,我们需要引用以下程序集: C:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\14\ISAPI\Microsoft.Office.Server.UserProfiles.dll在添加引用的时候,Visual Studio 2010会…

汇编中各寄存器的作用(16位CPU14个,32位CPU16个)和 x86汇编指令集大全(带注释)

From:https://www.cnblogs.com/zimmerk/articles/2520011.html From:https://blog.csdn.net/bjbz_cxy/article/details/79467688 汇编寄存器功能详解:https://wenku.baidu.com/view/14ef15857cd184254a353586.html 寄存器、汇编命令详解&am…

斯坦福大学科学家研发微型植入式神经刺激器

来源:IEEE电气电子工程师协会实现使用可读生命体征传感器和可控制的植入器来装备我们的身体,就仿佛科幻小说中描述的一般,而事实上,这远比你想象中的要更接近现实。斯坦福大学最近研发出一款微型植入式神经刺激器,只有…

PPT演示力~思维导图

#原图 System.out.println("https://www.processon.com/view/6222dcb1e0b34d07287d09c6?fromnew1");

靠云计算翻身的微软正在“挑衅”亚马逊AWS

来源:第一财经摘要:凭借云计算业务“回春”的老牌科技企业微软还在继续享受转型的福利。微软最新发布的财报显示,云计算业务依然是公司目前业务最大的功臣。北京时间4月27日,微软发布的2018财年第三季度财报显示,在截止…

证书有效性验证、根证书

来源:证书有效性验证、根证书 - 程序员大本营 一、 数字证书的有效性验证主要从三个方面: (1)数字证书有效期验证 (2)根证书验证 (3)CRL验证 1、数字证书有效期验证…

BAT全球扩张AI路线图:百度早于谷歌,腾讯投资最多

来源:网络大数据CB Insights的最新报告挖掘BAT的AI相关专利记录、投资和收益等,全方位描绘了BAT的AI策略。报告显示,百度在AI领域处于领先地位。BAT分别着重自动驾驶、智慧城市和医疗AI,在政府的大力支持下,BAT正在向全…

汇编语言(王爽第三版) 实验5编写、调试具体多个段的程序

参考:http://blog.sina.com.cn/s/blog_171daf8e00102xclx.html 汇编语言实验答案 (王爽):https://wenku.baidu.com/view/a1cd7c6c1fb91a37f111f18583d049649b660ede.html 一。将下面的程序编译连接,用Debug加载、跟踪,然后回答问…

RestTemplate 最详解

目录 RestTemplate 简单使用 创建 RestTemplate接口调用一些其他设置简单总结公众号推荐在项目中,当我们需要远程调用一个 HTTP 接口时,我们经常会用到 RestTemplate 这个类。这个类是 Spring 框架提供的一个工具类。Spring 官网对它的介绍如下&#xf…

Gartner预计2018年全球人工智能商业价值将达到1.2万亿美元

来源:亿欧根据全球领先的信息技术研究与顾问公司Gartner的预测,人工智能(AI)产生的全球商业价值预计将在2018年达到1.2万亿美元,比2017年增长70%。此外,Gartner预计到2022年,人工智能衍生的商业…

王爽 汇编语言第三版 问题 7.9 将 datasg 段中前4个字母变成大写(汇编中的双重循环)

问题 7.9: 将 datasg 段中前 4 个字母变成大写 汇编代码: assume cs:codesg,ss:stacksg,ds:datasgstacksg segmentdb 0,0,0,0,0,0,0,0 stacksg endsdatasg segmentdb 1. display db 2. brows db 3. replace db 4. modify datas…

消费机器人今年爆发!四大品类瓜分百亿蛋糕

来源:智东西摘要:就扫地机器人、智能音箱、民用机器人和智能服务机器人的零售数据出发,盘点消费级机器人2018年的市场潜力。近两年,人工智能技术的迅猛发展。特别是视听觉语义理解、自然语言处理、神经网络、情感识别算法等的发展…

scrapy学习笔记(二)进阶使用

From:https://www.imooc.com/article/21839 scrapy提升篇之配置:https://segmentfault.com/a/1190000009321902 前面我写了一篇《scrapy快速入门》,简单介绍了一点scrapy的知识。这次就来介绍一些scrapy的进阶知识,做一些真正有用…

王爽 汇编语言第三版 第7章 --- 更灵活的定位内存地址的方法(可以理解为 数组形式的内存定位)

汇编语言(第三版)王爽著 的十二个实验:https://blog.csdn.net/OrangeHap/article/details/89791064 大小端 字节对齐 对于 arm,intel 这种 x86 构架的复杂指令 CPU,整数在内存中是倒着存放的,低地址放低位&…

从文本分类问题中的特征词选择算法追踪如何将数学知识,数学理论迁移到实际工程中去...

博文转载请注明作者和出处(作者:finallyliuyu :出处博客园) 附:《卡方特征词选择算法》 《DF特征词选择算法》 一.数学背景 将数学知识、数学理论以及数学思想迁移到实际工程问题中,经常会促进工程问题的圆…

裁掉杰森伯恩,招揽人工智能,AI间谍厉害在哪?

来源:智能相对论 作者: 岳文纶摘要:CIA宣布,计划用人工智能取代间谍。其技术开发副主任Dawn Meyerriecks表示,CIA正在适应新的情形,其主要对手是一台机器,而不是一名外国间谍。间谍&#xff0…

一步一步教你使用AgileEAS.NET基础类库进行应用开发-基础篇-通过SQL实现特殊业务...

前面的四篇文章演示ORM的一些常规操作与配置,通过前面的文章,应用开发人员要可以使用ORM开发出简单的应用,但是,ORM也不是万能钥匙,在业务应用中,还有很多是ORM解决不了的问题,对于这些问题&…

英特尔详解5G将如何助力VR的未来发展

来源:亿欧智库摘要:英特尔中国研究院通过重点研究通信和计算融合的方式,解释了5G在面对巨大数据洪流时数据处理和传输的方式,通过边缘计算的新方法,使VR达到传输要求。打造一个高效的通信和计算系统,通往我…

王爽 汇编语言第三版 第8章( 寻址方式 ) --- 数据处理的两个问题

第八章 数据处理的两个基本问题 8.6 综合应用 示例代码 1: assume cs:codesg,ds:datasgdatasg segmentdb 1024 dup (0) datasg endscodesg segmentstart:mov ax,datasgmov ds,axmov bx,60h ; 确定记录地址 ds:bxmov word ptr [bx0ch],38 ;…