知识图谱能否拯救NLP的未来?

文 | Luke@知乎

知识图谱是NLP的未来吗?

2021年了,不少当年如日中天技术到今天早已无人问津,而知识图谱这个AI界的大IP最火的时候应该是18,19年,彼时上到头部大厂下到明星创业公司都在PR自己图谱+NLP布局能够赋予AI认知能力。到了当下这个AI总体降温的时间节点,我们是时候冷静思考知识图谱的未来到底该何去何从了。

回到这个问题本身:知识图谱是否是NLP的未来呢?

我的看法:知识图谱不是NLP的未来,因为知识图谱是另外一种与NLP有很多交集的技术。在目前所有已知的发展方向中,知识图谱是最有可能长期和NLP互利共生的技术。

那么,知识图谱和NLP到底是什么关系呢?直觉上看,机器学习可以类比我们人类学习。回顾一下我们自己的学习过程,大脑和感官主要负责信息获取、处理、分析、决策。对于简单问题或少数天才,接受到信息后,只需要在大脑中思考一遍即可得出结论。但是对于复杂问题,比如工作汇报或期末考试,只靠大脑很难记住所有信息,这个时候,很多人都会选择将一些加工过的结构化或半结构化的知识整理成笔记,方便需要的时候快速回顾。

发现了吗?大脑的角色非常类似NLP以及其他ML技术,而笔记几乎就是KG的灵感来源。具体来说,NLP在图谱构建过程中举足轻重,而图谱又通过引入知识的方式反哺NLP。

不少证据已经表明诸如Bert之类的预训练语言模型本身已经存储了知识,就像我们的大脑中也存在一些关键记忆一样,但它不可能将所有现实世界中的事实全部内化,犹如人脑不可能记住所有见过的东西一样,而知识图谱通过引入知识能缓解NLP的学习压力。另一个严重的问题是,由于NLP技术目前远没有人脑智能,模型在训练中记住的知识实际上是不可控的(此处可以围观隔壁的AI偏见问题[1]),这对NLP技术的落地应用是一个需要考虑的风险,而在可解释性方面,知识图谱是Bug级的存在。

知识图谱如何赋能NLP技术?

NLP技术如何赋能图谱构建的资料很多,知识图谱落地应用近些年也是进展地如火如荼,但,知识图谱如何赋能NLP技术这个话题聊的人却不太多。

我自己总结了最近几年KG赋能NLP技术的一些打法,欢迎补充~

预训练中引入知识

代表工作:

ERNIE[2],使用短语和实体mask策略在中文NLP任务上取得了较好的效果,其中短语和实体来自KG

图2. ERNIE

K-BERT[3],预训练过程中注入相关的KG三元组,为模型配备领域知识,提高模型在特定领域任务上的性能,同时降低大规模预训练成本。

图3. K-BERT

信息抽取中做远程监督

用KG对齐文本做远程监督标注数据是信息抽取领域的大杀器,能够有效降低人工标注成本,可以将实体抽取、关系抽取、事件抽取等子任务一网打尽,用过的小伙伴都说好。

图4. 远程监督

实体链接中引入实体信息

实体链接,就是把文本中的mention链接到KG里的entity的任务。如下图所示[4]:

图5. 实体链接

显然,KG中的实体信息,如实体描述、实体属性、实体embedding以及实体间关系等都是该任务的关键特征,想深入了解的朋友请移步[4]。

文本生成中融合知识

通过知识图谱中的显示事实来指导生成文本是实现可控文本生成的一个重要方向,如下所示[5]:

图6. 文本生成

具体大致分为4种较为典型的方式[6]:

  • 多任务学习(生成+文本蕴含)

  • 基于knowledge graph 的文本生成

  • 基于memory network 的文本生成

  • 结合分布-采样进行文本生成

想详细了解的朋友请移步[6]。

语义匹配中引入关键词信息

在深度语义匹配任务中,有人发现,通过文本中关键词之间的交互即可较为容易的找到匹配对象,与其他词汇关系不大[7][8]。

图7. 语义匹配case 

因此,考虑通过从KG中引入特定领域的关键词表,然后在建模时highlight关键词的重要度,从而达到更好的效果[8]。

图8. 关键字注意力机制

后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

 

[1]AI的偏见:机器就是绝对理性的么?https://baijiahao.baidu.com/s?id=1684480115111405061&wfr=spider&for=pc

[2]ERNIE: Enhanced Representation through Knowledge Integration https://arxiv.org/pdf/1904.09223.pdf

[3]K-BERT: Enabling Language Representation with Knowledge Graph https://arxiv.org/pdf/1909.07606.pdf

[4]ab【知识图谱】实体链接:一份“由浅入深”的综述 - Nicolas的文章 - 知乎 https://zhuanlan.zhihu.com/p/100248426

[5]Text Generation from Knowledge Graphs with Graph Transformers https://arxiv.org/pdf/1904.02342v1.pdf

[6]ab文本生成12:4种融合知识的text generation(推荐收藏) - 林小平的文章 - 知乎 https://zhuanlan.zhihu.com/p/133266258

[7]腾讯专注关键词的深度语义匹配模型 https://blog.csdn.net/qq_27590277/article/details/113777978

[8]abKeyword-Attentive Deep Semantic Matching https://arxiv.org/abs/2003.11516

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478744.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文浅尝 | Data Intelligence 已出版的知识图谱主题论文

本文转载自公众号:DI数据智能。 知识图谱被称为人工智能的基石,它的前身是语义网,由谷歌在2012年率先提出,用于改善自身的搜索业务。Data Intelligence执行…

一步步手动实现热修复(三)-Class文件的替换

*本篇文章已授权微信公众号 guolin_blog (郭霖)独家发布 本节课程主要分为3块: 1.一步步手动实现热修复(一)-dex文件的生成与加载2.一步步手动实现热修复(二)-类的加载机制简要介绍3.一步步手动实现热修复(三)-Class文件的替换 本节示例所…

Vision Transformer 论文解读

原文链接:https://blog.csdn.net/qq_16236875/article/details/108964948 扩展阅读:吸取CNN优点!LeViT:用于快速推理的视觉Transformer https://zhuanlan.zhihu.com/p/363647380 Abstract: Transformer 架构早已在自然语言处理…

长这么大,才知道数据集不用下载可以直接在线使用

每天清晨打开电脑,搜索所需的数据集,点击“Download”,愉快地眯上眼睛,期待n个小时后醒来乖巧下载好的数据,开始放进模型像小仓鼠进滚轮一样快乐奔跑。梦醒时分,一个“Error”蹦进眼睛里,美好码…

会议交流 - CCKS2020 | 2020年全国知识图谱与语义计算大会

OpenKG开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

LeetCode 739. 每日温度(单调栈)

1. 题目 根据每日 气温 列表,请重新生成一个列表,对应位置的输入是你需要再等待多久温度才会升高超过该日的天数。如果之后都不会升高,请在该位置用 0 来代替。 例如,给定一个列表 temperatures [73, 74, 75, 71, 69, 72, 76, …

令人振奋的好消息!2016年12月8日Google Developers中文网站发布!

令人振奋的好消息! 2016年12月8日Google Developers中文网站发布! 以往我们需要访问Android的开发网站、Google的开发网站都需要翻墙,苦不堪言。现在Google发布了中文网站,怎能不让人开心?! Android中文…

美团外卖Android Lint代码检查实践

概述 Lint是Google提供的Android静态代码检查工具,可以扫描并发现代码中潜在的问题,提醒开发人员及早修正,提高代码质量。除了Android原生提供的几百个Lint规则,还可以开发自定义Lint规则以满足实际需要。 为什么要使用Lint 在美团…

这篇论文提出了一个文本-知识图谱的格式转换器...

文 | 花小花PosyHello, 大家好,我是小花。今天给大家介绍一篇有野心的paper。为何如此说呢?因为该工作提出了一个知识的格式转换器,用于转换 无结构化的纯文本(Text)和结构化的知识图谱(KG) 。换句话说,给模型一打句子&#xff0c…

论文小综 | Using External Knowledge on VQA

本文转载自公众号:浙大KG。本文作者:陈卓,浙江大学在读博士,主要研究方向为图神经网络和知识图谱表示学习我们生活在一个多模态的世界中。视觉的捕捉与理解,知识的学习与感知,语言的交流与表达,…

如何修改TextView链接点击实现(包含链接生成与点击原理分析)

*这篇文章的主要目的是想要大家学习如何了解实现,修改实现,以达到举一反三,自行解决问题的目的。 某天遇到这么一个需求:在TextView中的文本链接要支持跳转,嗯,这个好办,TextView本身是支持的&…

LeetCode 752. 打开转盘锁(图的BFS最短路径)

1. 题目 你有一个带有四个圆形拨轮的转盘锁。每个拨轮都有10个数字: ‘0’, ‘1’, ‘2’, ‘3’, ‘4’, ‘5’, ‘6’, ‘7’, ‘8’, ‘9’ 。每个拨轮可以自由旋转:例如把 ‘9’ 变为 ‘0’,‘0’ 变为 ‘9’ 。每次旋转都只能旋转一个拨…

使用TensorFlow训练WDL模型性能问题定位与调优

简介 TensorFlow是Google研发的第二代人工智能学习系统,能够处理多种深度学习算法模型,以功能强大和高可扩展性而著称。TensorFlow完全开源,所以很多公司都在使用,但是美团点评在使用分布式TensorFlow训练WDL模型时,发…

会议交流 - CNCC 技术论坛 | NLP中知识和数据怎么选?当然是全都要!——第四届中文信息技术发展战略研讨会...

本文转载自公众号:中国计算机学会 。本论坛将于CNCC2020期间,10月23日下午16:00-18:00,在北京新世纪日航饭店3层南京厅举行。本论坛将邀请多位来自国内著名高校和人工智能企业的知名自然语言处理专家介绍他们在知识图谱、知识获取、预训练模型…

从我开发过的Tensorflow、飞桨、无量框架看深度学习这几年

文 | Peter潘欣知乎和深度学习框架打交道已有多年时间。从Google的TensorFlow, 到百度的PaddlePaddle,再到现在腾讯的无量。很庆幸在AI技术爆发的这些年横跨中美几家公司,站在一个比较好的视角看着世界发生巨大的变化。在这些经历中,视角在不…

探索Glide对Gif图片资源的获取、解析过程

先预祝大家汤圆节快乐!很久没写博客了。今天我们来探索一下Glide是如何支持Gif图片加载的。 本篇博客的目的 了解代码分析的基本思路与方法了解Glide是如何对Gif图片进行支持的 探索背景 为什么会有这么一个想法呢,一来一直对Glide是知其名而不知其所…

美团“猜你喜欢”深度学习排序模型实践

引言 推荐作为解决信息过载和挖掘用户潜在需求的技术手段,在美团点评这样业务丰富的生活服务电子商务平台,发挥着重要的作用。在美团App里,首页的“猜你喜欢”、运营区、酒店旅游推荐等重要的业务场景,都是推荐的用武之地。 目前&…

如何关闭docker容器里的进程

如何关闭docker容器里的进程 1、使用docker exec 容器名 ps -ef命令查看进程信息 示例: 创建名为"redis"的容器,并在容器内部和宿主机中查看容器中的进程信息: 2、然后进入该容器中,执行如下命令即可停掉进程&…

论文浅尝 | 一日看尽长安花--NLP可解释研究梳理

本文是对TACL2019《Analysis Methods in Neural Language Processing: A Survey》的翻译和整理。本文转载自知乎,文章链接:https://zhuanlan.zhihu.com/p/265815975导读NLP领域发展迅猛,其模型分析方法也正逐渐火热。为什么要研究NLP的可解释…

人在斯坦福,刚上CS224n

文 | Jazon大家好,我是Jazon,现在是Stanford计算机硕士项目的一只学生,非常荣幸加入小夕的大家庭!请各路大神多多指教呀。2021年1月12日,又一季Stanford CS224n——自然语言处理开课了,我和很多MSCS同学一起…