论文浅尝 | 融合多粒度信息和外部语言知识的中文关系抽取

论文浅尝 | 融合多粒度信息和外部语言知识的中文关系抽取

news/2025/4/20 14:38:58/文章来源:https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/104230890

论文笔记整理：吴涵，天津大学硕士，研究方向：自然语言处理

Paper:https://www.aclweb.org/anthology/P19-1430/

Code:https://github.com/thunlp/Chinese_NRE

引入

中文NER问题在很大程度上取决于分词的效果，所以在中文NER问题中，学者们通常先对文本进行分词然后再预测序列中单词的类别。这样一来会导致一个问题，即在分词中造成的错误会影响到NER的结果。

如果单纯采用字向量的话会导致拆开了很多并不应该拆开的词语，从而丢失了它们本身的内在信息（比如“人生”这个词如果拆成字向量就成了“人”和“生”，这两个字的单独含义明显与它们组合起来的词的含义大相径庭）。为了解决这个问题，该论文使用了一种新型的格子结构（latticestructure），它能够将单词本身的含义加入基于字向量的模型中，并引入义原作为外部知识。

文章摘要

本文在ACL2018的一篇论文《ChineseNER Using Lattice LSTM》上加以改进，加入了义原作为外部知识，可以更好地理解语义信息。

由于同时考虑了词格作为一个cell，自然网络中路径就变多，所以要对于基本的LSTM网络的计算公式加以修改：

对词格结尾的字符（如图中的“市”）进行计算时，会有一点不同：由于向“市”的cell有两个信息流的输入，故需要再加一个inputgate，两个门同时通过不同的信息流，需要设置权重：

本文模型：引入义原作为外部知识

加入义原后，计算时，在词格cell状态的计算上考虑不同义项带来的影响，并为不同的义项设置不同的权重：

实验结果：

通过与基于词粒度和字符粒度模型进行比较，可以得出，加入义原的多粒度模型可以获得更好的效果，同时，词格模型也是性能提升的重要原因。

OpenKG

开放知识图谱（简称 OpenKG）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文，进入 OpenKG 博客。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/479276.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Android官方开发文档Training系列课程中文版：数据存储之文件存储

Android官方开发文档Training系列课程中文版：数据存储之文件存储

原文地址：http://android.xsoftlab.net/training/basics/data-storage/files.html Android使用的文件系统和其它平台的磁碟式文件系统很相似。这节课描述了如何通过FileAPI在Android文件系统上进行读取文件和写入文件的操作。一个File对象适合被用来按照从头到尾…

阅读更多...

智能写作

智能写作

6.2万字报告剖析「智能写作」全貌，从落地产品看NLP商业化突破：

阅读更多...

论文拒稿的评价可以有多狠？

论文拒稿的评价可以有多狠？

文 | 自然卷知乎自古严师出高徒，“天将降大任于是人也，必先苦其心志，劳其筋骨……”。然而，这并不能作为审稿人走向“键盘侠”之路的理由！让我们这些卑微投稿人心里真是好凉凉！ಥ_ಥ 大家来看看&#xff0c…

阅读更多...

全链路压测自动化实践

全链路压测自动化实践

背景与意义境内度假是一个低频、与节假日典型相关的业务，流量在节假日较平日会上涨五到十几倍，会给生产系统带来非常大的风险。因此，在2018年春节前，我们把整个境内度假业务接入了全链路压测，来系统性地评估容量和发现…

阅读更多...

论文浅尝 | GMNN: Graph Markov Neural Networks

论文浅尝 | GMNN: Graph Markov Neural Networks

论文笔记整理：吴锐，东南大学硕士研究生，研究方向为自然语言处理来源：ICML 2019链接：http://proceedings.mlr.press/v97/qu19a/qu19a.pdf问题定义弱监督下的在关系数据中的对象分类。形式化地来说，给定一个图…

阅读更多...

Android官方开发文档Training系列课程中文版：数据存储之数据库存储

Android官方开发文档Training系列课程中文版：数据存储之数据库存储

原文地址：http://android.xsoftlab.net/training/basics/data-storage/databases.html 对于保存重复的结构化的数据最理想的方式就是存到数据库，比如联系人信息。这节课假定你有SQL数据库基础，会帮助你开始学习Android上的SQLite数据库。你将…

阅读更多...

五笔字根表口诀的通俗易懂讲解

五笔字根表口诀的通俗易懂讲解

五笔字根表口诀的通俗易懂讲解从上面五笔学习导图，我们不难看出，五笔只包含两个部分，一是独立字。二是字根字。 １　先来讲解独立字。独立字就是不用字根就可以输出的汉字，独立字包含一级简码，按键字两种。…

阅读更多...

论文浅尝 | 基于知识图谱难度可控的多跳问题生成

论文浅尝 | 基于知识图谱难度可控的多跳问题生成

论文笔记整理：谭亦鸣，东南大学博士生，研究兴趣：知识图谱问答。来源：ISWC 2019链接：https://link.springer.com/content/pdf/10.1007%2F978-3-030-30793-6_22.pdf本文提出一个end2end神经网络模型以知识图谱…

阅读更多...

LeetCode 933. 最近的请求次数（queue）

LeetCode 933. 最近的请求次数（queue）

1. 题目写一个 RecentCounter 类来计算最近的请求。它只有一个方法：ping(int t)，其中 t 代表以毫秒为单位的某个时间。返回从 3000 毫秒前到现在的 ping 数。任何处于 [t - 3000, t] 时间范围之内的 ping 都将会被计算在内，包括当前&…

阅读更多...

如何融合深度学习特征向量？

如何融合深度学习特征向量？

本文转载自公众号“夕小瑶的卖萌屋”，专业带逛互联网算法圈的神操作 -----》我是传送门关注后，回复以下口令： 回复【789】 ：领取深度学习全栈手册（含NLP、CV海量综述、必刷论文解读） 回复【入群】&#xf…

阅读更多...

将军令：数据安全平台建设实践

将军令：数据安全平台建设实践

背景在大数据时代，数据已经成为公司的核心竞争力。此前，我们介绍了美团酒旅起源数据治理平台的建设与实践，主要是通过各种数据分析挖掘手段，为公司发展决策和业务开展提供数据支持。近期，业内数据安全事件频发&#…

阅读更多...

Android官方开发文档Training系列课程中文版：与其它APP交互之将用户带到其它的APP

Android官方开发文档Training系列课程中文版：与其它APP交互之将用户带到其它的APP

原文地址：http://android.xsoftlab.net/training/basics/intents/index.html 导言一个Android APP应用通常会有若干个Activity。每一个Activity所展示的用户界面用于允许用户执行特定的任务(比如浏览地图或者是拍照)。为了把用户从一个activity带到另一个activit…

阅读更多...

视频推荐

视频推荐

基于标签的实时短视频推荐系统：https://zhuanlan.zhihu.com/p/80069135 视频爆量攻略——YouTube视频推荐算法详解https://zhuanlan.zhihu.com/p/79172083

阅读更多...

开源开放 | 图数据交互可视化分析框架 InteractiveGraph v0.3 版本发布

开源开放 | 图数据交互可视化分析框架 InteractiveGraph v0.3 版本发布

图数据交互可视化分析框架 InteractiveGraph 日前发布 v0.3 版本，下载地址：https://github.com/grapheco/InteractiveGraph/releases/tag/0.3.1图数据模型具有对实体关系的表达能力强、属性及结构可扩展性好、关联查询高效等优势。在对海量的多元异构信…

阅读更多...

LeetCode 589. N叉树的前序遍历（前序遍历）

LeetCode 589. N叉树的前序遍历（前序遍历）

文章目录1. 题目2. 解题2.1 递归2.2 循环1. 题目 2. 解题 2.1 递归 class Solution { public:vector<int> preorder(Node* root) {vector<int> ans;preRec(root,ans);return ans;}void preRec(Node* root, vector<int> &ans) {if(root NULL)return;ans…

阅读更多...

打脸！一个线性变换就能媲美“最强句子embedding”？

打脸！一个线性变换就能媲美“最强句子embedding”？

文 | 苏剑林（追一科技）编 | 小轶小编：前几周小屋刚推完《还在用[CLS]？从BERT得到最强句子Embedding的打开方式！》，苏神就来打脸了_(:з」∠)_BERT-flow来自论文《On the Sentence Embeddings from Pre-trai…

阅读更多...

Android官方开发文档Training系列课程中文版：与其它APP交互之从Activity获得结果

Android官方开发文档Training系列课程中文版：与其它APP交互之从Activity获得结果

原文地址：http://android.xsoftlab.net/training/basics/intents/result.html 启动其它Activity并不是单方向的。你也可以启动其它Activity然后接收返回结果。如果要接收结果，应该调用startActivityForResult()而不是startActivity()。举个例子&#…

阅读更多...

AI Challenger 2018：细粒度用户评论情感分析冠军思路总结

AI Challenger 2018：细粒度用户评论情感分析冠军思路总结

2018年8月-12月，由美团点评、创新工场、搜狗、美图联合主办的“AI Challenger 2018全球AI挑战赛”历经三个多月的激烈角逐，冠军团队从来自全球81个国家、1000多所大学和公司的过万支参赛团队中脱颖而出。其中“后厂村静静”团队-由毕业于北京大学的程惠阁…

阅读更多...

基于PaddleRec的用户点击率预测

基于PaddleRec的用户点击率预测

基于PaddleRec的用户点击率预测一、前言推荐系统的痛点二、推荐系统的数据获取获取数据的三种方法1.使用现成的数据集2.网络爬虫3.调查问卷三、数据处理PaddleRec推荐数据集格式1.slot:value的格式说明2.只有value的输入数据格式四、完成点击率预测的具体实现1.首先安装P…

阅读更多...

论文浅尝 | 融入知识的弱监督预训练语言模型

论文浅尝 | 融入知识的弱监督预训练语言模型

论文笔记整理：叶群，浙江大学计算机学院，知识图谱、NLP方向。会议：ICLR 2020链接：https://arxiv.org/pdf/1912.09637.pdf Abstract预训练语言模型不仅在传统的语言学任务上取得了很好的表现，在一些涉及到背景…

阅读更多...

最新文章