中文句法分析、标记规范及其应用

一、 Why句法分析
句法分析是比词高一个层级的语言单位,单个词之间通过中文语法规则进行组织,形成一个具有连贯语义的词语序列。为了揭示这种组织结构和规则,揭示出词语以及词语的成分,往往需要对其进行句法分析。就中文而言,句子有七个成分,分别为主语、谓语、宾语、补语、定语、状语、同位语。 主语是一个句子的发生动作的主体,谓语是一般是动词充当,宾语是表示动作发生的对象。基于句法分析,可以实现对句子作成分功能或作用进行分析,从而标记出基本成分(主语、谓语、宾语)和次要成分(状语、补语)。

二、 句法分析的类型
句法分析,分成两种,一种是句子结构分析(syntactic structure parsing)和依存句法分析(dependency parsing)。其中句法结构分析又称为句法分析、短语句法分析。依存句法分析分为依存句法分析和语义依存分析两类。
2.1句子结构分析
本质上将句子视作为嵌套的短语组合。句法结构分析主要目的是解析整个句子的句法组织结构以及短语层级结构,属于一种层次性的分析方式。

a, 句子成分分析,standfordparser
在这里插入图片描述

2.2 依存句法分析
依存句法分析则通常通过依存弧对句子中的词语进行连接,用于标识词语之间的依存关系,从而形成整个句子的句法关系依存树。依存句法分析中的依存弧可以形式化成一个三元组,即<核心词(被修饰词),依存关系,修饰词>,依存弧是有有向的,通常由修饰词指向被修饰词。同时满足三个约束,即单核心约束,即句子中的每个词语只有一个依存关系;弱联通约束,无环约束。依存句法分析则更关注于句子的局部结构,通常是词语之间,并在此基础上得到整个句子的结构表示。
a, ltp依存句法分析
在这里插入图片描述
b, hannlp依存句法分析
在这里插入图片描述
c, standford依存句法分析
在这里插入图片描述

2.3 依存语义分析
语义依存分析,语义依存分析 (Semantic Dependency Parsing, SDP),分析句子各个语言单位之间的语义关联,语义依存分析的目的在于跨越句子表层句法结构的束缚,获取更为深层的语义信息。

在这里插入图片描述

三、 句法分析各类型对比

四、 句法分析标记规范

1、句子成分标记
在这里插入图片描述

2、依存句法标记
在这里插入图片描述
3、语义依存标记
在这里插入图片描述

五、 句法分析的应用

六、 总结

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480435.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蚂蚁三面题目(java开发岗):Java锁机制+JVM+线程池+事务+中间件

一面 1、HashMap底层原理&#xff1f;HashTable和ConcurrentHashMap他们之间的相同点和不同点&#xff1f; 2、由上题提到锁的问题 3、MySQL的表锁&行锁&乐观锁&悲观锁,各自的使用场景 4、Java线程锁有哪些&#xff0c;各自的优劣势 5、事务四大特性 6、事务的…

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

随着监督学习在机器学习领域取得的巨大发展&#xff0c;如何减少人工在样本方面的处理工作&#xff0c;以及如何使模型快速适应层出不穷的新样本&#xff0c;成为亟待解决的问题。零样本学习&#xff08;Zero-Shot Learning, ZSL&#xff09;的提出&#xff0c;则有效地解决了此…

ACL20 | 让笨重的BERT问答匹配模型变快!

一只小狐狸带你解锁炼丹术&NLP秘籍作者&#xff1a;曹庆庆&#xff08;Stony Brook University 在读PhD&#xff0c;关注Efficient NLP、QA方向&#xff0c;详见awk.ai&#xff09;背景BERT、XLNet、RoBERTa等基于Transformer[1]的预训练模型推出后&#xff0c;自然语言理解…

POJ 1581 优先队列 priority_queue -- 比赛胜者求解

题目链接&#xff1a;http://poj.org/problem?id1581 题目大意&#xff1a; 给定选手姓名&#xff0c;及答题提交次数&#xff08;提交正确前&#xff0c;错误一次罚20分&#xff09;&#xff0c;每题的做题时间罚分&#xff08;未正确作答的不罚分&#xff09;&#xff0c;…

热点事件发现、演化及时间线Timeline、故事线Storyline自动生成

一、热点事件概述 热点事件具有不可预测性&#xff0c;这决定了热点事件往往是一个“事后诸葛亮”的产物&#xff0c;一个热点事件从刚开始出现之时并没有带有成为热点的性质&#xff0c;当然&#xff0c;重大事故或者突发事件(如总统被杀、日本地震、印尼海啸、巴黎圣母院火灾…

计算机网络安全知识汇总

一、计算机网络面临的安全性威胁计算机网络上的通信面临以下的四种威胁&#xff1a; 截获——从网络上窃听他人的通信内容。 中断——有意中断他人在网络上的通信。 篡改——故意篡改网络上传送的报文。 伪造——伪造信息在网络上传送。截获信息的攻击称为被动攻击&#xff0c…

天猫研发Java团队(4面全题目):并发压测+Mina+事务+集群+秒杀架构

天猫高级Java一面 常见集合类的区别和适用场景 并发容器了解哪些&#xff1f; 如何判断链表是否有环 concurrentHashMap如何实现 集群服务器 如何application 共享 JAVA网络编程中&#xff1a;BIO、NIO、AIO的区别和联系 jvm内存模型jmm 知道的全讲讲 JAVA的垃圾回收&am…

回顾经典,Netflix的推荐系统架构

这篇文章我们回顾一篇经典博客&#xff0c;Netflix官方博客介绍的推荐系统架构&#xff0c;虽然文章发布已有六年&#xff0c; 但是现在回看起来我自己还是蛮惊讶的&#xff0c;因为Netflix的推荐系统架构居然到现在依然是主流。当然&#xff0c;框架中的诸多技术在不断的迭代更…

CNCC 技术论坛 | 知识图谱赋能数字经济

2018中国计算机大会&#xff08;CNCC2018&#xff09;将于10月25-27日在杭州国际博览中心&#xff08;G20会场&#xff09;举行&#xff0c;大会主题为「大数据推动数字经济」&#xff08;Big Data Drives the Digital Economy&#xff09;。10月15日前报名可享优惠&#xff0c…

计算机网络:我把所有计算机网络的基础都汇总到这里了!

原文链接&#xff1a;https://cloud.tencent.com/developer/article/1388529 前言计算机网络基础 该是程序猿需掌握的知识&#xff0c;但往往会被忽略今天&#xff0c;我将献上一份详细 & 清晰的计算机网络基础 学习指南&#xff0c;涵盖 TCP / UDP协议、Http协议、Socket等…

算法--递归--走台阶问题(2种递归+递归改循环)

文章目录递归&#xff1a;注意事项&#xff1a;问题1思路1.递归代码&#xff08;未考虑重复计算问题&#xff09;2.循环代码3.递归代码&#xff08;避免重复计算问题&#xff09;测试运行时间问题2递归&#xff1a; 一个问题可以分解成若干子问题&#xff0c;且求解思路一样&a…

最新2019 蚂蚁金服4面(Java)面试题

蚂蚁金服Java一面 1 自我介绍和项目 2 Java的内存分区 3 Java对象的回收方式&#xff0c;回收算法。 4 CMS和G1了解么&#xff0c;CMS解决什么问题&#xff0c;说一下回收的过程。 5 CMS回收停顿了几次&#xff0c;为什么要停顿两次。 6 Java栈什么时候会发生内存溢出&…

论文浅尝 | 基于表示学习的大规模知识库规则挖掘

链接&#xff1a;www.ict.griffith.edu.au/zhe/pub/OmranWW18.pdf动机传统的规则挖掘算法因计算量过大等原因无法应用在大规模KG上。为了解决这个问题&#xff0c;本文提出了一种新的规则挖掘模型RLvLR(Rule Learning via LearningRepresentation)&#xff0c;通过利用表示学习…

深度学习推荐系统中各类流行的Embedding方法

Embedding技术概览&#xff1a;对其它Embedding技术不熟悉&#xff0c;可以看我的上一篇文章&#xff1a;深度学习推荐系统中各类流行的Embedding方法&#xff08;上&#xff09;Graph Embedding简介Word2Vec和其衍生出的Item2Vec类模型是Embedding技术的基础性方法&#xff0c…

超强干货!7个腾讯最常用的用户研究方法

超强干货&#xff01;7个腾讯最常用的用户研究方法调查知识2017-09-19每天都有互联网产品上市&#xff0c;人们电脑上、手机上的应用在短期之内就可能增增减减换了很多波&#xff0c;最终留下的、那些最经典的产品&#xff0c;都是以好的体验设计取胜。这些产品或许看似很“简单…

算法--递归--汉诺塔问题

文章目录1. 问题分析2. 面试题1. 问题分析 游戏规则&#xff1a;一次只能挪一片&#xff1b;小的只能在大的上面&#xff1b;把所有的从A柱挪到C柱。 递推公式&#xff1a; 上部 n - 1 个 A 到 B&#xff1b;最底下 1 个 A 到 C &#xff1b;上部 n - 1 个 B 到 C&#xff1b;…

论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

来源: IJCAI2018链接: https://www.ijcai.org/proceedings/2018/0556.pdf动机近年来&#xff0c;随着多语言知识图谱嵌入(Multilingual KG embedding)的研究&#xff0c;实体的潜在语义表示以及跨语言知识推理等任务均取得一定成效&#xff0c;因此也推动了许多知识驱动的跨语言…

最新阿里聚划算Java 5轮面试题,涵盖GC收集器、多线程锁等

一面 详细的介绍JVM的内存模型结构 JVM最常用的参数配置讲讲 GC垃圾收集算法、GC垃圾收集器有哪些&#xff0c;以及新生代老生代 分别用什么算法 多线程的几种加锁方式详细介绍 实现线程安全的方式&#xff1f;ThreadLocal原理&#xff1f;线程池了解吗说说看&#xff1f;自…

2004-2019十六年热点事件库HistoryHotEventBase项目

HistoryHotEventBase historyhotevent projrct ,which concentrate on the dayily hot event covers the time range from 2004 to 2019, 16 years in total&#xff0c;从2004年至2019年共16年的每日热点事件项目&#xff0c;目标包括构建起从2004年至今共16年的历时热点标题数…

OSI七层模型详解-开放系统互联参考模型详解

原文链接&#xff1a;https://blog.csdn.net/yaopeng_2005/article/details/7064869 OSI 七层模型通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯&#xff0c;因此其最主要的功能就是帮助不同类型的主机实现数据传输 。 完成中继功能的节点通常称为中继系…