NLP复习资料(6)-第十章 语义分析

NLP复习资料-第十章

  • 1语义理论简介
  • 2格语法
  • 4语义网络
  • 5词义消歧
  • 5语义角色标注
  • 6词向量表示
  • 7篇章分析

国科大,宗老师《自然语言处理》课程复习笔记,个人整理,仅供参考。

语义分析:P3解释句子或篇章的含义,主要困难(歧义现象,不同人的理解不同,模型方法不成熟)

1语义理论简介

就是说不同的学者对于词的含义有不同的理解(至少记住两个吧)
1.词的指称(词与现实世界事物对应,复杂问题无法定义)
2.心理图像(不是所有词义都有清晰的心理图像)
3说话者意图(希望听者理解,做出反应)
4.过程语义(编程语言的含义,缺乏独立性)
5.词汇分解学派(词的意义基于语义基元,语义基元标准难定)
6.条件真理模型(不能很好描述时间场景)
7.情景语义学、模态逻辑

2格语法

格语法-语言学家搞的一套东西,老师快速地过了一遍。句子的表层表现与底层含义。

三条基本规则:P22句子由情态和命题构成,命题可以向下分

用格语法分析语义:基础有一本动词格框架名词语义信息的词典

步骤P31,识别动词,找格框架->填充必备格->填充可选格->判断句子情态

格语法描述汉语的局限性:一个句子(动词)一个框架,汉语的无动句、流水句子、连动句很难用一个框架描述

4语义网络

语义网络:P38 概念关系 组成的有向图,用来表示语义与知识。

P42事件的语义网络节点之间的关系可以使用格关系来表示

P45基于语义网络的推理:根据已知知识构建局部网络->用变量代表待求客体进行推理

P46知识图谱:描述实体与实之间的关系。关键技术:实体识别与消歧,关系识别

5词义消歧

词义消歧:多义词词义确定的过程

基本方法:
1.有监督词义消歧:互信息消歧P51:平行语料库,语义指示器的分类问题,互信息最大的方法来确定语义指示器的分类

2.贝叶斯消歧:第二章内容P55基于上下文的贝叶斯分类器的消歧方法

3.基于最大熵的消歧方法:第二章

4.基于词典的消歧:
->词典语义定义消歧
->上下文语义项
->双语词典:短语-翻译-译文中的共现次数多的组合词义作为原语言中的意义
->Yarowsky:P62一个多义词项出现一次后,该词项出现的可能性会比较大

5语义角色标注

分析句子谓语与其他成分词之间的关系

方法:
->基于短语结构分析的SRL(候选论元剪枝:P74,论元识别与标注P76)
->基于依存关系SRL(P80只有候选论元的剪除:因为它本来就是以动词为中心的)
->基于语块分析的SRL方法P84:语义角色标注问题变成序列标注问题

6词向量表示

两个主要问题:词汇如何转换成向量,向量如何语义组合。

基于文本的词汇语义表示:共现矩阵P94、神经网络P95

基于图像学习的词汇语义表示:P97图像->特征向量

基于声音学习的词汇语义特征:P98

多模态融合

下面就是老师们的一些工作,都是一些思想,不细说大致了解一下。
(1) 关联词汇作为弱监督信号得到词向量表示
(2) 多模态的词汇表示的可解释性研究:不同模态的向量,侧重词义特征不同,或具体,或抽象
(3) 融合词汇内部结构的中文句子表示模型
(4) 借鉴人类注意力分配机制的语义表示模型
(5) 研究不同类型句子在人脑的语义解码(句子->脑图像->特征提取)

7篇章分析

宗老师讲的最后一点内容:篇章分析
1.如何表示一个篇章:
词汇链:P3几个关键词串在一起,构成一篇文章的描述
事件链:P5实体抽取->词汇链上每个词最近的论元,构成事件链->判断相邻事件之间的关系
话题链:P6一系列回指构成的话题链

2.浅层篇章关系分析:P10分析两个篇章单元之间的关系,三个主要任务:关联词识别、arg抽取、两个arg之间功能类型判断。老师的基本框架:p12
(1)锚点识别:P13包括显示的关联词,和隐式的标点符号
(2) Argment提取:P16一些启发式的规则
(2)Argment 扩展,以同一个句子、前后两个句子为种子,向前后扩展
(3)Argment再标记:他们的位置是相对的p28

3.主要问题:关联词识别错误P31、句子边界识别错误P33、

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/445147.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

处理机调度与死锁

处理机调度与死锁 处理机调度的层次 高级调度 高级调度又称为作业调度或长程调度,其主要功能是根据某种算法,把外存上处于后备队列中的那些作业调入内存,也就是说,它的调度对象是作业。 1.作业和作业步 作业:一个比程…

各种卷积

从最开始的卷积层,发展至今,卷积已不再是当初的卷积,而是一个研究方向。在反卷积这篇博客中,介绍了一些常见的卷积的关系,本篇博客就是要梳理这些有趣的卷积结构。 阅读本篇博客之前,建议将这篇博客结合在一…

springboot——kaptcha

导入包&#xff1a; <dependency><groupId>com.github.penggle</groupId><artifactId>kaptcha</artifactId><version>2.3.2</version></dependency> 配置类&#xff1a; package com.now.community.community.config;import…

NLP复习资料(7)-机器翻译、文本分类、情感分析

NLP复习资料国科大&#xff0c;宗老师《自然语言处理》课程复习笔记&#xff0c;个人整理&#xff0c;仅供参考。此部分为手稿&#xff0c;高清图下载见链接&#xff1a;https://download.csdn.net/download/sinat_40624829/11662412

XMl文件解析读取

DOM方式&#xff1a; http://www.w3schools.com/dom/dom_parser.asp

redis——对项目的一些优化方案

这是我们之前项目的业务流程&#xff0c;做一下简单介绍。 登录&#xff1a; 用户输入账号、密码、验证码。我们先判断用户输入的验证码是不是我们session存的验证码&#xff0c;然后去查账号密码是否正确。 如果登录成功&#xff0c;发送给用户一张凭证&#xff08;ticket&a…

const的思考

const的思考 1、什么是const?常类型是指使用类型修饰符const说明的类型&#xff0c;常类型的变量或对象的值是不能被更新的。&#xff08;当然&#xff0c;我们可以偷梁换柱进行更新&#xff1a;&#xff09;2、为什么引入const&#xff1f;const 推出的初始目的&#xff0c;正…

深度模型压缩论文(02)- BlockSwap: Fisher-guided Block Substitution for Network Compression

文章目录1.摘要和背景1.1 摘要1.2 背景2.方法和贡献2.1 方法2.2 贡献3.实验和结果3.1 实验3.2 结果4.总结和展望4.1 总结4.2 展望本系列是在阅读深度神经网络模型小型化方面论文时的笔记&#xff01;内容大部分从论文中摘取&#xff0c;也会有部分自己理解&#xff0c;有错误的…

NLP复习资料(8)-知识图谱、信息抽取

NLP复习资料第16讲—知识图谱第17讲-信息抽取&#xff08;知识图谱生命周期中信息获取的关键技术&#xff09;国科大&#xff0c;宗老师《自然语言处理》课程复习笔记&#xff0c;个人整理&#xff0c;仅供参考。第16讲—知识图谱 知识图谱经典知识表示理论语义网资源描述框架…

Collection源码阅读

package java.util;import java.util.function.Predicate; import java.util.stream.Stream; import java.util.stream.StreamSupport;/*** 集合层次结构的根接口&#xff0c;一个集合表示一组对象&#xff0c;称为元素* JDK不提供任何该接口的直接实现&#xff0c;JDK提供实现…

socket阻塞和非阻塞的区别

读操作 对于阻塞的socket,当socket的接收缓冲区中没有数据时,read调用会一直阻塞住,直到有数据到来才返 回。当socket缓冲区中的数据量小于期望读取的数据量时,返回实际读取的字节数。当sockt的接收缓冲 区中的数据大于期望读取的字节数时,读取期望读取的字节数,返回实际读…

深度模型压缩论文(01)- Meta Filter Pruning to Accelerate Deep Convolutional Neural Networks

文章目录1.摘要和介绍1.1摘要部分2.背景和方法2.1 背景2.2 贡献2.3 方法3.实验和结果3.1 实验3.2 结果4.总结和展望4.1 总结4.2 展望本系列是在阅读深度神经网络模型小型化方面论文时的笔记&#xff01;内容大部分从论文中摘取&#xff0c;也会有部分自己理解&#xff0c;有错误…

架构分享--微博架构

先来分享下大神Tim Yang的关于微博的架构设计&#xff1a; 这里主要从 存储和接口角度来讲 对于大流量系统的架构设计&#xff0c;对于写入方面是特别需要注意的&#xff0c;基本上现在遇到的系统都是对于主数据库的写入&#xff0c;然后对于从数据库实现流量的分发。 对于存…

Pytorch(7)-自己设计神经网络会遇到的问题

操作pytorch架构遇到的问题1.网络参数初始化2.查看当前可学习参数3.增加可学习的参数4.参数优化函数Adagrad5.直接修改网络梯度值6.optimizers.zero_grad()报错7.tensor.detach() 和 tensor.data 的区别1.网络参数初始化 在pytorch中&#xff0c;有自己默认初始化参数方式&…

Python里的OS模块常用函数说明

Python的标准库中的os模块包含普遍的操作系统功能。如果你希望你的程序能够与平台无关的话&#xff0c;这个模块是尤为重要的。即它允许一个程序在编写后不需要任何改动&#xff0c;也不会发生任何问题&#xff0c;就可以在Linux和Windows下运行。 下面列出了一些在os模块中比较…

深度模型压缩论文(03)- Be Your Own Teacher: Improve the Performance of Convolutional Neural Networks via Self

文章目录1.摘要和背景1.1 摘要1.2 背景2.方法和贡献2.1 方法2.1.1 训练过程2.1.2 loss介绍2.2 贡献3.实验和结果3.1 实验3.2 结果4.总结和展望4.1 总结4.2 展望主要贡献&#xff1a;基于网络蒸馏方法&#xff0c;提出了一种提升裁剪后模型的精度的方法&#xff01;将训练时间大…

关系数据库——基础

数据库系统概论 四个基本概念 数据&#xff1a;数据库中存储的基本对象&#xff0c;描述一个事物的符号记录&#xff0c;数据和其语义不可分开说 数据库&#xff08;DB&#xff09;&#xff1a;是长期储存在计算机内、有组织的、可共享的大量数据的集合。 数据库管理系统&a…

Python(27)-模块

模块、包1.模块导入的方式2.使用as给模块取一个别名&#xff08;大驼峰命名法&#xff09;3.从模块中导入部分工具4.从模块中导入全部工具5.模块搜索顺序6__name__7.包8.发布模块、安装模块、卸载包9.pip安装第三方模块本系列博文来自学习《Python基础视频教程》笔记整理&#…

Wow6432Node

64 位版本 Windows 中的注册表分为 32 位注册表项和 64 位注册表项。许多 32 位注册表项与其相应的 64 位注册表项同名,反之亦然。 64 位版本 Windows 包含的默认 64 位版本注册表编辑器 (Regedit.exe) 可显示 64 位和 32 位的 注册表项。WOW64 注册表重定向器为 32 位程序提供…

如何使用docker配置深度学习开发环境

文章目录1.底层驱动的安装1.1 操作系统的安装1.2 显卡驱动的安装1.3 cuda的安装2.使用docker配置深度学习开发环境2.1 docker的安装2.2 nvidia_docker的安装2.3 安装过程中的问题2.3.1 docker和nvidia_docker的版本不匹配的问题。2.3.2 解决每次运行docker命令的时候要加sudo.2…