【语言处理与Python】2.5WordNet

WordNet是面向语义的英语词典,类似于传统词典,但具有更丰富的结构。NLTK中包括英语WordNet,有很多词和同义词的集合。

意义与同义词

具有相同含义的词是同义词。

#在wordnet中怎样探索这些同义词from nltk.corpus import wordnet as wnWn.synsets(‘motorcar’)[Synset(‘car.n.01’)]

通过对这段程度的分析可以知道:

Motorcar只有一个可能的含义;

这个含义被定义为car.n.01car的第一个名词的意义。

Car.n.01被称为synset或者同义词集

#意思相同的词或者词条的集合

wn.synset(‘car.n.01’).lemma_names['car','auto', 'automobile', 'machine', 'motorcar']wn.synset(‘car.n.01’).definitionamotorvehiclewithfourwheels;usuallypropelledbyaninternal combustionengine'

wn.synset(‘car.n.01’).examples()['heneedsacartogettowork']#得到指定同义词集的所有词条

wn.synset(‘car.n.01’).lemmas#查找特定的词条

wn.lemma(‘car.n.01.automobile’)#得到一个词条对应的同义词集

wn.lemma(‘car.n.01.automobile’).synset#得到一个词条的名字

wn.lemma(‘car.n.01.automobile’).name#访问所有包含词car的词条

wn.lemmas(’car’)

WordNet的层次结构

WordNet概念层次片段,每个节点对应一个同义词集。边表示上位词/下位词关系。

下位词:

例如:一个如摩托车这样的概念,我们可以看到他的更加具体的概念,下位词

motocar=wn.synset(‘car.n.01’)types_of_motocar=motorcar.hyponyms()

上位词:

motocar.hypernyms()paths=motorcar.hypernym_paths()

得到最一般的上位词(指的是根上位)

motorcar.root_hypernyms()

更多的词汇关系

同义集之间的关系:上位词和下位词

部分:从物品到它们的部件(一棵树的部分是他的树干、树冠等)

整体:到它们被包含其中的东西(一棵树的实质是包括心材和边材组成的)

wn.synset(‘tree.n.01)’).part_meronyms()wn.synset(‘tree.n.01’).substance_meronyms()sn.synset(‘tree.n.01’).member_holonyms()

反义词:wn.lemma(‘supply.n.02.supply’).antonyms()

动词之间的关系:走路的动作包括抬脚(蕴含关系)

wn.synset(‘walk.v.01’).entailments()

语义相似度

#我们可以通过查找每个同义词集深度来量化这个概念。

wn.synset(‘baleen_whale.n.01’).min_depth()#基于上位词层次结构中相互连接的概念之间的最短路径在0-1之间打分(两者之间没有路径返回-1,与自身比较返回1)

Right.path_similarity(minke)

转载于:https://www.cnblogs.com/createMoMo/archive/2013/05/24/3096280.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/400605.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解决ionic切换路由后,不继承tab路由,没有返回按钮问题

参考网站:http://bbs.phonegap100.com/thread-3962-1-1.html .state(tab.user, {url: /user,views: {tab-user: {templateUrl: templates/user/user.html }} }).state(login, {url: /login,templateUrl: templates/user/login.html,controller:Login }) 解决方法 .c…

【树莓派学习笔记】八、两步安装VS Code (Visual Studio Code)

目录下载安装使用(可选)安装插件C/CCMake ToolsCode Runner平台:树莓派3B 版本: 2021-05-07-raspios-buster-armhf 下载 官网下载 Download Visual Studio Code 发送到树莓派 安装 sudo dpkg -i Desktop/code_1.60.2-1632316275_armhf.deb 使用 在…

atitit.spring hibernate的事务机制 spring不能保存对象的解决

atitit.spring hibernate的事务机制 spring不能保存对象的解决 sessionFactory.openSession() 不能。。log黑头马sql语言.. sessionFactory.getCurrentSession().update(user); 中间走ok兰..log黑头也有累.. 在Spring中使用Hibernate,如果我们配置了TransactionMana…

20 best jquery 截图

digguka, January 05, 2012jQuery Image Crop - A very useful list of tools for cropping, zooming and resizing of images. Some of plugins come with the ability to upload croped images. 转载于:https://www.cnblogs.com/yqskj/archive/2013/05/25/3098411.html

【RK3399Pro学习笔记】一、Thinker Edge R 安装系统和VNC服务

目录下载固件安装USB驱动下载烧录工具刷机第一次开机连接WifiSSH登录换源设置语言安装VNC服务平台:华硕 Thinker Edge R 瑞芯微 RK3399Pro 固件版本:Tinker_Edge_R-Debian-Stretch-V1.0.4-20200615 风火轮论坛资料网盘 提取码:wqbd 下载固件…

第13章:直方图处理

第13章:直方图处理一、直方图的含义:1. 普通直方图:2. 归一化直方图:二、绘制直方图:1. 使用Numpy绘制直方图:2. 使用OpenCV绘制直方图:3. 使用掩码绘制直方图:三、直方图均衡化&…

操作系统 内存管理篇

一.程序的装入和链接 装入方式: 链接方式: 二.进程的内存映像 三.内存的分配 1.连续分配 分配方式: 2.不连续分配 分页:页面大小一致 引入快表(和 cache 处理思路一致) 升级到二级页表 分段:…

【Oracle】锁表查询与解锁

在PL/SQL中执行以下内容:如下语句 查询锁定的表: SELECT l.session_id sid, s.serial#, l.locked_mode,l.oracle_username,l.os_user_name,s.machine, s.terminal, o.object_name, s.logon_timeFROM v$locked_object l, all_objects o, v$session sWHERE l.object_i…

思维的新发展

原来不知道自己想要什么,一般习惯于三层,而且还是bll简单化的三层,现在是越来越清晰的明白自己想要什么了。 简单化的三层存在的问题: 1.表驱动的,N个表,就有N*3个类。 2.业务全部被放到了界面后面隐藏的类…

spring支持的事务管理

1、编程式事务: 需在spring.xml配置文件中, 1、配置数据源、 2、持久化模板(jdbc模板、hibernate模板、mybatis模板)、 对象里面注入的是数据源及框架的属性配置; 3、需编写事务管理器 transcationManager, 对象里面注入的是数据源…

【RK3399Pro学习笔记】二、Thinker Edge R 内网穿透以实现远程SSH

目录免费方案花生壳下载安装添加内网穿透映射测试平台:华硕 Thinker Edge R 瑞芯微 RK3399Pro 固件版本:Tinker_Edge_R-Debian-Stretch-V1.0.4-20200615 因Thinker Edge R安装的镜像为64位的版本 getconf LONG_BIT免费方案 花生壳 下载 在花生壳下载…

第14章:傅里叶变换

第14章:傅里叶变换一、理论基础:二、Numpy实现傅里叶变换:1. 实现傅里叶变换:2. 逆傅里叶变换:3. 高通滤波示例:三、OpenCV实现傅里叶变换:1. 实现傅里叶变换:2. 实现逆傅里叶变换&a…

代码能不能不要写得这么烂?!

我是一个研二的即将实习和毕业的普通屌丝研究生,带着几个研一的同学一起做数据挖掘项目。为了在毕业的时候防止青黄不接导致老师不让我毕业,于是从他们刚进实验室起,就“开始了设计模式和代码风格的培养”。具体的做法,就是扔给他…

MYSQL jdbc autoReconnect

http://blog.csdn.net/a9529lty/article/details/7104351 http://blog.163.com/huangfei_person/blog/static/58156675201092911507809/转载于:https://www.cnblogs.com/rgqancy/p/7097916.html

【Kali 树莓派版学习笔记】安装系统和VNC服务

目录下载固件和烧录系统第一次开机SSH连接换源设置语言安装VNC平台:树莓派3B 版本: Linux kali 5.4.83-Re4son-v7 #1 SMP Sat May 15 03:22:58 UTC 2021 armv7l GNU/Linux 下载固件和烧录系统 Get Kali 格式化TF卡 使用Win32DiskImager刷入镜像 第…

第15章:模板匹配

第15章:模板匹配一、模板匹配基础:1. cv2.matchTemplate()函数:2. 匹配原理:3. 查找最值:二、多模版匹配:1. 获取匹配位置集合:2. 循环:3.调整坐标4.标记匹配图像的位置​ 模板匹配是…

GridView 移除模板列

protected void gvMain_ItemDataBound(object sender, DataGridItemEventArgs e) { if (e.Item.ItemType ListItemType.AlternatingItem || e.Item.ItemType ListItemType.Item) { e.Item.Cells.RemoveAt(0); } } 转载于:https://ww…

事件处理机制--浏览器流程处理分析

事件处理机制--浏览器流程处理分析 js的运行是单线程的,单线程即一个时间只能做一件事。浏览器的运行是多线程的。 如下三种情况会进入事件队列(任务队列)中,但不立即执行: 1.定时函数 2.事件函…

第16章:霍夫变换

第16章:霍夫变换一、霍夫直线变换:1. 霍夫直线变换原理:2. HoughLines函数:3. HoughLinesP函数:2. 霍夫圆环变换:霍夫变换是一种在图像中寻找直线、圆形以及其他简单形状的方法。霍夫变换采用类似于投票的方…

一个java处理JSON格式数据的通用类(三)

/** *//** * 从json数组中解析出java Integer型对象数组 * param jsonString * return */ public static Double[] getDoubleArray4Json(String jsonString)...{ JSONArray jsonArray JSONArray.fromObject(jsonString); Doubl…