NLPPython笔记——WordNet

WordNet是一种面向语义的英语词典,由Princeton大学的心理学家、语言学家和计算机工程师联合设计。它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。

NLTK库中包含了英语WordNet,里面共有155287个词以及117659个同义词集合。常用操作如下:

1. 加载wordnet

from nltk.corpus import wordnet as wn

2. 得到同义词集

wn.synsets('motorcar')

3. 同义词集的词条

wn.synset('car.n.01').lemmas()

4. 同义词集的词条名

wn.synset('car.n.01').lemma_names()

5. 同义词集的定义

wn.synset('car.n.01').definition()

6. 同义词集的使用例句

wn.synset('car.n.01').examples()

7. 同义词集的上位词

wn.synset('car.n.01').hypernyms()

8. 同义词集的下位词

wn.synset('car.n.01').hyponyms()

9. 同义词集的蕴含关系

wn.synset('walk.v.1').entailments()

10. 同义词集中词条的反义词

wn.lemma('supply.n.02.supply').antonyms()

11. 同义词集的深度

使用synset对象的min_depth方法来量化对象的普遍性概念,原理上其实在查找对象在层次结构所在的层次。

wn.synset('car.n.01').min_depth()

12. 两同义词集的相似度

使用synset对象的path_similarity方法可以测量两个同义词集间的路径长短,值得范围是0到1。路径越长,值越小;路径越短,值越大。两者之间没有路径时返回-1,与自身比较时返回1。

wn.synset('car.n.01').path_similarity(wn.synset('car.n.02'))

 

转载于:https://www.cnblogs.com/yucen/p/9343548.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/389068.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

crc16的c语言函数 计算ccitt_C语言为何如此重要

●●●如今,有很多学生不懂为何要学习编程语言,为何要学习C语言?原因是大学生不能满足于只会用办公软件,而应当有更高的学习要求,对于理工科的学生尤其如此。计算机的本质是“程序的机器”,程序和指令的思想…

毫米波雷达与激光雷达的初探

毫米波雷达与激光雷达的初探 雷达 (Radio Detection and Range, Radar)是一种利用电磁波来对目标进行探测和定位的电子设备。实现距离测量、运动参数测量、搜索和发现目标、目标定位、目标特性参数分析等功能。 分类 电磁波按照从低频到高频的顺序&…

aws spark_使用Spark构建AWS数据湖时的一些问题以及如何处理这些问题

aws spark技术提示 (TECHNICAL TIPS) 介绍 (Introduction) At first, it seemed to be quite easy to write down and run a Spark application. If you are experienced with data frame manipulation using pandas, numpy and other packages in Python, and/or the SQL lang…

冲刺第三天 11.27 TUE

任务执行情况 已解决问题 数据库结构已经确定 对联生成model已训练完成 词匹配部分完成 微信前端rush版本完成 总体情况 团队成员今日已完成任务剩余任务困难Dacheng, Weijieazure数据库搭建(完成)multiple communication scripts, call APIs需要进行整合调试Yichon…

锁是网络数据库中的一个非常重要的概念

锁是网络数据库中的一个非常重要的概念,它主要用于多用户环境下保证数据库完整性和一致性。各种大型数据库所采用的锁的基本理论是一致的,但在具体 实现上各有差别。目前,大多数数据库管理系统都或多或少具有自我调节、自我管理的功能&#x…

DPDK+Pktgen 高速发包测试

参考博客 Pktgen概述 Pktgen,(Packet Gen-erator)是一个基于DPDK的软件框架,发包速率可达线速。提供运行时管理,端口实时测量。可以控制 UDP, TCP, ARP, ICMP, GRE, MPLS and Queue-in-Queue等包。可以通过TCP进行远程控制。Pktgen官网 安装使用过程 版本…

python 商城api编写_Python实现简单的API接口

1. get方法import jsonfrom urlparse import parse_qsfrom wsgiref.simple_server import make_server# 定义函数,参数是函数的两个参数,都是python本身定义的,默认就行了。def application(environ, start_response):# 定义文件请求的类型和…

opencv (一) 学习通过OpenCV图形界面及基础

opencv 学习通过OpenCV图形界面基础 用的函数有 cv.line(), cv.circle(),cv.rectangle(), cv.ellipse(),cv.putText() 常用参数 img : 想要绘制图形的图片color: 图形的颜色, BGRthickness:厚度lineType: 线的类型, 8-connected、anti-al…

python精进之路 -- open函数

下面是python中builtins文件里对open函数的定义,我将英文按照我的理解翻译成中文,方便以后查看。 def open(file, moder, bufferingNone, encodingNone, errorsNone, newlineNone, closefdTrue): # known special case of open """  …

数据科学家编程能力需要多好_我们不需要这么多的数据科学家

数据科学家编程能力需要多好I have held the title of data scientist in two industries. I’ve interviewed for more than 30 additional data science positions. I’ve been the CTO of a data-centric startup. I’ve done many hours of data science consulting.我曾担…

基于xtrabackup GDIT方式不锁库作主从同步(主主同步同理,反向及可)

1.安装数据同步工具 注:xtrabackup 在数据恢复的时候比mysqldump要快很多,特别是大数据库的时候,但网络传输的内容要多,压缩需要占用时间。 yum install https://www.percona.com/downloads/XtraBackup/Percona-XtraBackup-2.4.12…

excel表格行列显示十字定位_WPS表格:Excel表格打印时,如何每页都显示标题行?...

电子表格数据很多的时候,要分很多页打印,如何每页都能显示标题行呢?以下表为例,我们在WPS2019中演示如何每页都显示前两行标题行?1.首先点亮顶部的页面布局选项卡。然后点击打印标题或表头按钮。2.在弹出的页面设置对话…

opencv(二) 图片处理

opencv 图片处理 opencv 图片像素操作 取像素点操作设置像素点取图片块分离,合并 b, g, r import numpy as np import cv2 as cvimg cv.imread(/Users/guoyinhuang/Desktop/G77.jpeg)# 获取像素值 px img[348, 120] # 0 是y, 1 是x print(px)blue img[100, 1…

【NLP】语言模型和迁移学习

10.13 Update:最近新出了一个state-of-the-art预训练模型,传送门:李入魔:【NLP】Google BERT详解​zhuanlan.zhihu.com1. 简介长期以来,词向量一直是NLP任务中的主要表征技术。随着2017年底以及2018年初的一系列技术突…

TCPIP传送协议

以下代码实现在客户端查询成绩(数据库在服务器端): 客户端: static void Main(string[] args) { string str null; while (str ! Convert.ToString(0)) { Console.WriteLine("…

sql优化技巧_使用这些查询优化技巧成为SQL向导

sql优化技巧成为SQL向导! (Become an SQL Wizard!) It turns out storing data by rows and columns is convenient in a lot of situations, so relational databases have remained a cornerstone of data management in businesses across the globe. Structured…

Day 4:集合——迭代器与List接口

Collection-迭代方法 1、toArray() 返回Object类型数据,接收也需要Object对象! Object[] toArray(); Collection c new ArrayList(); Object[] arr c.toArray(); 2、iterator() Collection的方法,返回实现Iterator接口的对象,…

oem是代工还是贴牌_代加工和贴牌加工的区别是什么

展开全部代加工就是替别人加工,贴别人的牌子。贴牌加工即商家自己不生产,而是委托其他生产企e68a8462616964757a686964616f31333365663431业生产,而品牌是自己的。拓展资料:OEM(Original Equipment Manufacture)的基本含义是定牌生…

KNN 算法--图像分类算法

KNN 算法–图像分类算法 找到最近的K个邻居,在前k个最近样本中选择最近的占比最高的类别作为预测类别。 给定测试对象,计算它与训练集中每个对象的距离。圈定距离最近的k个训练对象,作为测试对象的邻居。根据这k个紧邻对象所属的类别&#xf…

java核心技术-NIO

1、reactor(反应器)模式 使用单线程模拟多线程,提高资源利用率和程序的效率,增加系统吞吐量。下面例子比较形象的说明了什么是反应器模式: 一个老板经营一个饭店, 传统模式 - 来一个客人安排一个服务员招呼…