nlkt中BigramAssocMeasures.pmi()方法的传参和使用

这个问题找遍全网没看到详细的介绍，最后用读代码+数学公式的方法才理解怎么用。

BigramAssocMeasures.pmi

作用：计算x和y的互信息（互信息是什么我就不科普啦）

这里有个误区刚开始我以为是计算两个词之间的依赖程度，但是它其实是可以计算词和类别的依赖程度的。

对照这个：
在这里插入图片描述

所以我就拿t表示特征，c表示类别，要想使用BigramAssocMeasures.pmi()计算t和c的互信息（这里举的例子是二分类问题），需要传参如下：

注意，文档数量也可以理解为词频。且参数1和参数3不能为0。

参数1：“是这个特征也是这个类”的文档数量，是int类型
参数2：[积极类的文档数量，消极类的文档数量]，是一个列表（不是列表也可以，可以迭代就行）
参数3：文档总数，是int类型

from nltk import BigramAssocMeasures# 假设观察频率是3，背景频率是5
ngram = 2
total = 7
unigram = [4, 3]# 使用BigramAssocMeasures.pmi()计算互信息
score = BigramAssocMeasures.pmi(ngram, unigram, total)
print(score)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/212778.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

nlkt中BigramAssocMeasures.pmi()方法的传参和使用

相关文章

flstudio21.3.2304高级版水果编曲音乐软件

自动驾驶的汽车构造

【Spring教程25】Spring框架实战：从零开始学习SpringMVC 之 SpringMVC入门案例总结与SpringMVC工作流程分析

Spring 面向切面编程（AOP）

Wireshark添加自定义协议解析

Leetcode—389.找不同【简单】

HTML的img常见应用属性

【设计模式--创建型--建造者模式】

办公word-从不是第一页添加页码

win11 powershell conda 激活环境后不显示环境名称

华为OD机试真题-5G网络建设-2023年OD统一考试（C卷）

HarmonyOS鸿蒙应用开发——HTTP网络访问与封装

二分查找|滑动窗口|前缀和|LeetCode209: 长度最小的子数组

facebook回传

在IDEA中创建Maven项目时没有src文件、不自动配置文件

GridBagLayout GridBagConstraints 笔记231130

14-1、IO流

用Guava做本地缓存示例

【KCC@南京】KCC南京“数字经济-开源行”活动回顾录

Android画布Canvas绘图scale，Kotlin