tfidf处理代码_tfidf.txt

function [count,tf,idf,weight]=tfidf(docs,term)

%docs--input documents,cell型

%term-- keywords也就是特征词提取,cell型

%output:count--存放各个关键词出现的频率在整个文档中

% wordnum--存放文档总的词汇数

%测试用例

%*****************************************************************

%clear all

%doc1='www washingtonpost com wp-adv mediacenter images wpni skin2 jpg';

%doc2='www washingtonpost com wp-adv mediacenter images about us welcome gif';

%doc3='media washingtonpost com wp-adv mediacenter images wpni mediakit hdr top gif';

%doc4='www washingtonpost com wp-adv mediacenter html research demographics html';

%docs={

doc1,doc2,doc3,doc4

};

%term={

'washingtonpost','mediacenter','images'

};

%%*************************************************************************

Ldocs=length(docs);

Lterm=length(term);

tf=zeros(Ldocs,Lterm);

idf=zeros(1,Lterm);

count=zeros(Ldocs,Lterm);

wordnum=[];

weight=zeros(Ldocs,Lterm);

p=' ';

i=1;

for i=1:Ldocs

doc=cell2mat(docs(i));

tabnum=find(doc==p);

Ltab=length(tabnum);

wordnum(i)=Ltab+1;

k=1;

for j=1:Ltab

word=doc(k:tabnum(j)-1);%会少输出最后一个词

Lw=length(word);

fword=doc((tabnum(Ltab)+1):length(doc));%最后一个词

Lfw=length(fword);

for jj=1:Lterm

aterm=cell2mat(term(jj));

Lat=length(aterm);

if Lat==Lw||Lat==Lfw

if strcmpi(word,aterm);

count(i,jj)=count(i,jj)+1;

if j

...

...

(完整源码请下载查看)

...

展开> <收缩

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/339966.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux系统ll历史,Linux操作系统原理笔记

在Linux操作系统内核内部,进程是通过一个链表,而且是一个双向链表来管理的。进程描述符:每一个进程都有其描述符,每一个描述符彼此之间都有关联性的。双向链表:一个进程内部可能包含多个线程。上下文切换(Context swtc…

java工程师的终极书单_Java 9 –终极功能列表

java工程师的终极书单这篇文章将针对即将到来的Java 9版本进行更新,新增功能 ( 最新更新:2014年 9月9日 ) OpenJDK开发正在加快速度:2014年3月Java 8发布后,我们预计将进入2年的发布周期。 据报道&#xf…

pitr 原理_PostgreSQL热备原理研究及流复制运用

付莎摘要:高可用性(HA-High Availability)是所有商用数据库系统必须具备的一项基本功能。该文阐述了PostgreSQL数据库的高可用性的实现原理及方法,并对PostgreSQL数据库的原生流复制功能实现高可用性热备功能进行了应用描述。关键词:PostgreS…

管道在c语言中的作用,在C中实现管道

我想在C中实现管道,例如 - $ ls | wc | wc我写了以下代码 -#include#include#include void run_cmd(char *cmd, int* fd_in, int* fd_out){int c fork();if (c0){if (fd_in ! NULL){close(fd_in[1]);dup2(fd_in[0], 0);}if (fd_out ! NULL){close(fd_out[0]);dup2(fd_out[1],1…

称之为例外?

尽管这是一个与测试和Wiremock有关的Java示例,但它涉及一个更普遍的问题。 我们正在尝试重试Wiremock的verify方法,该方法可能会在我们要检查的端点被命中之前由测试调用。 在这种情况下,我们想在几秒钟后重试一次直到超时。 有趣的是&#…

vue 移动到图片浮动_基于Vue实现图片在指定区域内移动

当图片比要显示的区域大时,需要将多余的部分隐藏掉,我们可以通过绝对定位来实现,并通过动态修改图片的left值和top值从而实现图片的移动。具体实现效果如下图,如果我们移动的是div 实现思路相仿。此处需要注意的是我们在移动图片时…

star-cd linux安装,linux 使用PXE方式,kickstar网络安装系统

软件需求:(可使用yum方式安装)0.DHCP服务1.xinet2.kickstar包3.tftp4.vsftpd5.启动文件、系统内核文件、系统镜像[roottest ~]# cd /var/lib/tftpboot/ #拷贝相关文件到tftp目录[roottest tftpboot]# ll总用量 34168-r--r--r-- 1 root root 84 10月 25 14:40 boot.m…

Hibernate字节码增强

介绍 既然您已经了解了Hibernate脏检查的基础知识 ,我们就可以深入研究增强的脏检查机制。 虽然默认的图遍历算法对于大多数用例可能已经足够,但有时您需要优化的脏检查算法,并且检测方法比构建自己的自定义策略更方便。 使用AntHibernate工…

js 转化为实体符_js转html实体的方法

方法一:用的浏览器内部转换器实现转换,方法是动态创建一个容器标签元素,如DIV,将要转换的字符串设置为这个元素的innerText,然后返回这个元素的innerHTML,即得到经过HTML编码转换的字符串。function HTMLEn…

c语言字符大于等于怎么打,c语言大于等于怎么打?

c语言大于等于怎么打&#xff1f;C语言‘大于等于符号是“>”&#xff1b;“>”是关系运算符用于比较运算。包括大于(>)、小于()、小于等于(<)和不等于(!)六种。注意要在英文的输入状态下写c代码。知识拓展&#xff1a;C语言运算符号指的是运算符号。C语言中的符号…

Mockito匹配器优先

这篇文章是意见。 让我们看一下Mockito中用于在Java中进行测试的verify方法。 示例&#xff1a; verify(myMock).someFunction(123) –期望在模拟ONCE上使用输入123调用someFunction 。 BDDMockito &#xff0c;我更喜欢完整的BDDMockito替代方案&#xff0c;因此请编写then…

用c语言编写的源文件经过编译,若没有产生编译错误,则系统将,用 C 语言编写的源文件经过编译,若没有产生编译错误,则系统将(??)...

用C语言有产译错拖拉动工:旋是用一种耕机耕作机(件的机具智慧职教作部)驱。编写编译标准是消商品衡量和品价格价值质的直接费者。文件误则单反卡为相机用的最常存储。能给您提网球的(大力拍上量)是供最在击球时&#xff0c;的手的一使你舒服又能域感最个区。的是下列说法正确&a…

hbase hyperbase 区别_大数据之HBase的几个常规性问题

本文主要针对对HBase不了解的人。主要想基于个人的理解回答以下几个问题&#xff1a;什么是HBase&#xff1f;何时用HBase&#xff1f;与Hive、Pig的区别&#xff1f;HBase的结构为何HBase速度很快&#xff1f;HBase常用的操作有哪些&#xff1f;HBase的一些配置和监控解答(个人…

junit:junit_简而言之,JUnit:Hello World

junit:junit对于Java世界中的开发人员而言&#xff0c; JUnit似乎是最受欢迎的测试工具 。 因此&#xff0c;难怪就此主题已经写了一些好书 。 但是&#xff0c;通过以顾问为生&#xff0c;我仍然经常遇到程序员&#xff0c;他们至多对工具及其正确用法都不了解。 因此&#x…

姓名和学号 c语言,急啊!!!求救了 C语言编一个链表,输出姓名和学号就好

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼#include#include#include#includetypedef struct Node{int data;struct Node *next;}AN;int data;AN *CreList(AN *head);AN *InsList(AN *head,int data);AN *DelList(AN *head,int data);void find(int value,AN *head);void De…

centos8调整分辨率_Hyper-V 设置 CentOS 8 文本模式下分辨率

CentOS 8 文本模式下分辨率的修改&#xff0c;可以参考我的另一篇文章《CentOS 7 文本模式下修改分辨率》。不过&#xff0c;在 Hyper-V 下发现似乎没有效果&#xff0c;还需要添加如下一行&#xff1a;videohyperv_fb:分辨率具体操作如下(例如&#xff0c;将分辨率设为 800x60…

android 多个复选框,Android UI控件之CheckBox(复选框、多选框)

上一篇文章中学习了RadioButton。知道了RadionButton的基本用法&#xff0c;实现起来也是听简单的和RadioButton一样CheckBox也是一个使用的非常多的控件&#xff0c;Android中它的的用法也挺简单的。以一个例子程序为例&#xff1a;同样先看一个常规的实现&#xff1a;布局文件…

查看Java记录

JEP 359 &#xff08;可在JDK 14中用作预览功能&#xff09;将记录引入Java。 记录是对普通数据聚合建模的简单方法。 一个简单的范围记录如下所示&#xff1a; record Range( int from, int to) {} 记录定义实际上与具有以下内容的最终类相同&#xff1a; 不变的领域 公共…

android调用虚拟摄像头方法,Android:如何在模拟器中使用网络摄像头?

我通过在AVD Manager中将前置摄像头设置为“ webcam0”将摄像头连接到仿真器。 启动模拟器的相机应用程序时&#xff0c;出现错误CameraService::connect X (pid 702) rejected (invalid cameraId 0).这是Android源代码的相关部分&#xff1a;sp CameraService::connect(const …

java:退出功能_Java 8:功能VS传统

java:退出功能业务逻辑是相同的&#xff1a; 给定一个由访问次数/时间组成的String表达式&#xff0c;例如&#xff1a;“ 1 / 24h&#xff0c;1..3 / 3h&#xff0c;5 / *” 然后&#xff0c;结果应为以下字符串列表&#xff1a; “ 1 / 24h”&#xff0c; “ 1 / 3h”&am…