度量相似性数学建模_一种基于粒子群位置更新思想灰狼优化算法的K-Means文本分类方法与流程...

技术特征:

1.一种基于粒子群位置更新思想灰狼优化算法的k-means文本分类方法,其特征在于:包括以下步骤:

s1:对文本数据进行预处理,得到预处理后文本数据;

s2:采用余弦角度为相似性度量,分别计算预处理后文本数据向量中的每一个数据对象到每一个初始灰狼个体的初始聚类中心点间的距离,并按相似度最接近的原则,分别将预处理文本数据中的数据对象分配到对应的k个类簇中,直到所有的数据对象分配完毕,形成k个类簇;再计算下一个灰狼个体的数据分配结果,直到灰狼种群中所有的灰狼个体都计算完毕,得到n种初步文本聚类结果;

s3:分别计算每一个灰狼个体到数据中心点间的距离之和,分别得到了n个灰狼个体的适应度评估函数值;

s4:对n个适应度评估函数值进行按序排列,选出适应度评估函数值最小的前三只狼作为α狼,β狼,δ狼;并根据α狼,β狼,δ狼三只狼的位置,计算灰狼种群中其他灰狼个体到这三只狼的距离,并计算其余灰狼个体位置更新的中间变量的值;s5:将带有粒子群位置更新思想的所有灰狼个体进行位置更新;

s6:判断粒子群位置更新思想改进的灰狼优化算法的k-means聚类算法是否达到最大迭代次数,如果否,则执行步骤2;如果是,输出α狼的适应度值及其位置xα,根据xα聚类中心得到的最终文本数据分配结果。

2.根据权利要求1所述的一种基于粒子群位置更新思想灰狼优化算法的k-means文本分类方法,其特征还在于:所述文本数据进行预处理步骤如下:

s1:采用分词软件划分反映完整文本句意的最小单位的词组;

s2:筛选无意义词组;

s3:采用向量空间模型进行数学建模,对分词后的本文数据采用词频统计进行分词权重计算,提取文本数据中的关键词;

s4:使用word2vec模型进行词的向量化,用向量化之后的文本数据向量作为聚类的数据输入。

3.根据权利要求1所述的一种基于粒子群位置更新思想灰狼优化算法的k-means文本分类方法,其特征还在于:所述余弦角度作为相似性度量公式如下:

其中xi(i=1,2,3...,n)表述数据对象向量,xj(j=1,2,3,...,n)表示中心点向量。

4.根据权利要求1所述的一种基于粒子群位置更新思想灰狼优化算法的k-means文本分类方法,其特征还在于:适应度评估函数值公式如公式如下:

其中,k代表聚类个数。

5.根据权利要求1所述的一种基于粒子群位置更新思想灰狼优化算法的k-means文本分类方法,其特征还在于:所述灰狼个体进行位置更新根据如下公式进行:

其中灰狼位置更新速度通过如下公式确定:

其中,w称为惯性因子,r7,r8,r9是属于[0,1]间的随机数,分别表示控制种群中其余狼与三只头狼之间距离的参数,范围为在[0,2]之间;分别表示位置更新后的灰狼个体位置;代表当前灰狼的位置。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/453065.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Overload重載和Override重写的区别。Overloaded的方法是否可以改变返回值的类型?

Overload是重载的意思,Override是覆盖的意思,也就是重写。 重载Overload表示同一个类中可以有多个名称相同的方法,但这些方法的参数列表各不相同(即参数个数或类型不同)。 重写Override表示子类中的方法可以与父类中的…

web服务器文件管理,web文件管理服务器

web文件管理服务器 内容精选换一换该任务指导用户在SSL证书管理平台下载证书。证书状态为已签发或托管中。仅支持在证书有效期内,不限次数的下载证书,下载后即可在服务器(华为云的或非华为云的均可)上进行部署。证书请求文件选择的是系统生成CSR&#xf…

简单计算器 (关于栈的一种应用)

题目:简单计算器读入一个只包含 , -, *, / 的非负整数计算表达式,计算该表达式的值。Input测试输入包含若干测试用例,每个测试用例占一行,每行不超过200个字符,整数和运算符之间用一个空格分隔。没有非法表达式。当一行…

python中模运算_Python中的模运算

所谓取模运算&#xff0c;就是计算两个数相除之后的余数&#xff0c;符号是%。如a % b就是计算a除以b的余数。用数学语言来描述&#xff0c;就是如果存在整数n和m&#xff0c;其中0 < m < b&#xff0c;使得$ a n * b m $&#xff0c;那么$ a \% b a - n * b m $。先…

伟大公司为什么需要技术型领导?

Facebook前工程总监黄易山撰写了一系列文章&#xff0c;很好地总结了Facebook卓越研发文化中的宝贵经验。本文是这一系列文章的第五篇&#xff0c;也是最后一篇。 何谓技术型领导 所有从外部聘用的管理人员包括技术部门负责人&#xff0c;都必须能够编写代码&#xff0c;并且…

css样式变 及实际用法

<html xmlns"http://www.w3.org/1999/xhtml"><head><meta http-equiv"Content-Type" content"text/html; charsetutf-8" /><title>引入外部样式</title><link rel" stylesheet" href"home.css&…

服务器部署的参数文档,服务器参数配置

服务器参数配置 内容精选换一换源端服务器迁移至华为云后&#xff0c;最终将迁移到弹性云服务器上。因此在迁移前&#xff0c;您需要在华为云中创建一个或多个弹性云服务器。进入“弹性云服务器”页面。关于参数的详细信息&#xff0c;请参见购买弹性云服务器。Windows系统的目…

扩散法及其改进

扩散法是一种静态路由算法,每一个输入的分组都被从除输入线路之外的所有其它线路上转发出去.扩散法显然会产生大量的分组副本,因此必须有一些办法来抑制无限的转发.1.一种办法是在分组头中携带一个跳数计数器,分组每到一个节点其跳数计数器就减1,当计数器为0时分组被丢弃.计数器…

h5页 点击返回时关闭_在微信、支付宝、百度钱包实现点击返回按钮关闭当前页面和窗口...

最近在使用微信、支付宝、百度钱包实现网页支付&#xff0c;对支付成功将自动关闭页面&#xff0c;对于支付失败&#xff0c;将显示错误信息。当在错误页面的时候&#xff0c;点击返回或者Android物理按键上一步的时候&#xff0c;将关闭页面。在微信、支付宝、百度钱包中&…

串操作指令

串操作指令可以方便对一组连续的数据进行操作。串操作后自动根据DF标志位修改ESI和EDI&#xff0c;DF 0时&#xff0c;ESI&#xff0c;EDI递增&#xff0c;DF 1时&#xff0c;ESI&#xff0c;EDI递减。串操作指令有2组&#xff0c;1组实现数据串传送&#xff0c;另1组实现数据…

IS-IS基本配置

实验内容&#xff1a;现在网络中有4台路由器&#xff0c;用户希望利用这4台路由器通过IS-IS协议实现网络互联&#xff0c;并且因为R1和R2性能相对较低&#xff0c;所以还要使这两台路由器处理的数据信息相对较少。 网络拓扑&#xff1a; 实验分析&#xff1a; 根据题意可知R1和…

高并发高流量网站架构

Web2.0的兴起&#xff0c;掀起了互联网新一轮的网络创业大潮。以用户为导向的新网站建设概念&#xff0c;细分了网站功能和用户群&#xff0c;不仅成功的造就了一大批新生的网站&#xff0c;也极大的方便了上网的人们。但Web2.0以用户为导向的理念&#xff0c;使得新生的网站有…

多处理机的进程调度方式

一.自调度方式 二.成组调度方式 三.专用处理机分配方式

枚举类型用法_Mybatis-plus常见用法总结三

前面已经介绍了Mybatis-plus基本用法&#xff0c;今天为大家分享一些Mybatis-plus高级应用逻辑删除自动注入枚举类型处理Sql注入器多租户表结构CREATE TABLE sys_role ( id varchar(64) NOT NULL COMMENT 主键, code varchar(64) NOT NULL DEFAULT COMMENT 角色编码, name …

NOIP 2011 Day2

tags: 贪心模拟NOIP categories:信息学竞赛总结计算系数 Solution 根据二项式定理,\[ \begin{align} (ab)^n\sum_{k0}^nC_{n}^{k}a^kb^{n-k} \end{align} \] 那么\[ \begin{align}(axby)^k&\sum_{p0}^kC_{k}^p(ax)^p(by)^{k-p}\\ &\sum_{p0}^k(C_{k}^pa^pb^{k-p})x^py^…

VS Code的golang开发配置 之 代码提示

之前用VS Code的时候&#xff0c;发现自己的代码的提示一直不好&#xff0c;换用JetBrain的Goland的代码提示是好了&#xff0c;但是比较占用资源。在网上找了一些资料&#xff0c;发现很多人也是遇到第三方或者自己的代码无法提示的情况&#xff0c;但是都没有下文了。后来发现…

使用oprofile分析性能瓶颈

使用oprofile分析性能瓶颈 1. 概述oprofile 是 Linux 平台上&#xff0c;类似 INTEL VTune 的一个功能强大的性能分析工具。其支持两种采样(sampling)方式&#xff1a;基于事件的采样(event based)和基于时间的采样(time based)。基于事件的采样是oprofile只记录特定事件&#…

什么是死锁

死锁是多个进程在运行过程中因竞争资源时产生的一种僵局。 各并发资源彼此等待对方拥有的资源&#xff0c;且在得到对方资源前不释放自己的资源。

python数据工程师 面试题_阿里P7工程师耗时两天整理的292道python大厂面试题,内含解析!...

前言相对于python大家应该都不会陌生吧&#xff01;现在java跟python可以算的是势均力敌了&#xff0c;所以现在学习python 的小伙伴也是越来越多了&#xff0c;可是学完之后就能找到称心如意的工作了吗&#xff1f;很多小伙伴学习Python的时候感觉很简单&#xff0c;但是到了去…