c#字符相似度对比通用类

本类适用于比较2个字符的相似度,代码如下:

View Code
using System;
using System.Collections.Generic;
using System.Text;
public class StringCompute
{
#region 私有变量
/// <summary>
/// 字符串1
/// </summary>
private char[] _ArrChar1;
/// <summary>
/// 字符串2
/// </summary>
private char[] _ArrChar2;
/// <summary>
/// 统计结果
/// </summary>
private Result _Result;
/// <summary>
/// 开始时间
/// </summary>
private DateTime _BeginTime;
/// <summary>
/// 结束时间
/// </summary>
private DateTime _EndTime;
/// <summary>
/// 计算次数
/// </summary>
private int _ComputeTimes;
/// <summary>
/// 算法矩阵
/// </summary>
private int[,] _Matrix;
/// <summary>
/// 矩阵列数
/// </summary>
private int _Column;
/// <summary>
/// 矩阵行数
/// </summary>
private int _Row;
#endregion
#region 属性
public Result ComputeResult
{
get { return _Result; }
}
#endregion
#region 构造函数
public StringCompute(string str1, string str2)
{
this.StringComputeInit(str1, str2);
}
public StringCompute()
{
}
#endregion
#region 算法实现
/// <summary>
/// 初始化算法基本信息
/// </summary>
/// <param name="str1">字符串1</param>
/// <param name="str2">字符串2</param>
private void StringComputeInit(string str1, string str2)
{
_ArrChar1 = str1.ToCharArray();
_ArrChar2 = str2.ToCharArray();
_Result = new Result();
_ComputeTimes = 0;
_Row = _ArrChar1.Length + 1;
_Column = _ArrChar2.Length + 1;
_Matrix = new int[_Row, _Column];
}
/// <summary>
/// 计算相似度
/// </summary>
public void Compute()
{
//开始时间
_BeginTime = DateTime.Now;
//初始化矩阵的第一行和第一列
this.InitMatrix();
int intCost = 0;
for (int i = 1; i < _Row; i++)
{
for (int j = 1; j < _Column; j++)
{
if (_ArrChar1[i - 1] == _ArrChar2[j - 1])
{
intCost = 0;
}
else
{
intCost = 1;
}
//关键步骤,计算当前位置值为左边+1、上面+1、左上角+intCost中的最小值 
//循环遍历到最后_Matrix[_Row - 1, _Column - 1]即为两个字符串的距离
_Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost);
_ComputeTimes++;
}
}
//结束时间
_EndTime = DateTime.Now;
//相似率 移动次数小于最长的字符串长度的20%算同一题
int intLength = _Row > _Column ? _Row : _Column;
_Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength);
_Result.UseTime = (_EndTime - _BeginTime).ToString();
_Result.ComputeTimes = _ComputeTimes.ToString();
_Result.Difference = _Matrix[_Row - 1, _Column - 1];
}
/// <summary>
/// 计算相似度(不记录比较时间)
/// </summary>
public void SpeedyCompute()
{
//开始时间
//_BeginTime = DateTime.Now;
//初始化矩阵的第一行和第一列
this.InitMatrix();
int intCost = 0;
for (int i = 1; i < _Row; i++)
{
for (int j = 1; j < _Column; j++)
{
if (_ArrChar1[i - 1] == _ArrChar2[j - 1])
{
intCost = 0;
}
else
{
intCost = 1;
}
//关键步骤,计算当前位置值为左边+1、上面+1、左上角+intCost中的最小值 
//循环遍历到最后_Matrix[_Row - 1, _Column - 1]即为两个字符串的距离
_Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost);
_ComputeTimes++;
}
}
//结束时间
//_EndTime = DateTime.Now;
//相似率 移动次数小于最长的字符串长度的20%算同一题
int intLength = _Row > _Column ? _Row : _Column;
_Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength);
// _Result.UseTime = (_EndTime - _BeginTime).ToString();
_Result.ComputeTimes = _ComputeTimes.ToString();
_Result.Difference = _Matrix[_Row - 1, _Column - 1];
}
/// <summary>
/// 计算相似度
/// </summary>
/// <param name="str1">字符串1</param>
/// <param name="str2">字符串2</param>
public void Compute(string str1, string str2)
{
this.StringComputeInit(str1, str2);
this.Compute();
}
/// <summary>
/// 计算相似度
/// </summary>
/// <param name="str1">字符串1</param>
/// <param name="str2">字符串2</param>
public void SpeedyCompute(string str1, string str2)
{
this.StringComputeInit(str1, str2);
this.SpeedyCompute();
}
/// <summary>
/// 初始化矩阵的第一行和第一列
/// </summary>
private void InitMatrix()
{
for (int i = 0; i < _Column; i++)
{
_Matrix[0, i] = i;
}
for (int i = 0; i < _Row; i++)
{
_Matrix[i, 0] = i;
}
}
/// <summary>
/// 取三个数中的最小值
/// </summary>
/// <param name="First"></param>
/// <param name="Second"></param>
/// <param name="Third"></param>
/// <returns></returns>
private int Minimum(int First, int Second, int Third)
{
int intMin = First;
if (Second < intMin)
{
intMin = Second;
}
if (Third < intMin)
{
intMin = Third;
}
return intMin;
}
#endregion
}
/// <summary>
/// 计算结果
/// </summary>
public struct Result
{
/// <summary>
/// 相似度
/// </summary>
public decimal Rate;
/// <summary>
/// 对比次数
/// </summary>
public string ComputeTimes;
/// <summary>
/// 使用时间
/// </summary>
public string UseTime;
/// <summary>
/// 差异
/// </summary>
public int Difference;
}

调用方法:

// 方式一
StringCompute stringcompute1 = new StringCompute();
stringcompute1.SpeedyCompute("对比字符一", "对比字符二");    // 计算相似度, 不记录比较时间
decimal rate = stringcompute1.ComputeResult.Rate;         // 相似度百分之几,完全匹配相似度为1
// 方式二
StringCompute stringcompute2 = new StringCompute();
stringcompute2.Compute();                                  // 计算相似度, 记录比较时间
string usetime = stringcompute2.ComputeResult.UseTime;     // 对比使用时间

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/547555.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux 日记函数,每日记一些php函数,jQuery函数和linux命令(一)

每天记一些php函数&#xff0c;jQuery函数和linux命令(一)简介&#xff1a;学习完了php和jQuery之后&#xff0c;对函数的记忆不到位&#xff0c;导致很多函数没记住&#xff0c;所以为了促进自己的记忆&#xff0c;每天花一点时间来写这个博客。时间&#xff1a;2016-12-18 …

蒋家骏_百度百科

蒋家骏_百度百科蒋家骏

基于Kubernetes的Spark部署完全指南

基于Kubernetes的Spark部署完全指南 【编者的话】本文是在Kubernets上搭建Spark集群的操作指南&#xff0c;同时提供了Spark测试任务及相关的测试数据&#xff0c;通过阅读本文&#xff0c;你可以实践从制作Spark镜像、搭建Spark容器集群&#xff0c;到在集群上运行测试任务的…

javascript数字格式化通用类——accounting.js使用

简介 accounting.js 是一个非常小的JavaScript方法库用于对数字&#xff0c;金额和货币进行格式化。并提供可选的Excel风格列渲染。它没有依赖任何JS框架。货币符号等可以按需求进行定制。 代码内容及下载地址 accounting.js代码如下&#xff1a; View Code /*!* accounting…

linux清除cpu,解决kswapd0 CPU占用率高的问题-清除病毒

连接服务器时发现cpu使用率100%&#xff0c;使用top命令查看是kswapd0进程占用cpu极高百度下后知道kswapd0进程的作用&#xff1a;它是虚拟内存管理中&#xff0c;负责换页的&#xff0c;操作系统每过一定时间就会唤醒kswapd &#xff0c;看看内存是否紧张&#xff0c;如果不紧…

Apache+Mysql+php+ZenTaoPMS安装配置文档

基于ApacheMysqlphpZenTaoPMS安装配置一、Apache安装配置tar zxvf httpd-2.2.23.tar.gzcd httpd-2.2.23mkdir –p /usr/local/app/apache2./configure --prefix/usr/local/app/apache2 --enable-so \--enable-maintainer-mode --enable-rewrite #添加后面的参数是为了解析s…

富编译器汇总及二次开发Demo

富文本编译器汇总 名称总大小当前版本官方地址扩展方法xhEditor1.43 MBv1.1.14http://xheditor.comhttp://xheditor.com/demos/demo09.htmlMarkitUp98.7 KBv1.1.13http://markitup.jaysalvat.com/home在set.js里设置开发。jwysiwyg1.52 MBv0.98https://github.com/akzhan/jwys…

docker安装nginx并配置SSL到个人博客

1 准备 1.已安装好docker环境 2.已申请好域名 2 申请SSL证书 我使用的是腾讯云&#xff0c;申请免费的TrustAsia的SSL证书&#xff0c;阿里云等或者其他平台一般都会提供TrustAsia的SSL证书的 填好域名等相关信息&#xff0c;一般一天就可以下载证书了 3 docker安装Nginx …

redhat linux 6.5 vnc,redhat 6.5 YUM安装kvm 并用VNC远程管理

安装完REDHAT&#xff0c;我们首先配置yum源先卸载系统原来的YUM包一、配置redhat yum源#rpm -aq|grep yum|xargs rpm -e --nodeps下载YUM源&#xff0c;我用的是&#xff11;&#xff16;&#xff13;的# wget http://mirrors.163.com/centos/6/os/x86_64/Packages/yum-plugin…

Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用

简介 本文介绍net处理html页面元素的工具类(HtmlAgilityPack.dll)的使用&#xff0c;用途比较多的应该是例如采集类的功能&#xff0c;采集到的html字符串要怎样处理是一个头痛的问题&#xff0c;如果是截取就太麻烦了而且容易出错。所有就用到本文的第三方dll来处理了。 下载…

Mongo数据库安装成Windows服务

Mongo数据库安装成Windows服务每次运行mongod --dbpath D:/MongoDB/data命令行来启动MongoDB实在是不方便&#xff0c; 把它作为Windows服务&#xff0c;这样就方便多了。1、代码示例&#xff1a;D:\MongoDB\bin>mongod --dbpath D:\Work\MongoDB\Data --directoryperdb --l…

用DOSBox运行老游戏

DOSBox0.74-3-win32-installer.exe下载地址&#xff1a; https://nchc.dl.sourceforge.net/project/dosbox/dosbox/0.74-3/DOSBox0.74-3-win32-installer.exe 金庸群侠传&#xff1a;https://dos.zczc.cz/games/%E9%87%91%E5%BA%B8%E7%BE%A4%E4%BE%A0%E4%BC%A0/download 新版本…

HttpWebRequest采集读取网站挂载Cookie的通用方法

Asp.net 版本 HttpWebRequest采集时添加&#xff1a;httpWebRequest.CookieContainer new CookieContainer();就能远程挂载上cookie,那么怎样去读取挂载上的cookie呢&#xff1f; 下面方法为大家解除烦恼。 遍历方法&#xff1a; public static List<Cookie> GetAllC…

最小公约数最大公倍数c语言for循环,C语言的那些题(四)——最大公约数和最小公倍数...

今天&#xff0c;和大家分享一道关于求最大公约数和最小公倍数的题。关于最大公约数和最小公倍数可以算是一个学编程语言常见的题目&#xff0c;这里我和大家分享两种解法&#xff0c;循环法和辗转相除法。我们先看一下题目&#xff1a;输入两个数&#xff0c;求最大公约数和最…

宿主机为linux、windows分别实现VMware三种方式上网(转)

一、VMware三种方式工作原理1 Host-only连接方式 让虚机具有与宿主机不同的各自独立IP地址&#xff0c;但与宿主机位于不同网段&#xff0c;同时为宿主主机新增一个IP地址&#xff0c;且保证该IP地址与各虚机IP地址位于同一网段。最终结果是新建了一个由所有虚机与宿主主机所构…

摔倒、摔倒检测数据集

近期学习摔倒检测&#xff0c;接触摔倒数据集&#xff0c;自学笔记&#xff0c;仅用作个人复习。 the UR fall detection dataset (URFD)the fall detection dataset (FDD) UR Fall Detection Dataset &#xff08;University of Rzeszow - 热舒夫大学&#xff09; 数据集网…

visual studio内置“iis”组件提取及二次开发

简介 visual studio安装后会自带小型的“iis”服务器&#xff0c;本文就简单提取一下这个组件&#xff0c;自己做一个小型“iis”服务器吧。先来说用途吧&#xff08;废话可绕过&#xff09;&#xff0c;比如在服务器上没有安装iis&#xff0c;或者给客户演示asp.net程序&…

c语言 正号运算符 作用,C语言中,哪些运算符具有左结合性,哪些具有右结合性,帮忙总结下,...

1级(左结合)   () 圆括号&#xff1b;[]下标运算符&#xff1b;->指向结构体成员运算符&#xff1b;. 结构体成员运算符.   2级(右结合)   !逻辑非运算符&#xff1b;~按位取反运算符&#xff1b;前缀增量运算符&#xff1b;--前缀减量运算符&#xff1b;正号运算符&a…

每一个问题都是一把锁

每一个问题都是一把锁&#xff0c;你要相信&#xff0c;世界上一定存在一把钥匙可以打开这把锁&#xff0c;你也一定能找到这把钥匙。

禁用 Microsoft 软件保护平台服务

以前没怎么注意&#xff0c;老觉得cup没事就声音很大&#xff0c;后来发现这玩意儿占用巨多cup&#xff0c;希望有大佬帮助解决一下&#xff0c;谢谢 解决方法&#xff1a; 首先使用【Win】 【R】组合快捷键&#xff0c;快速打开运行命令框&#xff0c;在打开后面键入命令&am…