【C#】C#匹配两个相似的字符串莱文斯坦距离Levenshtein Distance莱文斯坦距离算法

文章目录

  • 一、问题描述
  • 二、代码
  • 三、解释


一、问题描述

需要匹配多个类似的内容,并且要求相似度在70%以上并且长度相近,可以在处理每个匹配项时,将其与所有目标进行比较,并筛选出符合条件的匹配项。

二、代码

using System;
using System.Collections.Generic;
using System.Linq;// 定义页面名称
string pageTitle = "大气压力";// 定义要匹配的内容列表
List<string> targetDescriptions = new List<string>
{"大气层压力","天上的大气层压力","压力大气层"
};// 计算字符串相似度
double CalculateSimilarity(string s1, string s2)
{int maxLength = Math.Max(s1.Length, s2.Length);int distance = LevenshteinDistance(s1, s2);return 1.0 - (double)distance / maxLength;
}// 计算Levenshtein距离public static int LevenshteinDistance(String word1, String word2) {int m = word1.length();int n = word2.length();if( m*n == 0 ) {return Math.max(m, n);}int[][] lev = new int[m+1][n+1];// 字符串word1从空串 变为 字符串word2 前j个字符 的莱文斯坦距离for (int j=0; j<n+1; j++) {lev[0][j] = j;}// 字符串word1从前i个字符 变为 空串 的莱文斯坦距离for (int i=0; i<m+1; i++) {lev[i][0] = i;}for (int i=1; i<m+1; i++) {for (int j=1; j<n+1; j++) {// 在 字符串A的前i个字符 与 字符串B的前j-1个字符 完全相同的基础上, 进行一次插入操作int countByInsert = lev[i][j-1] + 1;// 在 字符串A的前i-1个字符 与 字符串B的前j个字符 完全相同的基础上, 进行一次删除操作int countByDel = lev[i-1][j] + 1;// 在 字符串A的前i-1个字符 与 字符串B的前j-1个字符 完全相同的基础上, 进行一次替换操作int countByReplace =  word1.charAt(i-1)==word2.charAt(j-1) ? lev[i-1][j-1] : lev[i-1][j-1]+1;// 计算 字符串A的前i个字符 与 字符串B的前j个字符 的莱文斯坦距离lev[i][j] = min( countByInsert, countByDel, countByReplace );}}return lev[m][n];}
// 遍历所有要匹配的内容
foreach (string targetDescription in targetDescriptions)
{// 检查文本与页面名称的相似度和长度if (CalculateSimilarity(targetDescription, pageTitle) >= 0.7 && Math.Abs(targetDescription.Length - pageTitle.Length) <= 3){Console.WriteLine("匹配成功: " + targetDescription);}
}

三、解释

  1. 首先,定义了一个页面名称pageTitle为"大气压力"。
  2. 然后,定义了一个要匹配的内容列表targetDescriptions,包含了三个待匹配的描述
  3. 接着,定义了一个CalculateSimilarity函数,用于计算两个字符串之间的相似度。在函数内部,首先计算两个字符串的最大长度,然后使用Levenshtein距离算法计算它们之间的编辑距离,最后返回相似度值。
  4. 紧接着,定义了一个LevenshteinDistance函数,用于计算两个字符串之间的Levenshtein距离。该函数通过动态规划算法计算两个字符串之间的编辑距离。
  5. 最后,通过遍历要匹配的内容列表targetDescriptions,对每个描述进行相似度和长度的检查。如果某个描述与页面名称的相似度大于等于0.7并且长度差值不超过3,则输出"匹配成功:"以及匹配的描述内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/810024.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【2024MathorCup妈妈杯建模】赛题 B:甲骨文智能识别中原始拓片单字自动分割与识别研究

【2024MathorCup妈妈杯建模】赛题 B&#xff1a;甲骨文智能识别中原始拓片单字自动分割与识别研究 加群可以享受定制等更多服务&#xff0c;或者搜索B站&#xff1a;数模洛凌寺 联络组织企鹅&#xff1a;904117571 问题重述 问题 1&#xff1a;对于附件 1&#xff08;Pre_…

npm创建Vue3项目

npm创建Vue3项目 1 创建Vue项目说明 2 安装3 运行 1 创建Vue项目 创建最新版的Vue项目&#xff0c;已经不推荐使用CLI构建方式了。参考如下即可。 npm create vuelatest如果发现一直动不了&#xff0c;切换网络试一下&#xff0c;个人热点尝试一下。 按下图的选项按需引入自…

提升编程效率的秘密武器:IntelliJ IDEA

IntelliJ IDEA的基本介绍 正如一个故事的开头&#xff0c;我们从一个名字开始 - IntelliJ IDEA。这是一个在程序员中广受欢迎的集成开发环境&#xff08;IDE&#xff09;&#xff0c;由捷克公司JetBrains开发。它的名字听起来有些复杂&#xff0c;但实际上&#xff0c;它的功能…

云计算平台(2)

云计算教学平台简介 采取B/S架构&#xff0c;将教学、实训、实战完美结合&#xff0c;提供综合一站式教学与实践体验&#xff0c;平台结合大量插件、模块&#xff0c;易用性与交互性大大提升&#xff0c;让教学更轻松、实践更高效。 将混合式教学、翻转课堂等新教育模式充分与…

GB∕T 25058-2019 信息安全技术 网络安全等级保护实施指南

GB∕T 25058-2019 信息安全技术 网络安全等级保护实施指南

AMD Tensile 简介与示例

按照知其然&#xff0c;再知其所以然的认知次序进行 1&#xff0c;下载代码 git clone --recursive https://github.com/ROCm/Tensile.git 2&#xff0c;安装 Tensile cd Tensile mkdir build cd build ../Tensile/bin/Tensile ../Tensile/Configs/rocblas_dgemm_nn_asm_full…

算法 分割字符串为实体类

题目 String userData "10000:张三:男:1998-01-01#10001:张三:男:1998-01-01#10002:李四:女:1999-02-02#10003:王五:男:2000-03-03#10004:赵六:女:2001-04-04"; String[] usersArray userData.split("#"); // 使用Stream API将字符串数组转换为SysUser对…

【计算机毕业设计】音乐论坛App管理系统——后附源码

&#x1f389;**欢迎来到琛哥的技术世界&#xff01;**&#x1f389; &#x1f4d8; 博主小档案&#xff1a; 琛哥&#xff0c;一名来自世界500强的资深程序猿&#xff0c;毕业于国内知名985高校。 &#x1f527; 技术专长&#xff1a; 琛哥在深度学习任务中展现出卓越的能力&a…

C++ | Leetcode C++题解之第21题合并两个有序链表

题解&#xff1a; 题解&#xff1a; class Solution { public:ListNode* mergeTwoLists(ListNode* l1, ListNode* l2) {ListNode* preHead new ListNode(-1);ListNode* prev preHead;while (l1 ! nullptr && l2 ! nullptr) {if (l1->val < l2->val) {prev-…

【vue】v-if 条件渲染

v-if 不适用于频繁切换显示模式的场景 修改web.user&#xff0c;可看到条件渲染的效果 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initi…

.NET MAUI使用Visual Studio Android Emulator(安卓模拟器)运行

Android Emulator&#xff08;安卓模拟器&#xff09;运行&#xff1a; 安卓模拟器一直卡在不动&#xff1a; 在某些情况下&#xff0c;在“打开或关闭 Windows 功能”对话框中启用 Hyper-V 和 Windows 虚拟机监控程序平台后可能无法正确启用Hyper-V。 我就是开启Hyper-V才把安…

测试领域革新:ChatGPT助你轻松编写测试方案!

简介 测试方案是指描述需要被测产品的特性、测试的方法、测试环境的规划、测试工具的设计和选择、测试用例的设计方法、测试代码的设计方案。 我们常常需要根据产品的特性、测试策略等几个方向输出对应的测试方案。在写测试方案的过程中&#xff0c;常常会碰到没有头绪的问题…

卫星导航双频低噪声放大器芯片—ATR2701

ATR2701 是一款专门针对卫星导航 L1 和 L2 双频段应用而设计的高增益、低噪声系数射频放大器。 ATR2701 芯片采用采用 2 级放大器的结构设计&#xff0c;具有 28 dB 高增益和 0.85dB 的低噪声系数。芯片支持 3.3V 至 5V 宽电源供电。芯片采用 2.1 mm X 2.3 mm 1 mm 的 SOT 封…

Kubernetes学习笔记11

k8s集群核心概念&#xff1a;pod&#xff1a; 在K8s集群中是不能直接运行容器的&#xff0c;K8s的最小调度单元是Pod&#xff0c;我们要使用Pod来运行应用程序。 学习目标&#xff1a; 了解pod概念&#xff1a; 了解查看pod方法 了解创建pod方法 了解pod访问方法 了解删除…

Promise简单概述

一. Promise是什么&#xff1f; 理解 1.抽象表达&#xff1a; Promise是一门新的技术(ES6规范) Promise是JS中进行异步编程的新解决方案(旧方案是单纯使用回调函数) 异步编程&#xff1a;包括fs文件操作&#xff0c;数据库操作(Mysql)&#xff0c;AJAX&#xff0c;定时器 2.具…

使用Nodejs + express连接数据库mongoose

文章目录 先创建一个js文档安装 MongoDB 驱动程序&#xff1a;引入 MongoDB 模块&#xff1a;设置数据库连接&#xff1a;新建一个表试试执行数据库操作&#xff1a;关闭数据库连接&#xff1a; 前面需要准备的内容可看前面的文章&#xff1a; Express框架搭建项目 node.js 简单…

计算机网络—RTT-RTTS-RTTD和RTO的解释及例题讲解

RTT&#xff08;往返时延&#xff09;、RTTS&#xff08;平滑往返时间&#xff09;、RTTD&#xff08;往返偏移时间&#xff09;和RTO&#xff08;超时重传&#xff09;是网络通信中常用的几个术语&#xff0c;尤其在TCP协议中非常重要。 下面是一个表格&#xff0c;用于解释这…

jodconverter+openOffice word文档pdf转换

刚好遇到了&#xff0c;花了几个小时时间研究了下。 第一种:POIiText PDFBox&#xff0c;试了下&#xff0c;效果不太行&#xff0c;比较差&#xff0c;而且有些中文以及格式不好处理 第二种:jacob 不支持linux&#xff0c;不考虑 第三种:aspose 收费&#xff0c;不考虑 第…

Java高频面试之JVM篇

说一下 Jvm 的主要组成部分&#xff1f;及其作用&#xff1f; 类加载器执行器运行时数据区域本地接口 谈谈对运行时数据区的理解&#xff1f; 堆和栈的区别是什么&#xff1f; 堆中存什么&#xff1f;栈中存什么&#xff1f; 堆总存对象,栈中存局部变量,引用 为什么要把堆…

什么牌子的运动耳机比较好?五款舒适又实用的运动耳机推荐

跑步、健身、游泳……无论你的运动喜好是什么&#xff0c;一款好的运动蓝牙耳机都能为你的运动体验加分。然而&#xff0c;市面上的运动蓝牙耳机品牌众多&#xff0c;如何选择一款既舒适又实用的产品呢&#xff1f;本文将为你提供一些选购运动蓝牙耳机建议&#xff0c;并为你推…