【C#】C#匹配两个相似的字符串莱文斯坦距离

文章目录

  • 一、问题描述
  • 二、代码
  • 三、解释


一、问题描述

需要匹配多个类似的内容,并且要求相似度在70%以上并且长度相近,可以在处理每个匹配项时,将其与所有目标进行比较,并筛选出符合条件的匹配项。

二、代码

using System;
using System.Collections.Generic;
using System.Linq;// 定义页面名称
string pageTitle = "大气压力";// 定义要匹配的内容列表
List<string> targetDescriptions = new List<string>
{"大气层压力","天上的大气层压力","压力大气层"
};// 计算字符串相似度
double CalculateSimilarity(string s1, string s2)
{int maxLength = Math.Max(s1.Length, s2.Length);int distance = LevenshteinDistance(s1, s2);return 1.0 - (double)distance / maxLength;
}// 计算Levenshtein距离
int LevenshteinDistance(string s1, string s2)
{int[,] distance = new int[s1.Length + 1, s2.Length + 1];for (int i = 0; i <= s1.Length; i++){distance[i, 0] = i;}for (int j = 0; j <= s2.Length; j++){distance[0, j] = j;}for (int i = 1; i <= s1.Length; i++){for (int j = 1; j <= s2.Length; j++){int cost = s1[i - 1] == s2[j - 1] ? 0 : 1;distance[i, j] = Math.Min(Math.Min(distance[i - 1, j] + 1, distance[i, j - 1] + 1), distance[i - 1, j - 1] + cost);}}return distance[s1.Length, s2.Length];
}// 遍历所有要匹配的内容
foreach (string targetDescription in targetDescriptions)
{// 检查文本与页面名称的相似度和长度if (CalculateSimilarity(targetDescription, pageTitle) >= 0.7 && Math.Abs(targetDescription.Length - pageTitle.Length) <= 3){Console.WriteLine("匹配成功: " + targetDescription);}
}

三、解释

  1. 首先,定义了一个页面名称pageTitle为"大气压力"。
  2. 然后,定义了一个要匹配的内容列表targetDescriptions,包含了三个待匹配的描述
  3. 接着,定义了一个CalculateSimilarity函数,用于计算两个字符串之间的相似度。在函数内部,首先计算两个字符串的最大长度,然后使用Levenshtein距离算法计算它们之间的编辑距离,最后返回相似度值。
  4. 紧接着,定义了一个LevenshteinDistance函数,用于计算两个字符串之间的Levenshtein距离。该函数通过动态规划算法计算两个字符串之间的编辑距离。
  5. 最后,通过遍历要匹配的内容列表targetDescriptions,对每个描述进行相似度和长度的检查。如果某个描述与页面名称的相似度大于等于0.7并且长度差值不超过3,则输出"匹配成功:"以及匹配的描述内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/809141.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024最新AI系统【SparkAI】,ChatGPT商业运营版系统源码/ai问答/ai绘画/GPTs,SunoAI音乐生成大模型/带分销AIGC搭建部署教程

一、文章前言 SparkAi创作系统是基于ChatGPT进行开发的ai智能问答系统和Midjourney-AI绘画系统&#xff0c;支持OpenAI-GPT全模型国内AI全模型。本期针对源码系统整体测试下来非常完美&#xff0c;那么如何搭建部署AI创作ChatGPT&#xff1f;小编这里写一个详细图文教程吧。已…

vue 插槽使用

父控件 使用子控件时&#xff0c;为了能让子控件 在控件上面使用灵活多变&#xff0c;这里使用插槽。 简单插槽使用 <script>// 创建 vue实例const app Vue.createApp({ data() { return {text: 提交 } },// slot 插槽// slot 中使用的数据&#xff0c;作用域的问题&…

如何在 OpenLDAP 服务器上更改账户密码

简介 LDAP 系统通常用于存储用户账户信息。事实上&#xff0c;一些最常见的 LDAP 认证方法涉及存储在 LDAP 条目中的账户信息。 无论您的 LDAP 条目是被外部服务用于账户信息还是仅用于 LDAP 特定的授权绑定&#xff0c;密码管理都变得很重要。在本指南中&#xff0c;我们将讨…

MySQL进阶一

目录 1.使用环境 2.条件判断 2.1.case when 2.2.if 3.窗口函数 3.1.排序函数 3.2.聚合函数 ​​​​​​​3.3.partiton by ​​​​​​​3.4.order by 4.待续 1.使用环境 数据库&#xff1a;MySQL 8.0.30 客户端&#xff1a;Navicat 15.0.12 2.条件判断 2.1.ca…

手机银行客户端框架之EMAS介绍

EMAS简介 阿里巴巴应用研发平台&#xff08;Enterprise Mobile Application Studio&#xff0c;简称EMAS&#xff09;&#xff0c;是面向全端场景&#xff08;移动App、H5应用、小程序、Web应用、PC应用等&#xff09;的一站式应用研发平台。EMAS基于广泛的云原生技术&#xf…

5G智慧港口简介(一)

引言 港口作为交通运输的枢纽,在促进国际贸易和地区发展中起着举足轻重的作用,全球贸易中约 90% 的贸易由海运业承载,作业效率对于港口至关重要。在“工业 4.0”、“互联网 +”大发展的时代背景下,港口也在进行数字化、全自动的转型升级。随着全球 5G 技术浪潮的到来,华为…

Django域名根目录文件验证

以文件 MP_verify_QtVCdC7027HW9cjA.txt 为例 在Django项目中&#xff0c;为了让特定文件如MP_verify_QtVCdC7027HW9cjA.txt能够被访问&#xff0c;你需要将文件放置在Django项目的某个位置&#xff0c;并确保在URL配置中有相应的路由指向该文件。一种简单的方法是将其放置在你…

用国内版Devin:DevOpsGPT开发一个简易官网

前言&#xff1a; 世界上第一个AI程序员Devin想必已经给大家带来了不小的震撼&#xff0c;这种L4级的技术也许已经昭示着AGI离我们或许真的不远了。 这里先给大家普及一个概念&#xff1a; L4是谷歌对AGI划分的第四个等级&#xff0c;把代码丢给 AI 改这个是 L1 或者 L2 级别的…

K8S之Kubelet

在Kubernetes集群中&#xff0c;在每个Node&#xff08;又称为Minion&#xff09;上都会启动一个Kubelet服务进程。该进程用于处理Master下发到本节点的任务&#xff0c;管理Pod及Pod中的容器。每个Kubelet进程都会在API Server上注册节点自身的信息&#xff0c;定期向Master汇…

【精品PPT】智慧路灯大数据平台整体建设实施方案(免费下载)

1、知识星球下载&#xff1a; 如需下载完整PPTX可编辑源文件&#xff0c;请前往星球获取&#xff1a;https://t.zsxq.com/19QeHVt8y 2、免费领取步骤&#xff1a; 【1】关注公众号 方案驿站 【2】私信发送 【智慧路灯大数据平台】 【3】获取本方案PDF下载链接&#xff0c;直…

实战项目——智慧社区(三)之 门禁管理

1、人脸识别 实现思路 ①查询出所有的小区信息&#xff0c;下拉列表显示&#xff0c;用于后续判断人脸信息是否与所选小区匹配 ②人脸识别&#xff1a;调用腾讯人脸识别的API接口&#xff0c;首先判断传入图片是否为一张人脸&#xff1b;其次将这张人脸去服务器的人员库进行…

【简单讲解下WebView的使用与后退键处理】

&#x1f308;个人主页: 程序员不想敲代码啊 &#x1f3c6;CSDN优质创作者&#xff0c;CSDN实力新星&#xff0c;CSDN博客专家 &#x1f44d;点赞⭐评论⭐收藏 &#x1f91d;希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出指正&#xff0c;让我们共…

PDF文件内容可以转成word版本吗?答案是肯定的 PDF转word的方法

一&#xff0c;PDF转Word的必要性 随着信息技术的飞速发展&#xff0c;文档的格式和转换成为了我们日常生活和工作中不可避免的一部分。其中&#xff0c;PDF转Word的需求尤为突出。PDF作为一种跨平台的文档格式&#xff0c;具有阅读效果好、不易被篡改等优点&#xff0c;但在编…

Ubuntu18.04系统定时任务教程

在Ubuntu 18.04系统中&#xff0c;您可以通过以下步骤来设置定时任务&#xff0c;每10分钟执行一次&#xff0c;从某一个网站获取txt文本内容并清空root/1.txt和root/2.txt文件后再保存新内容&#xff1a; 安装curl&#xff08;如果尚未安装&#xff09;: 由于您需要从URL获取…

Swing客户端对接WukongIM--参考androidsdk,改写swing版本的悟空IMsdk。

前言 目前需要考察一些iot设备用信息服务器&#xff0c;悟空IM似乎也满足需要&#xff0c;故此文将尝试搬运一下androidsdk到 swing身上。 过程 暂略[苦干中]

MATLAB算法实战应用案例精讲-【数模应用】K折交叉验证

目录 前言 几个高频面试题目 K到底该取多少?为什么大部分人都要取10? 算法原理

基于Springcloud可视化项目:智慧工地可视化大数据云平台源码

目录 技术架构 智慧工地系统在实际推行过程中遇到的问题 智慧工地接纳程度较低 基础设施条件有待完善 智慧工地整体生态尚未完善 智慧工地平台各功能模块 施工过程工信程息信管息理管模理块 人员管理模块 生产管理模块 技术管理模块 质量管理模块 安全管理模块 绿…

【病毒分析】DevicData勒索病毒分析

1.背景 1.1来源 近期&#xff0c;Solar团队收到某医疗单位的援助请求&#xff0c;该公司的计算机受到了某勒索病毒的侵害&#xff0c;所有的文件被加密并且添加了.DevicData-P-470b1abd后缀&#xff0c;我司人员现场取证进行排查并提取加密器,本文是对于加密器的分析。 2.恶…

1.Godot引擎|场景|节点|GDS|介绍

Godot介绍 Godot是一款游戏引擎 可以通过在steam商城免费下载 初学者和编程基础稍差的推荐学习使用GDScript&#xff0c;和python有些相似 Godot节点 Godot的开发思想——围绕节点 节点的特征与优势 最常用基本的开发组件大部分都具有具体的功能&#xff0c;如图片&#xf…

ubuntu 应用程序设置 开机自启动

1. 通过.desktop方式 autostart 中.desktop 配置文件 1.1 用户级自启动 登录后才可以启动服务。 可视化配置&#xff1a;在ubuntu自带的可视化程序来配置&#xff0c;就是StartupApplications&#xff0c;它在启动台中可以找到。 在ubuntu下目录是 ~/.config/autostart 添…