perl:字符串模糊匹配,计算 edit 距离

Levenshtein Distance,通常被称为编辑距离(Edit Distance)。该算法的概念是俄罗斯科学家弗拉基米尔·莱文斯坦(Levenshtein · Vladimir)于1965年提出。
它是用来计算两个字串之间,通过替换、插入、删除等操作将字符串str1转换成str2所需要操作的最少次数。

也存在其他编辑距离的定义方式:例如 Damerau-Levenshtein 距离就是一种莱文斯坦距离的变种,但允许以单一操作交换相邻的两个字符(称为字符转置),如 AB→BA 的距离是 1(交换)而非 2(先删除再插入、或者两次替换); LCS(最长公共子序列)距离只允许删除、加入字元; Jaro 距离只允许字符转置; 汉明距离只允许取代字元。

fuzzy 中文是模糊的意思。

运行 cpan

install Text::Fuzzy

编写 test_fuzzy.pl  如下

#!/usr/bin/perl
# test: Partial string matching using edit distances
use warnings;
use strict;
use utf8;
use Text::Fuzzy;my $tf = Text::Fuzzy->new ('我是中国人');
print "distance is ",$tf->distance ('我是华人'), "\n";# test: English
my $tf = Text::Fuzzy->new ('boboon');
print "Distance is ", $tf->distance ('babboon'), "\n";
my @words = qw/the quick brown fox jumped over the lazy dog/;
my $nearest = $tf->nearestv (\@words);
print "Nearest array entry is $nearest\n";

运行 perl test_fuzzy.pl

 distance is 2
Distance is 2
Nearest array entry is brown

参阅:字符串模糊匹配

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/781241.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

作业练习(python)

第一题: cel eval(input()) fah 9 / 5 * cel 32 print("%.1f" % fah) 第二题: radius, length eval(input()) area radius * radius * 3.14159267 volume area * length print("%.2f" % area) print("%.2f" …

MNN介绍、安装与编译:移动端深度学习推理引擎

MNN介绍、安装与编译:移动端深度学习推理引擎 引言第一部分:MNN简介第二部分:MNN的安装第三部分:MNN的编译结语 引言 大家好,这里是程序猿代码之路。在移动设备上实现高效的深度学习模型推理一直是人工智能领域的一个挑…

代码随想录(day10)——栈和队列

Leetcode.1047 删除字符串中所有相邻重复项: 1047. 删除字符串中的所有相邻重复项 - 力扣(LeetCode) 本题可以利用栈的思想进行解答。但是此处并不是真正的去使用一个栈,而是利用来替代栈在本题中的作用。具体如下: …

RHCE-2-chrony服务器

简介 重要性 由于IT系统中,准确的计时非常重要,有很多种原因需要准确计时: 在网络传输中,数据包括和日志需要准确的时间戳 各种应用程序中,如订单信息,交易信息等 都需要准确的时间戳 Linux的两个时钟 硬…

Mysql数据库与PostgreSQL数据库语法比较

目录 前言 模式的概念 模式的主要作用 一、Mysql和PostgreSQL语法比较 1.数据类型差异 1.1整型 1.2浮点数类型 1.3字符串差异 1.4数组类型 2.字符串连接 3.日期和时间函数差异 4.Limit子句的差异 5.NULL值的处理 6.自增主键列 7.变量和参数差异 8.连接查询 9.…

【JavaScript编程】前端实现文件下载

在前端实现文件下载&#xff0c;主要有以下几种常见的方法&#xff1a; 一、使用<a>标签 这种方法是最常见的&#xff0c;只需要在HTML中创建一个<a>标签&#xff0c;并通过JavaScript控制其点击行为&#xff0c;就可以实现文件下载。例如&#xff1a; function…

【Vue】动态样式

内联样式的动态样式 body(){ boxASelect:false, } v-bind:style"{borderColor:boxASelect ? red : #ccc}" <body><header><h1>Vue Dynamic Styling</h1></header><section id"styling"><div class"demo&quo…

2024年MathorCup数学建模思路A题B题C题D题思路分享

文章目录 1 赛题思路2 比赛日期和时间3 组织机构4 建模常见问题类型4.1 分类问题4.2 优化问题4.3 预测问题4.4 评价问题 5 建模资料 1 赛题思路 (赛题出来以后第一时间在CSDN分享) https://blog.csdn.net/dc_sinor?typeblog 2 比赛日期和时间 报名截止时间&#xff1a;2024…

深入理解MySQL索引:原理、类型

在数据库领域&#xff0c;索引是提高查询效率的重要工具之一。MySQL作为最流行的关系型数据库之一&#xff0c;其索引的使用和优化至关重要。本文将深入探讨MySQL索引的原理、类型以及最佳实践&#xff0c;帮助读者更好地理解和应用索引。 一、索引的基本概念 1. 什么是索引&…

电脑文件轻松管理:按大小归类,高效存储文件

在数字化时代&#xff0c;电脑文件的管理变得至关重要。面对海量的数据和信息&#xff0c;如何高效整理、归类和保存这些文件&#xff0c;成为了我们必须要面对的挑战。今天&#xff0c;我们就来介绍一种简单而实用的文件管理方法——按文件大小归类保存&#xff0c;让您的数据…

再次加深理解Java中的并发编程

目录 一、线程、进程、程序 二、线程状态 三、线程的七大参数 四、lock与synchronized锁机制 一&#xff09;、lock与synchronized锁区别 二&#xff09;、synchronized锁原理 三&#xff09;、Lock锁原理 五、synchronized锁升级原理 一&#xff09;、锁升级基础知识 …

深度思考:雪花算法snowflake分布式id生成原理详解

雪花算法snowflake是一种优秀的分布式ID生成方案&#xff0c;其优点突出&#xff1a;它能生成全局唯一且递增的ID&#xff0c;确保了数据的一致性和准确性&#xff1b;同时&#xff0c;该算法灵活性强&#xff0c;可自定义各部分bit位&#xff0c;满足不同业务场景的需求&#…

EXCEL VBA 多sheet批量转转PDF

EXCEL VBA 多sheet批量转转PDF Sub zhuanpdf() 转pdfApplication.ScreenUpdating False 关闭刷新Dim chaifm As String 拆分名chaifm Sheets("参数表").Cells(75, 2).ValueDim yuanbm As String 原表名Dim ws As Worksheet 定义表格Dim biao As String 表名Dim …

java Web洗衣店管理系统用eclipse定制开发mysql数据库BS模式java编程jdbc

一、源码特点 JSP 洗衣店管理系统是一套完善的web设计系统&#xff0c;对理解JSP java 编程开发语言有帮助&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。开发环境为TOMCAT7.0,eclipse开发&#xff0c;数据库为Mysql5.0&#xff0c;使用…

API接口自动化测试框架搭建之需求整理、详细设计和框架设计!

​ 简介&#xff1a; API接口自动化测试框架搭建之需求整理、详细设计和框架设计 1 需求整理 1.1 实现目的 API接口自动化测试&#xff0c;主要针对http接口协议&#xff1b;便于回归测试&#xff1b;线上或线下巡检测试&#xff0c;结合持续集成&#xff0c;及时发现运行环…

数据迁移通用笔记(Minio、Mysql、Mongo、ElasticSearch)

序号更新时间备注12024.03.26初始化笔记22024.03.27细化ES 集群和单节点的描述 文章目录 一、Mino 数据迁移1、mc的基础操作2、镜像复制3、备份复制 二、MySql数据迁移1、利用主从复制2、数据汇出汇入 三、Mongo数据迁移1、利用主从复制2、数据汇出汇入 四、ElasticSearch数据迁…

图像最低三位的可能情况

要求 函数f,函数g,分别针对三个比特位bit1,bit2,bit3进行运算,得到结果为A和B。具体为: A=f(bit1,bit2,bit3) B=g(bit1,bit2,bit3) 能否让函数f和函数g满足让A和B的结果出现四种可能“00”、“01”、“10”、“11”。 实现 可以设计这样的函数f和g,使得它们对于三个比特…

设计模式(8):组合模式

一.组合模式场景 把部分和整体的关系用树形结构来表示&#xff0c;从而使客户端可以使用统一的方式处理部分对象和整体对象。 二.组合模式核心 抽象组件(Component)角色&#xff1a;定义了叶子和容器组件的共同点&#xff1b;叶子组件(Leaf)角色&#xff1a;无子节点&#x…

嵌入式中逻辑分析仪的基本操作与实现

作为一名嵌入式软件/硬件工程师,要会使用各种仪表仪器,尤其示波器、逻辑分析仪, 这两个仪器可以监测各种数据线、信号线波形, 可以帮我们快速定位产品问题,缩短开发周期。 今天一口君安利一款非常不错的逻辑分析仪:kingst LA5016 这款仪器非常容易上手, 尤其在一些…

【滑动窗口】Leetcode 水果成篮

题目解析 904. 水果成篮 算法讲解 这道题的本质就是&#xff1a;寻找一段连续的区域&#xff08;子数组&#xff09;&#xff0c;这一段连续的区域里面最多包含两种水果&#xff0c;因为有可能这一段连续的区域里面全是一种水果&#xff0c;比如&#xff1a;f(x) {1,1,1,1,…