8.动态规划(1)——字符串的编辑距离

  动态规划的算法题往往都是各大公司笔试题的常客。在不少算法类的微信公众号中,关于“动态规划”的文章屡见不鲜,都在试图用最浅显易懂的文字来描述讲解动态规划,甚至有的用漫画来解释,认真读每一篇公众号推送的文章实际上都能读得懂,都能对动态规划有一个大概了解。

  什么是动态规划?通俗地理解来说,一个问题的解决办法一看就知道(穷举),但不能一个一个数啊,你得找到最优的解决办法,换句话说题目中就会出现类似“最多”、“最少”,“一共有多少种”等提法,这些题理论上都能使用动态规划的思想来求解。动态规划与分治方法类似,都是通过组合子问题的解来求解原问题,但它对每个子问题只求解一次,将其保存在表格中,无需重新计算,通常用于求解最优化问题——《算法导论》

  编辑距离(Edit Distance),在本文指的是Levenshtein距离,也就是字符串S1通过插入、修改、删除三种操作最少能变换成字符串S2的次数。例如:S1 = abcS2 = abf,编辑距离d = 1(只需将c修改为f)。在本文中将利用动态规划的算法思想对字符串的编辑距离求解。

  定义:S1、S2表示两个字符串S1(i)表示S1的第一个字符d[i, j]表示S1i个前缀到S2的第j个前缀(例如:S1 = ”abc”,S2 = ”def”,求解S1S2的编辑距离d[3, 3])。

  1.   若S1 = ”abc”, S2 = ”dec”,此时它们的编辑距离为d[3, 3] = 2,观察两个字符串的最后一个字符是相同的,也就是说S1(3) = S2(3)不需要做任何变换,故S1 = ”abc”, S2 = ”dec” <= > S1’ = ”ab”, S2’ = ”de”,即当S1[i] = S[j]d[i, j] = d[i-1,j -1]。得到公式:d[i, j] = d[i - 1, j - 1] (S1[i] = S2[j])
  2.   上面一条得出了当S1[i] = S2[j]的计算公式,显然还有另一种情况就是S1[i] ≠ S2[j],若S1 = ”abc”, S2 = ”def”。S1变换到S2的过程可以修改,但还可以通过插入删除使得S1变换为S2

    1)在S1字符串末位插入字符“f”,此时S1 = ”abcf”,S2 = ”def”,此时即S1[i] = S2[j]的情况S1变换为S2的编辑距离为d[4, 3] = d[3, 2]。所以得出d[i, j]=d[i, j - 1] + 1。(+1是因为S1新增了”f”

    2)在S2字符串末位插入字符“c”,此时S1 = ”abc”S2 = ”defc”,此时即S1[i] = S[j]的情况,S1变换为S2的编辑距离为d[3, 4] = d[2, 3]。所以得出d[i, j]=d[i - 1, j] + 1,实际上这是对S1做了删除。(+1是因为S2新增了”c”

    3)将S1字符串末位字符修改”f”,此时S1 = ”abf”S2 = ”def”,此时即S1[i] = S[j]的情况,S1变换为S2的编辑距离为d[3, 3] = d[2, 2]。所以得出d[i, j] = d[i – 1, j - 1] + 1。(+1是因为S1修改了“c”

  综上,得出递推公式:

=>

  不妨用表格表示出动态规划对S1=”abc”S2=“def”的求解过程。

  可以看出红色方块即是最终所求的编辑距离,整个求解过程就是填满这个表——二维数组。下面是JavaPython分别对字符串编辑距离的动态规划求解。

  Java

 

  1 package com.algorithm.dynamicprogramming;
  2 
  3 /**
  4  * 动态规划——字符串的编辑距离
  5  * s1 = "abc", s2 = "def"
  6  * 计算公式:
  7  *          | 0                                           i = 0, j = 0
  8  *          | j                                           i = 0, j > 0
  9  * d[i,j] = | i                                           i > 0, j = 0
 10  *          | min(d[i,j-1]+1, d[i-1,j]+1, d[i-1,j-1])    s1(i) = s2(j)
 11  *          | min(d[i,j-1]+1, d[i-1,j]+1, d[i-1,j-1]+1)  s1(i) ≠ s2(j)
 12  * 定义二维数组[4][4]:
 13  *      d e f            d e f
 14  *   |x|x|x|x|        |0|1|2|3|
 15  * a |x|x|x|x|  =>  a |1|1|2|3|  => 编辑距离d = [3][3] = 3
 16  * b |x|x|x|x|      b |2|2|2|3|
 17  * c |x|x|x|x|      c |3|3|3|3|
 18  *
 19  * Created by yulinfeng on 6/29/17.
 20  */
 21 public class Levenshtein {
 22 
 23     public static void main(String[] args) {
 24         String s1 = "abc";
 25         String s2 = "def";
 26         int editDistance = levenshtein(s1, s2);
 27         System.out.println("s1=" + s1 + "与s2=" + s2 + "的编辑距离为:" + editDistance);
 28     }
 29 
 30     /**
 31      * 编辑距离求解
 32      * @param s1 字符串s1
 33      * @param s2 字符串s2
 34      * @return 编辑距离
 35      */
 36     private static int levenshtein(String s1, String s2) {
 37         int i = 0;  //s1字符串中的字符下标
 38         int j = 0;  //s2字符串中的字符下标
 39         char s1i = 0;   //s1字符串第i个字符
 40         char s2j = 0;   //s2字符串第j个字符
 41         int m = s1.length();    //s1字符串长度
 42         int n = s2.length();    //s2字符串长度
 43         if (m == 0) {   //s1字符串长度为0,此时的编辑距离就是s2字符串长度
 44             return n;
 45         }
 46         if (n == 0) {
 47             return m;   //s2字符串长度为0,此时的编辑距离就是s1字符串长度
 48         }
 49         int[][] solutionMatrix = new int[m + 1][n + 1];     //求解矩阵
 50         /**
 51          *      d e f
 52          *   |0|x|x|x|
 53          * a |1|x|x|x|
 54          * b |2|x|x|x|
 55          * c |3|x|x|x|
 56          */
 57         for (i = 0; i < m + 1; i++) {
 58             solutionMatrix[i][0] = i;
 59         }
 60         /**
 61          *      d e f
 62          *   |0|1|2|3|
 63          * a |x|x|x|x|
 64          * b |x|x|x|x|
 65          * c |x|x|x|x|
 66          */
 67         for (j = 0; j < n + 1; j++) {
 68             solutionMatrix[0][j] = j;
 69         }
 70         /**
 71          * 上面两个操作后,求解矩阵变为
 72          *      d e f
 73          *   |0|1|2|3|
 74          * a |1|x|x|x|
 75          * b |2|x|x|x|
 76          * c |3|x|x|x|
 77          * 接下来就是填充剩余表格
 78          */
 79         for (i = 1; i < m + 1; i++) {   //i = 1,j = 1, 2, 3,以行开始填充
 80             s1i = s1.charAt(i - 1);
 81             for (j = 1; j < n + 1; j++) {
 82                 s2j = s2.charAt(j - 1);
 83                 int flag = (s1i == s2j) ? 0 : 1;    //根据公式,如果s1[i] = s2[j],则d[i,j]=d[i-1,j-1],如果s1[i] ≠ s2[j],则其中一个公式为d[i,j]=d[i-1,j-1]+1
 84                 solutionMatrix[i][j] = min(solutionMatrix[i][j-1] + 1, solutionMatrix[i-1][j] + 1, solutionMatrix[i-1][j-1] + flag);
 85             }
 86         }
 87         return solutionMatrix[m][n];
 88     }
 89 
 90     /**
 91      * 根据公式求解编辑距离
 92      * @param insert s1插入操作
 93      * @param delete s1删除操作
 94      * @param edit s1修改操作
 95      * @return 编辑距离
 96      */
 97     private static int min(int insert, int delete, int edit) {
 98         int tmp = insert < delete ? insert : delete;
 99         return tmp < edit ? tmp : edit;
100     }
101 }

  Python3

 1 '''
 2     动态规划——字符串的编辑距离
 3     s1 = "abc", s2 = "def"
 4     计算公式:
 5              | 0                                           i = 0, j = 0
 6              | j                                           i = 0, j > 0
 7     d[i,j] = | i                                           i > 0, j = 0
 8              | min(d[i,j-1]+1, d[i-1,j]+1, d[i-1,j-1])    s1(i) = s2(j)
 9              | min(d[i,j-1]+1, d[i-1,j]+1, d[i-1,j-1]+1)  s1(i) ≠ s2(j)
10     定义二维数组[4][4]:
11         d e f            d e f
12     |x|x|x|x|        |0|1|2|3|
13     a |x|x|x|x|  =>  a |1|1|2|3|  => 编辑距离d = [4][4] = 3
14     b |x|x|x|x|      b |2|2|2|3|
15     c |x|x|x|x|      c |3|3|3|3|
16 '''
17 def levenshtein(s1, s2):
18     i = 0   #s1字符串中的字符下标
19     j = 0   #s2字符串中的字符下标
20     s1i = ""    #s1字符串第i个字符
21     s2j = ""    #s2字符串第j个字符
22     m = len(s1) #s1字符串长度
23     n = len(s2) #s2字符串长度
24     if m == 0:
25         return n    #s1字符串长度为0,此时的编辑距离就是s2字符串长度
26     if n == 0:
27         return m    #s2字符串长度为0,此时的编辑距离就是s1字符串长度
28     solutionMatrix = [[0 for col in range(n + 1)] for row in range(m + 1)]  #长为m+1,宽为n+1的矩阵
29     '''
30              d e f
31           |0|x|x|x|
32         a |1|x|x|x|
33         b |2|x|x|x|
34         c |3|x|x|x|
35     '''
36     for i in range(m + 1):
37         solutionMatrix[i][0] = i
38     '''
39              d e f
40           |0|1|2|3|
41         a |x|x|x|x|
42         b |x|x|x|x|
43         c |x|x|x|x|
44         
45     '''
46     for j in range(n + 1):
47         solutionMatrix[0][j] = j
48     '''
49         上面两个操作后,求解矩阵变为
50              d e f
51           |0|1|2|3|
52         a |1|x|x|x|
53         b |2|x|x|x|
54         c |3|x|x|x|
55         接下来就是填充剩余表格
56     '''
57     for x in range(1, m + 1):
58         s1i = s1[x - 1]
59         for y in range(1, n + 1):
60             s2j = s2[y - 1]
61             flag = 0 if s1i == s2j  else 1
62             solutionMatrix[x][y] = min(solutionMatrix[x][y-1] + 1, solutionMatrix[x-1][y] + 1, solutionMatrix[x-1][y-1] + flag)
63 
64     return solutionMatrix[m][n]
65 
66 def min(insert, delete, edit):
67     tmp = insert if insert < delete else delete
68     return tmp if tmp < edit else edit
69 
70 s1 = "abc"
71 s2 = "def"
72 distance = levenshtein(s1, s2)
73 print(distance) 

 

转载于:https://www.cnblogs.com/yulinfeng/p/7096882.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/371821.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

静态属性_Java面试题—内部类和静态内部类的区别

内部类和静态内部类的区别内部类&#xff1a;1、内部类中的变量和方法不能声明为静态的。2、内部类实例化&#xff1a;B是A的内部类&#xff0c;实例化B&#xff1a;A.B b new A().new B()。3、内部类可以引用外部类的静态或者非静态属性及方法。静态内部类&#xff1a;1、静态…

Eclipse安装以及JDK环境变量配置

首先是下载Eclipse&#xff1b;点击链接打开Eclipse官网eclipse官网点击DownLoad Packages&#xff0c;注意是点击“DownLoad Packages”点击你需要的版本开始下载&#xff08;一般是64bit Eclipse IDE&#xff09;等待几秒钟&#xff0c;开始下载这样Eclipse已经下载好了&…

完整的Web应用程序Tomcat JSF Primefaces JPA Hibernate –第1部分

我们创建了这篇文章&#xff0c;将展示如何使用以下工具创建完整的Web应用程序&#xff1a;Tomcat7&#xff0c;带有Primefaces的JSF2&#xff08;Facelets和Libraries&#xff09;&#xff08;具有AutoComplete&#xff09;&#xff0c;JPA / Hibernate&#xff08;具有NxN关系…

mysql主从架构升级_实战项目——mysql主从架构的实现

一主一从1.1 环境准备&#xff1a;centos系统服务器2台、 一台用户做Mysql主服务器&#xff0c; 一台用于做Mysql从服务器&#xff0c; 配置好yum源、 防火墙关闭、 各节点时钟服务同步、 各节点之间可以通过主机名互相通信1.2 准备步骤&#xff1a;1)iptables -F && s…

FastReport.Net使用:[30]对话框使用

使用对话框需要知道的地方 1.按钮的DialogResult属性。 假如DialogResult属性值为OK的按钮被点击&#xff0c;报表将会展现后面的对话框或者报表页&#xff1b;如果属性值为None&#xff0c;则停留在当前窗体&#xff1b;如果为其他值&#xff0c;则直接退出报表打印&#xff0…

改善Java EE生产支持技能的8种方法

参与Java EE生产支持的每个人都知道这项工作可能很困难。 7/24传呼机支持&#xff0c;定期处理的多个事件和错误修复&#xff0c;来自客户和管理团队的压力&#xff0c;要求它们尽快解决生产问题并防止再次发生。 在日常工作中&#xff0c;您还必须照顾由多个IT交付团队驱动的多…

varnish基础

varnish概念 初步认识 首先来跟我学习&#xff0c;v~a~r~n~i~s~h~~ &#xff0c;学会了没有~ 当然还有很重要的一个概念&#xff0c;它是高性能缓存服务器&#xff0c;举个例子。 好比我们要去买东西&#xff0c;所有的我们需要的东西是在超市厂家生产出来的&#xff0c;我们需…

基于Jenkins+Gitlab的自动化部署实战

故事背景 一个中小型企业&#xff0c;是典型的互联网公司&#xff0c;当初期的时候可能运维只能标配到2~3人&#xff0c;此时随着公司的发展&#xff0c;项目会逐渐增多。前期部署项目可能都是手动的&#xff0c; 俗称“人肉部署”&#xff0c;这简直是无比的痛苦&#xff0c;不…

cmd如何刷新MySQL数据库_怎样在cmd中用命令操作MySQL数据库 需要技巧

用命令来操作MySQL是工作必备的&#xff0c;今天我就来分享一下cmd命令操作MySQL数据库的方法&#xff0c;希望有帮助。工具/材料电脑xampp操作方法01首先&#xff0c;启动MySQL服务才行哦。这里我是用xampp集成的数据库&#xff0c;方便&#xff0c;点击‘start’。02如图&…

[BZOJ3529][Sdoi2014]数表

[BZOJ3529][Sdoi2014]数表 试题描述 有一张Nm的数表&#xff0c;其第i行第j列&#xff08;1 < i < n&#xff0c;1 < j < m&#xff09;的数值为能同时整除i和j的所有自然数之和。给定a&#xff0c;计算数表中不大于a的数之和。输入 输入包含多组数据。输入的第一行…

ZK的实际应用:MVVM –表单绑定

这是我们从头开始构建ZK应用程序的第二集。 上一篇文章涉及使用MVVM将数据加载和呈现到表中。 在本文中&#xff0c;我们将向您介绍ZK MVVM的表单绑定。 目的 我们将构建一个“添加”功能&#xff0c;使我们能够将新条目保存到清单中。 单击“添加”时出现表格 单击“保存”…

ZK的实际应用:MVVM –以编程方式更新视图

在前两篇文章中&#xff0c;我们使用ZK的MVVM功能来&#xff1a; 将数据加载到表中 使用表单绑定保存数据 我们已经看到&#xff0c;用注解NotifyChange&#xff08;&#xff09;装饰方法时&#xff0c;在执行完成后&#xff0c;将向Binder通知VM属性的更改&#xff0c;以便B…

mysql安装与配置的截图_windows下MySQL5.6版本安装及配置过程附有截图和详细说明...

随着MYSQL版本的更新以及电脑系统的变化&#xff0c;我们给大家整理了各种电脑环境下安装MYSQL的图解过程&#xff0c;希望我们整理的内容能够帮助到大家&#xff1a;mysql安装图解总结https://www.jb51.net/article/142398.htm编辑者&#xff1a;Vocabulary下面详细介绍5.6版本…

c# mysql 插入 和 查询_C#对数据库的操作(增删改查)

1、【在web.config文件中配置】2、【连接字符串】private static readonly string StrCon ConfigurationManager.ConnectionStrings["sqlConnection"].ToString();3、【查询数据方法】/// /// 查询数据/// /// 查询语句/// 参数/// public static DataTable QueryDa…

2017年07月03号课堂笔记

2017年07月03号 星期一 多云 空气质量&#xff1a;轻度污染~中度污染 内容&#xff1a;MySQL第四节课 in和not in&#xff1b;两个表的内连接&#xff1b;exists和not exsits的使用&#xff1b;all,any和some&#xff1b; 使用子查询的注意事项&#xff1b;sql优化&#xff08…

excel文件被写保护怎么解除_u盘被写保护怎么解除,看完你就知道了

在平常我们使用U盘存储资料过程中&#xff0c;有时会发现U盘出现无法正常读写的现象&#xff0c;具备表现为U盘被写保护&#xff0c;无法正常执行读写操作。对于小编给大家提供以下解决方法&#xff0c;希望对大家能有所帮助。对U盘执行重置操作01上网搜索并下载“USBOOT”程序…

OSGi案例研究:模块化vert.x

OSGi使Java代码可以清晰地划分为多个模块&#xff0c;这些模块称为捆绑软件 &#xff0c;可以访问由每个捆绑软件的类加载器控制的代码和资源。 OSGi 服务提供了一种附加的分离机制&#xff1a;接口的用户不需要依赖于实现类&#xff0c;工厂等。 以下案例研究旨在使OSGi捆绑包…

mysql一些常用操作_表的一些常用操作_MySQL

bitsCN.com-创建表(也就是创建表结构)&#xff1a;create table tbl_name(列结构&#xff0c;即有哪些属性)[表选项]; 如&#xff1a;班级的信息&#xff1a;(班级编号&#xff0c;开班日期)create table java_class(class_num varchar(10),date_start date);注&#xff1a;该表…

如何调整自定义标签样式

用chromeF12&#xff0c;查看网页代码在自定义标签上加class&#xff0c;写样式&#xff1a;例如&#xff1a;JSP文件&#xff1a;来自为知笔记(Wiz)转载于:https://www.cnblogs.com/anobugworld/p/7112116.html

无需部署即可测试JPQL / HQL

您是否曾经想在不完全部署应用程序的情况下测试JPQL / HQL&#xff1f; 我们今天在这里看到的是适用于任何JPA实现的简单解决方案&#xff1a;Hibernate&#xff0c;OpenJPA&#xff0c;EclipseLink等。 这篇文章中找到的基本源代码来自于本书&#xff1a;“ Pro JPA 2&#xf…