文章目录
- 72. 编辑距离:
- 样例 1:
- 样例 2:
- 提示:
- 分析:
- 题解:
- rust:
- 二维数组(易懂)
- 滚动数组(更加优化的内存空间)
- go:
- c++:
- python:
- java:
72. 编辑距离:
给你两个单词 word1
和 word2
, 请返回将 word1
转换成 word2
所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
- 插入一个字符
- 删除一个字符
- 替换一个字符
样例 1:
输入:word1 = "horse", word2 = "ros"输出:3解释:horse -> rorse (将 'h' 替换为 'r')rorse -> rose (删除 'r')rose -> ros (删除 'e')
样例 2:
输入:word1 = "intention", word2 = "execution"输出:5解释:intention -> inention (删除 't')inention -> enention (将 'i' 替换为 'e')enention -> exention (将 'n' 替换为 'x')exention -> exection (将 'n' 替换为 'c')exection -> execution (插入 'u')
提示:
0 <= word1.length, word2.length <= 500
word1
和word2
由小写英文字母组成
分析:
-
面对这道算法题目,二当家的再次陷入了沉思。
-
编辑距离算法在实际应用中还是很多的,比如一些命令的参数,当输入了错误的参数时,会提示最相似的命令。
- 想要找最优解,一般就是贪心或者动态规划。 -
思考后会发现,完整串的编辑距离和子串的编辑距离有关系,所以考虑使用动态规划。
-
别急,这里还有一个问题,题目中可以对两个单词分别进行三种操作,所以相当于一共有六种操作,其中插入字符依赖较短字符串,而删除字符的操作就反向依赖了较长串,但是动态规划是从一个初识条件开始,朝着一个方向计算的,这里依赖着两种方向,这怎么办?
-
其实,我们可以将相同效果的操作合并处理:
-
对单词 A 删除一个字符和对单词 B 插入一个字符是等价的。例如当单词 A 为 doge,单词 B 为 dog 时,我们既可以删除单词 A 的最后一个字符 e,得到相同的 dog,也可以在单词 B 末尾添加一个字符 e,得到相同的 doge;
-
同理,对单词 B 删除一个字符和对单词 A 插入一个字符也是等价的;
-
对单词 A 替换一个字符和对单词 B 替换一个字符是等价的。例如当单词 A 为 bat,单词 B 为 cat 时,我们修改单词 A 的第一个字母 b -> c,和修改单词 B 的第一个字母 c -> b 是等价的。
-
-
这样一来,本质不同的操作实际上只有三种:
-
在单词 A 中插入一个字符;
-
在单词 B 中插入一个字符;
-
修改单词 A 的一个字符。
-
-
这样一来,我们就可以把原问题转化为规模较小的子问题。以样例1为例,我们用 A = horse,B = ros 作为例子,来看一看是如何把这个问题转化为规模较小的若干子问题的:
-
在单词 A 中插入一个字符:如果我们知道 horse 到 ro 的编辑距离为 a,那么显然 horse 到 ros 的编辑距离不会超过 a + 1。这是因为我们可以在 a 次操作后将 horse 和 ro 变为相同的字符串,只需要额外的 1 次操作,在单词 A 的末尾添加字符 s,就能在 a + 1 次操作后将 horse 和 ro 变为相同的字符串;
-
在单词 B 中插入一个字符:如果我们知道 hors 到 ros 的编辑距离为 b,那么显然 horse 到 ros 的编辑距离不会超过 b + 1,原因同上;
-
修改单词 A 的一个字符:如果我们知道 hors 到 ro 的编辑距离为 c,那么显然 horse 到 ros 的编辑距离不会超过 c + 1,原因同上。
-
-
那么从 horse 变成 ros 的编辑距离应该为 min(a + 1, b + 1, c + 1)。
-
因此,我们就可以使用动态规划来解决这个问题了。我们用 D[i][j] 表示 A 的前 i 个字母和 B 的前 j 个字母之间的编辑距离。
-
如上所述,当我们获得 D[i][j-1],D[i-1][j] 和 D[i-1][j-1] 的值之后就可以计算出 D[i][j]。
-
D[i][j-1] 为 A 的前 i 个字符和 B 的前 j - 1 个字符编辑距离的子问题。即对于 B 的第 j 个字符,我们在 A 的末尾添加了一个相同的字符,那么 D[i][j] 最小可以为 D[i][j-1] + 1;
-
D[i-1][j] 为 A 的前 i - 1 个字符和 B 的前 j 个字符编辑距离的子问题。即对于 A 的第 i 个字符,我们在 B 的末尾添加了一个相同的字符,那么 D[i][j] 最小可以为 D[i-1][j] + 1;
-
D[i-1][j-1] 为 A 前 i - 1 个字符和 B 的前 j - 1 个字符编辑距离的子问题。即对于 B 的第 j 个字符,我们修改 A 的第 i 个字符使它们相同,那么 D[i][j] 最小可以为 D[i-1][j-1] + 1。特别地,如果 A 的第 i 个字符和 B 的第 j 个字符原本就相同,那么我们实际上不需要进行修改操作。在这种情况下,D[i][j] 最小可以为 D[i-1][j-1]。
-
-
一般题解到这里就结束了,但其实我们还可以继续优化空间。
-
由于动态规划中,我们比较两个子串,只依赖于各减少最后一个字符的子串的编辑距离,所以我们的动态规划数组是可以重复利用的,不需要二维数组,只需要一维数组即可,即滚动数组的方式。
题解:
rust:
二维数组(易懂)
impl Solution {pub fn min_distance(word1: String, word2: String) -> i32 {let l1 = word1.len();let l2 = word2.len();// 有一个字符串为空串if l1 == 0 || l2 == 0 {return (l1 + l2) as i32;}// DP 数组let mut dp = vec![vec![0; l2 + 1]; l1 + 1];// 边界状态初始化(0..=l1).for_each(|i| {dp[i][0] = i;});(0..=l2).for_each(|i| {dp[0][i] = i;});// 计算所有 DP 值(1..=l1).for_each(|i| {(1..=l2).for_each(|j| {let insert1 = dp[i - 1][j] + 1;let insert2 = dp[i][j - 1] + 1;let replace1 = if word1.as_bytes()[i - 1] != word2.as_bytes()[j - 1] {dp[i - 1][j - 1] + 1} else {// 两个字母相同,不用修改,所以操作次数不变dp[i - 1][j - 1]};dp[i][j] = insert1.min(insert2).min(replace1);});});return dp[l1][l2] as i32;}
}
滚动数组(更加优化的内存空间)
impl Solution {pub fn min_distance(mut word1: String, mut word2: String) -> i32 {let mut l1 = word1.len();let mut l2 = word2.len();// 有一个字符串为空串if l1 == 0 {return l2 as i32;}if l2 == 0 {return l1 as i32;}// 让内层单词较短,可以让dp数组较小if l1 < l2 {let wt = word1;word1 = word2;word2 = wt;let lt = l1;l1 = l2;l2 = lt;}// DP 滚动数组let mut dp = (0..=l2).collect::<Vec<_>>();// 计算所有 DP 值word1.bytes().enumerate().for_each(|(i1, c1)| {let mut pre = i1;dp[0] = pre + 1;word2.bytes().enumerate().for_each(|(i2, c2)| {let tmp = dp[i2 + 1];if c1 == c2 {dp[i2 + 1] = pre;} else {// dp[i2 + 1]:相当于向第一个单词插入一个字母// dp[i2]:相当于向第二个单词插入一个字母// pre: 相当于修改第一个单词一个字母dp[i2 + 1] = dp[i2 + 1].min(dp[i2]).min(pre) + 1;}pre = tmp;});});dp[l2] as i32}
}
go:
func minDistance(word1 string, word2 string) int {l1 := len(word1)l2 := len(word2)// 有一个字符串为空串if l1 == 0 {return l2}if l2 == 0 {return l1}// 让内层单词较短,可以让dp数组较小if l1 < l2 {word1, word2 = word2, word1l1, l2 = l2, l1}// DP 滚动数组dp := make([]int, l2+1)for i := 1; i <= l2; i++ {dp[i] = i}// 计算所有 DP 值for i1, c1 := range word1 {pre := i1dp[0] = pre + 1for i2, c2 := range word2 {tmp := dp[i2+1]if c1 == c2 {dp[i2+1] = pre} else {// dp[i2 + 1]:相当于向第一个单词插入一个字母// dp[i2]:相当于向第二个单词插入一个字母// pre: 相当于修改第一个单词一个字母if dp[i2+1] > dp[i2] {dp[i2+1] = dp[i2]}if dp[i2+1] > pre {dp[i2+1] = pre}dp[i2+1] += 1}pre = tmp}}return dp[l2]
}
c++:
class Solution {
public:int minDistance(string word1, string word2) {int l1 = word1.length(), l2 = word2.length();// 有一个字符串为空串if (l1 == 0) {return l2;}if (l2 == 0) {return l1;}// 让内层单词较短,可以让dp数组较小if (l1 < l2) {string wt = word1;word1 = word2;word2 = wt;int lt = l1;l1 = l2;l2 = lt;}// DP 滚动数组int dp[l2 + 1];for (int i = 1; i <= l2; ++i) {dp[i] = i;}// 计算所有 DP 值for (int i1 = 0; i1 < l1; ++i1) {int pre = i1;dp[0] = pre + 1;for (int i2 = 0; i2 < l2; ++i2) {const int tmp = dp[i2 + 1];if (word1[i1] == word2[i2]) {dp[i2 + 1] = pre;} else {// dp[i2 + 1]:相当于向第一个单词插入一个字母// dp[i2]:相当于向第二个单词插入一个字母// pre: 相当于修改第一个单词一个字母dp[i2 + 1] = min(min(dp[i2 + 1], dp[i2]), pre) + 1;}pre = tmp;}}return dp[l2];}
};
python:
class Solution:def minDistance(self, word1: str, word2: str) -> int:l1 = len(word1)l2 = len(word2)# 有一个字符串为空串if l1 == 0:return l2if l2 == 0:return l1# 让内层单词较短,可以让dp数组较小if l1 < l2:word1, word2 = word2, word1l1, l2 = l2, l1# DP 数组dp = [x for x in range(l2 + 1)]# 计算所有 DP 值for i1 in range(l1):pre = i1dp[0] = pre + 1for i2 in range(l2):tmp = dp[i2 + 1]if word1[i1] == word2[i2]:dp[i2 + 1] = preelse:# dp[i2 + 1]:相当于向第一个单词插入一个字母# dp[i2]:相当于向第二个单词插入一个字母# pre: 相当于修改第一个单词一个字母dp[i2 + 1] = min(dp[i2 + 1], dp[i2], pre) + 1pre = tmpreturn dp[l2]
java:
class Solution {public int minDistance(String word1, String word2) {int l1 = word1.length(), l2 = word2.length();// 有一个字符串为空串if (l1 == 0) {return l2;}if (l2 == 0) {return l1;}// 让内层单词较短,可以让dp数组较小if (l1 < l2) {String wt = word1;word1 = word2;word2 = wt;int lt = l1;l1 = l2;l2 = lt;}// DP 滚动数组int[] dp = new int[l2 + 1];for (int i = 1; i <= l2; ++i) {dp[i] = i;}// 计算所有 DP 值for (int i1 = 0; i1 < l1; ++i1) {int pre = i1;dp[0] = pre + 1;for (int i2 = 0; i2 < l2; ++i2) {final int tmp = dp[i2 + 1];if (word1.charAt(i1) == word2.charAt(i2)) {dp[i2 + 1] = pre;} else {// dp[i2 + 1]:相当于向第一个单词插入一个字母// dp[i2]:相当于向第二个单词插入一个字母// pre: 相当于修改第一个单词一个字母dp[i2 + 1] = Math.min(Math.min(dp[i2 + 1], dp[i2]), pre) + 1;}pre = tmp;}}return dp[l2];}
}
非常感谢你阅读本文~
欢迎【点赞】【收藏】【评论】三连走一波~
放弃不难,但坚持一定很酷~
希望我们大家都能每天进步一点点~
本文由 二当家的白帽子:https://le-yi.blog.csdn.net/ 博客原创~