2707. 字符串中的额外字符
题目描述
给你一个下标从 0 开始的字符串
s
和一个单词字典dictionary
。你需要将s
分割成若干个 互不重叠 的子字符串,每个子字符串都在dictionary
中出现过。s
中可能会有一些 额外的字符 不在任何子字符串中。请你采取最优策略分割
s
,使剩下的字符 最少 。
动态规划
这是一个比较典型的动态规划问题,只要能够想到利用dp[i]
表示s.substr(0,i)
(也就时s从0开始,长度为i的子字符串)剩下的字符的最少数量,比较容易就能找到如下规律:
s.substr(0,i)
的后缀与dictionary
中一个长度为l的单词匹配,那么dp[i] = dp[i - l]
。- 如果
s.substr(0,i)
与dictionary
中所有单词都不匹配,那么个dp[i] = dp[i - 1] + 1
。
据此容易写出如下代码:
class Solution {
public:int minExtraChar(string s, vector<string>& dictionary) {int s_len = s.size();vector<int> dp(s_len + 1, 0);for(int i = 1;i <= s_len;++i) {dp[i] = dp[i - 1] + 1;for(auto it = dictionary.begin();it != dictionary.end();++it) {int w_len = (*it).size();if(w_len <= i && s.substr(i - w_len, w_len) == *it) {dp[i] = min(dp[i], dp[i - w_len]);}}}return dp[s_len];}
};
结果还算不错
利用字典树优化
上面思路中提到,要通过字符串的后缀与字典中单词是否匹配来判断动态规划的路径。
这容易让人想到字典树,也就是前缀树。关于字典树,我写过一篇字典树分析及实现。
虽然称为前缀树,经过一些变形也可以用来快速判断后缀是否匹配。
进而优化上面的实现,算是用空间换时间。
代码的改变还是比较大的,具体实现如下
struct Trie {struct Trie* children[26];bool isEnd;Trie() {isEnd = false;memset(children, 0, 26 * sizeof(struct Trie*));}
};
class Solution {
public:int minExtraChar(string s, vector<string>& dictionary) {struct Trie *root = new struct Trie();int s_len = s.size();vector<int> dp(s_len + 1, 0);// 插入字典中的单词 for(auto it = dictionary.begin();it != dictionary.end();++it) {int d_len = it->size();struct Trie *p = root;// 倒序插入单词,方便匹配后缀for(int i = d_len - 1;i >= 0;--i) {int idx = (*it)[i] - 'a';if(p->children[idx] == nullptr) {p->children[idx] = new struct Trie();}p = p->children[idx];}p->isEnd = true;}for(int i = 1;i <= s_len;++i) {dp[i] = dp[i - 1] + 1;struct Trie *p = root;for(int j = i - 1;j >= 0;--j) {int idx = s[j] - 'a';if(p == nullptr || p->children[idx] == nullptr) {// 如果中间有字符不匹配,后续就不可能有更长单词能匹配后缀了break;}p = p->children[idx];if(p->isEnd) {dp[i] = min(dp[i], dp[j]);}}}return dp[s_len];}
};
结果如下图,虽然时间上有一定提升,但空间占用却增加了一倍
ps:需要注意的是,这里用到了new去动态分配内存,理论上是要利用delete手动释放内存,防止内存泄露的。