串联所有单词的子串
- 1. 题目解析
- 2. 讲解算法原理
- 3. 编写代码
1. 题目解析
题目地址:串联所有单词的子串
2. 讲解算法原理
算法的基本思想是使用滑动窗口来遍历字符串s,并利用两个哈希表(hash1和hash2)来统计窗口中子串的频次。
具体的算法步骤如下:
-
创建一个无序哈希表hash2,用于记录给定单词列表中各单词的频次。初始时,哈希表中所有单词的频次都为0。
-
遍历给定单词列表words,将列表中的单词映射到hash2中,并增加相应单词的频次。
-
创建一个空的结果集ret,用于存储找到的子串的起始位置。
-
获取单词列表中的单词长度len,字符串s的长度n,以及单词列表的长度m。
-
进入一个外层循环,循环变量i表示窗口的起始位置,范围从0到len-1。这是为了遍历所有可能的起始位置。
-
在外层循环中,初始化一个空的哈希表hash1,用于统计窗口中子串的频次。
-
进入一个内层循环,循环变量left表示窗口的左指针,初始时与外层循环变量i相等,循环变量right表示窗口的右指针,初始时也与外层循环变量i相等。循环条件为right+len小于等于字符串s的长度。
-
在内层循环中,首先将窗口右侧的子串加入窗口,即将hash1中对应子串的频次加1。
-
检查加入窗口的子串是否是有效子串,即其频次小于等于hash2中对应子串的频次。如果是有效子串,则将计数器count加1。
-
检查窗口大小是否超过了单词列表的总长度,即right-left+1是否大于len*m。如果超过了窗口大小,则需要移动窗口。
-
移动窗口的过程包括以下几个步骤:
-
检查窗口左侧的子串是否是有效子串,即其频次小于等于hash2中对应子串的频次。如果是有效子串,则将计数器count减1。
-
将窗口左侧的子串从窗口中移除,即将hash1中对应子串的频次减1。
-
将左指针left向右移动len位。
-
检查计数器count是否等于单词列表的长度m。如果相等,则表示当前窗口包含了给定单词列表中的所有单词,将左指针left的位置加入结果集ret。
-
-
将右指针right向右移动len位,继续内层循环。
-
-
外层循环结束后,返回结果集ret,其中包含了所有包含给定单词列表中所有单词的子串的起始位置。
3. 编写代码
class Solution {
public:vector<int> findSubstring(string s, vector<string>& words) {unordered_map<string,int> hash2;for(auto &e :words)hash2[e]++;vector<int> ret;int len=words[0].size(),n=s.size(),m=words.size();for(int i=0;i<len;i++){//维护窗口中有效字符串个数unordered_map<string,int> hash1;for (int left=i,right=i,count=0;right+len<=n;right+=len){//进string in=s.substr(right,len);hash1[in]++;if(hash2.count(in) && hash1[in]<=hash2[in]) count++;//出if(right-left+1>len*m){string out=s.substr(left,len);if(hash2.count(out) && hash1[out]<=hash2[out]) count--;hash1[out]--;left+=len;}if(count==m) ret.push_back(left);}}return ret;}
};