原题链接在这里:https://leetcode.com/problems/regular-expression-matching/
题目:
Implement regular expression matching with support for '.'
and '*'
.
'.' Matches any single character. '*' Matches zero or more of the preceding element.The matching should cover the entire input string (not partial).The function prototype should be: bool isMatch(const char *s, const char *p)Some examples: isMatch("aa","a") → false isMatch("aa","aa") → true isMatch("aaa","aa") → false isMatch("aa", "a*") → true isMatch("aa", ".*") → true isMatch("ab", ".*") → true isMatch("aab", "c*a*b") → true
题解:
recursion, 这里注意 '*'是表示0或者多个 p're'ceding 那么 '*' 不可能出现在首位。
终止条件两个,一个是pattern长度为0,那么string的长度同时为0返回true. 另一个是pattern长度为1,那么string 首字符相同 || pattern字符是'.'
接下来就是分析pattern长度为2及以上,首先看pattern第二个字符是否为'*', 不是的话 string 和 pattern 同时一个一个减少。
若是'*', 它可能代表0个前置字符, 或者多个. 0个时直接去掉就好, 多个时移动s的指针.
Time Complexity: Exponential. Space: O(n). n 是string 长度.
AC Java:
1 public class Solution { 2 public boolean isMatch(String s, String p) { 3 //pattern 长度为0 4 if(p.length() == 0){ 5 return s.length() == 0; 6 } 7 //pattern长度为1 8 if(p.length() == 1){ 9 return s.length() == 1 && (s.charAt(0) == p.charAt(0) || p.charAt(0) == '.'); 10 } 11 12 //经过上面两个if, 此时pattern的长度已经大于等于2 13 if(p.charAt(1) != '*'){ //p第二个字符不是 '*' 14 return s.length()>0 15 && (s.charAt(0) == p.charAt(0) || p.charAt(0) == '.') //第一个字符是否相等 或者pattern第一个字符是'.' 16 && isMatch(s.substring(1),p.substring(1)); //剩下的字符串是否match 17 }else{ //p第二个字符是 '*' 18 //一次去掉pattern两个字符,看剩下的pattern 能否和 s match 19 //可以理解为 * 代表0个字符 20 //若有一层match 上了 就return true 21 if(isMatch(s, p.substring(2))){ 22 return true; 23 } 24 return s.length()>0 //字符串长度需要大于0 25 && (s.charAt(0) == p.charAt(0) || p.charAt(0) == '.') //当前字符串相等 或者pattern第一个字符是'.' 26 && isMatch(s.substring(1), p); //去掉s的首字符 27 } 28 } 29 }
Ref: http://harrifeng.github.io/algo/leetcode/regular-expression-matching.html
方法二是用DP, 其实是一个思路.
需要存储的历史信息dp[i][j] 代表s[0, i-1] 和 p[0, j-1]是否能match上,最后返回dp[s.length()][p.length()]. 所以dp生成时要设size成new boolean[s.length()+1][p.length()+1].
状态转移时 如果当前的char能match上, dp[i][j] = dp[i-1][j-1]. 否则的话如果p的当前char是'*', 要看p的前个char能否和s的当前char match上. 不能的话,这个'*'只能代表0个字符. dp[i][j] = dp[i][j-2].
如果能match上的话, 既可以代表0个字符也可以代表多个字符. dp[i][j] = dp[i][j-2] || dp[i-1][j].
Time Complexity: O(m*n). Space: O(m*n).
AC Java:
1 public class Solution { 2 public boolean isMatch(String s, String p) { 3 int m = s.length(); 4 int n = p.length(); 5 boolean [][] dp = new boolean[m+1][n+1]; 6 dp[0][0] = true; 7 8 for(int j = 1; j<=n; j++){ 9 if(p.charAt(j-1) == '*'){ 10 dp[0][j] = dp[0][j-2]; 11 } 12 } 13 14 for(int i = 1; i<=m; i++){ 15 for(int j = 1; j<=n; j++){ 16 char sChar = s.charAt(i-1); 17 char pChar = p.charAt(j-1); 18 //若是首字符match 19 if(sChar == pChar || pChar == '.'){ 20 dp[i][j] = dp[i-1][j-1]; 21 }else if(pChar == '*'){ //pattern 末尾是 * 22 //pattern * 前一个char 和 pChar match, 可以是贪婪性减掉string的最后一char 23 if(sChar == p.charAt(j-2) || p.charAt(j-2) == '.'){ 24 dp[i][j] = dp[i][j-2] | dp[i-1][j]; 25 }else{ 26 //pattern * 前一个 char 和pChar match不上,*代表0个preceding element 27 dp[i][j] = dp[i][j-2]; 28 } 29 } 30 } 31 } 32 return dp[m][n]; 33 } 34 }
跟上Wildcard Matching.