作者:翟天保Steven
版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处
请实现一个函数用来匹配包括'.'和'*'的正则表达式。
1.模式中的字符'.'表示任意一个字符
2.模式中的字符'*'表示它前面的字符可以出现任意次(包含0次)。
在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配
数据范围:
1.str 只包含从 a-z 的小写字母。
2.pattern 只包含从 a-z 的小写字母以及字符 . 和 *,无连续的 '*'。
3. 0≤str.length≤26
4. 0≤pattern.length≤26
输入:
"aaa","a*a"
返回值:
true
说明:
中间的*可以出现任意次的a,所以可以出现1次a,能匹配上
本题考察算法-动态规划算法的使用。具体思路如下:
1.建立动态规划表,s1行,s2列,表示进行到某个位置时的匹配状态,默认均为false。
2.初始化首位置为true。首列除了(0,0)位置全为false,首行有可能因为*字符而出现true的情况,所以要处理下。
3.先考虑不为*的情况,这类情况比较简单。当出现.符号或者字符相同时,当前位置匹配成功;若上一层判断是true,则表示整体匹配成功;若上一层为false,即使当前匹配成功,整体也是失败的。
4.再考虑有*符号的情况,这个要继续细分。A:*前的字符是.或者能与str对应位置字符一致。B:不一致。
5.A类情况,此时有两种可能使得匹配成功。
一是x*这两个字符等于空,字符x的数量当做0处理,只参考去除这两个字符后是否匹配成功,如下图所示。如果dp[i][j-2]是true,则true,是false则false。

二是将x字符重复匹配,其实上面的情况可以看做是0个b,若str中出现了连续的b,则连续匹配,匹配的依据就是dp[i-1][j]的状态,直到连续字符中断。如下图所示。

综合来看,A类场景的匹配依据就可以归纳为:dp[i-1][j]和dp[i][j-2]有一个是true,dp[i][j]就可以匹配成功。
6.A类场景搞懂了,B类自然不难理解。因为字符不一致了,所以只能把x*这两个字符当做空,再结合dp[i][j-2]的匹配状态来判断是否匹配成功。

7.以上就是完整思路,可以自己画个表,便于理解。
- class Solution {
- public:
- // 匹配
- bool match(string str, string pattern) {
- int s1 = str.length();
- int s2 = pattern.length();
- // 建立动态规划表
- // dp[i][j]表示str前i个字符是否与pattern前j个字符匹配
- vector<vector<bool>> dp(s1 + 1, vector
(s2 + 1, false)); - // 双空串可匹配
- dp[0][0] = true;
- // 处理当str为空时的情况
- for(int j = 2; j <= s2; ++j)
- {
- if(pattern[j - 1] == '*')
- {
- dp[0][j] = dp[0][j - 2];
- }
- }
- // 双层循环
- for(int i = 1; i <= s1; ++i)
- {
- for(int j = 1; j <= s2; ++j)
- {
- // 考虑不为*的情况
- // 当出现.符号或者字符相同时,当前位置匹配成功
- // 若上一层判断是true,则表示整体匹配成功;若上一层为false,即使当前匹配成功,整体也是失败的
- if(pattern[j - 1] != '*' && (pattern[j - 1] == '.' || pattern[j - 1] == str[i - 1]))
- {
- dp[i][j] = dp[i - 1][j - 1];
- }
- // 若出现*符号,则继续分情况考虑
- else if(j >= 2 && pattern[j - 1] == '*')
- {
- // 若*前的字符是.或者能与str字符串的第i-1个字符一致,则进入该分支
- if(pattern[j - 2] == '.' || pattern[j - 2] == str[i - 1])
- {
- // 如果dp[i][j-2]是true,并赋给dp[i][j],意味着x*这两个字符等于空,把字符x的数量当做0处理,此时匹配成功
- // 如果dp[i][j-2]是false,说明前面的匹配链是断开的
- // 但有一个机会能完成匹配,那就是*前面的字符和str中对应位置字符一致
- // 但还需要dp[i-1][j]是true才行,它是true的条件其实就等同于字符x连续重复了多次
- // 综上,dp[i-1][j]和dp[i][j-2]有一个是true,dp[i][j]就可以匹配成功
- dp[i][j] = dp[i - 1][j] || dp[i][j - 2];
- }
- else
- {
- // 如果进入该分支,那说明*前的字符和str字符串的第i-1个字符不一致
- // 不一致却能匹配成功的情况,就只能是x*这两个字符为空,也就是把字符x的数量当0处理
- // 而dp[i][j-2]又是true才可以
- dp[i][j] = dp[i][j - 2];
- }
- }
- }
- }
- return dp[s1][s2];
- }
- };