剑指offer 52. 正则表达式匹配
正则表达式匹配
http://www.nowcoder.com/questionTerminal/45327ae22b7b413ea21df13ee7d6429c
52. 正则表达式匹配
题目描述
请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配
思路
看了@zxlly要offer的代码,才搞懂这道题的思路
这道题边界情况也有点多,首先判断s和pattern的长度,分出了四种情况,其中
1.如果s与pattern都为空,则True;
2.如果s不为空,而pattern为空,则False;
3.如果s为空,而pattern不为空,判断pattern是否是a...这种情况,*可以代表0次,这样一来可以将pattern往后移两位再进行match递归;
4.如果s、pattern不为空,又可以分为两种情况:
4.1.如果pattern的第二个字符不为*时,如果s[0]与pattern[0]能匹配上就将s和pattern都往后移1位再进行match,否则不匹配为False;
4.2.如果pattern的第二个字符为*时,如果s[0]与pattern[0]匹配不上,则将pattern后移2位再进行match;如果s[0]与pattern[0]能匹配上,会出现三种情况,分别是pattern[1] = '\'的*代表的三种情况0、1或多个,分别对应pattern后移2位s不变、pattern后移2位,s后移1位、pattern不变s后移1位,这三种情况都有可能出现所以用or或运算连接三种情况的递归。
讲的比较麻烦,不直观,直接看代码吧。
代码实现
# -*- coding:utf-8 -*-
class Solution:
# s, pattern都是字符串
def match(self, s, pattern):
# write code here
len_s = len(s)
len_pattern = len(pattern)
# 如果s与pattern都为空,则True
if len_s == 0 and len_pattern == 0:
return True
# 如果s不为空,而pattern为空,则False
elif len_s != 0 and len_pattern == 0:
return False
# 如果s为空,而pattern不为空,则需要判断
elif len_s == 0 and len_pattern != 0:
# pattern中的第二个字符为*,则pattern后移两位继续比较
if len_pattern > 1 and pattern[1] == '*':
return self.match(s, pattern[2:])
else:
return False
# 如果s不为空,pattern也不为空,则需要判断
else:
# pattern的第二个字符为*的情况
if len_pattern > 1 and pattern[1] == '*':
# s与pattern的第一个元素不同,则s不变,pattern后移两位,相当于pattern前两位当成空
if s[0] != pattern[0] and pattern[0] != '.':
return self.match(s, pattern[2:])
# 如果s[0]与pattern[0]相同,且pattern[1]为*
else:
# 会有三种情况
# pattern后移2个,s不变;相当于把pattern前两位当成空,匹配后面的,把*当做0次
F1 = self.match(s, pattern[2:])
# pattern后移2个,s后移1个;相当于pattern前两位与s[0]匹配,把*当做1次
F2 = self.match(s[1:], pattern[2:])
# pattern不变,s后移1个;相当于pattern前两位,与s中的多位进行匹配,把*当做多次
F3 = self.match(s[1:], pattern)
# 有一个为真就能返回真值
return F1 or F2 or F3
# pattern的第二个字符不为*的情况
else:
# s和pattern的第一个字符匹配上了,都往后移1位
if s[0] == pattern[0] or pattern[0] == '.':
return self.match(s[1:],pattern[1:])
else:
return False 