正则表达式
regular expression :
- 正则表达式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为,正则表达式通过一些特殊符号的辅助,可以让用户轻易达到查找、删除、替换某特定字符串的处理程序。
常见的字符匹配
| . | Any character except newline (\n) |
| (a|b) | a or b |
| (...) | Group |
| [abc] | a, b or c |
| [^abc] | Not a, b or c |
| [a-z] | Letters from a to z |
| [A-Z] | Uppercase letters from A to Z |
| [0-9] | Digits from 0 to 9 |
注意 “^”符号:
"^"符号在字符集合符号(中括号[])的内外是不同的
- 在[]内代表 [^abc] 代表反向选择
- 在[]外代表定位在行首的意义
一些数量匹配的方法
| * | 0 or more |
| + | 1 or more |
| ? | 0 or 1 |
| {3} | Exactly 3 |
| {3,} | 3 or more |
| {3,5} | 3, 4 or 5 |
一些位置匹配
| ^ | Start of string or start of line in multi-line mode |
| \A | Start of string |
| $ | End of string or end of line in multi-line mode |
| \Z | End of string |