2022-02-08 13:19

关注

正则表达式详解！Java中正则表达式语法分析和使用

正则表达式语法

\

将下一个字符标记为:
- 一个特殊字符
- 一个原义字符(12个) : ^, $, (, ), *, +, ?, ., [, , {, |
- 一个向后引用
- 一个八进制转义符
示例:
- \n - 换行符
- \ \ - \
- \ ( - (

^

匹配输入字符串的开始位置
如果设置RegExp对象的Multiline属性 , ^ 也匹配 \n 或 \r 之后的位置

$

匹配输入字符串的结束位置
如果设置RegExp对象的Multiline属性 , $ 也匹配 \n 或 \r 之前的位置

*

匹配前面的子表达式零次或多次
等价于 {0,}
示例:
- zo* - z 或 zo 或 zoo

+

匹配前面的子表达式一次或多次
等价于 {1,}
示例:
- zo+ - zo 或 zoo

?

匹配前面的子表达式零次或一次
等价于 {0,1}
示例:
- do(es)? - do 或 does

{n}

匹配确定的n次 . n是一个非负整数
示例:
- o{2} - 不能匹配Bob, 能匹配food

{n,}

至少匹配n次 . n是一个非负整数
o{0,} 等价于 o*
o{1,} 等价于 o+
示例:
- o{2,} - 不能匹配Bob, 能匹配looooog

{n, m}

最少匹配n次,最多匹配m次 . n和m均为非负整数,其中 n<=m
o{0,1} 等价于 o?
示例:
- o{1,3} - 匹配loooooog的前三个o

?

非贪心量化: 当该字符紧跟在其余任何一个修饰符 *, +, ?, {n}, {n,}, {n,m} 后面时,匹配模式是非贪心的
- 非贪心模式是尽可能少的匹配所搜索的字符串
- 正则表达式默认是贪心模式,是尽可能多的匹配所搜索的字符串
示例:
- o+? - 匹配loooooog中的单个o
- o+ - 匹配loooooog所有的o

.

匹配除了 \r, \n 以外的任何单个字符
如果需要匹配 \r, \n 在内的字符,需要使用 (.|\r|\n)

(pattern)

匹配pattern并获取匹配的子字符串,子字符串用于向后引用
获取的匹配可以从产生Matches的集合中得到

(?:pattern)

匹配pattern但是不获取匹配的子字符串
这是一个非获取匹配,不存储匹配的子字符串用于向后引用
在替换使用或字符 | 来组合一个模式的各个部分时非常有用
示例:
- industr(?:y|ies) 等价于 industry | industries

(?=pattern)

正向肯定预查: 在任何匹配pattern的字符串开始处匹配查找字符串
这是一个非获取匹配,即这个匹配不需要获取供以后使用
预查不会消耗字符.也就是说,在一个匹配开始时,在最后一个匹配发生之后立即开始下一次匹配搜索,而不是从包含预查字符后面的字符开始匹配搜索
示例:
- Windows(?=95|98|NT|2000) - 可以匹配 Windows2000 中的 Windows , 但是不能匹配 Windows10 中的 Windows

(?!pattern)

正向否定预查: 在任何不匹配pattern的字符串开始处匹配查找字符串
这是一个非获取匹配,即这个匹配不需要获取供以后使用
预查不会消耗字符.也就是说,在一个匹配开始时,在最后一个匹配发生之后立即开始下一次匹配搜索,而不是从包含预查字符后面的字符开始匹配搜索
示例:
- Window(?!95|98|NT|2000) - 可以匹配 Windows10 中的 Windows , 但是不能匹配 Windows2000 中的 Windows

(?<=pattern)

反向肯定预查: 在任何匹配pattern的字符串处反向匹配查找字符串
示例:
- (?<=95|98|NT|2000)Windows - 可以匹配 2000Windows 中的 Windows , 但是不能匹配 10Windows 中的 Windows

(?<!pattern)

反向否定预查: 在任何不匹配pattern的字符串处反向匹配查找字符串
示例:
- (?<!95|98|NT|2000)Windows - 可以匹配 10Windows中的 Windows , 但是不能匹配 2000Windows 中的 Windows

x|y

或匹配
如果没有包含在括号中,范围就是整个正则表达式. 否则只是对括号中的字符串进行匹配
示例:
- z|food - z 或 food
- (z|f)oo - zoo 或 foo

[xyz]

字符集合. 匹配所包含的任意一个字符
仅有特殊字符反斜线 \ 可以保持特殊含义的转义字符. 其余符号比如 *, +, (, ) 等均是普通字符
- 脱字符 ^ 如果出现在首位表示负值字符集合. 如果出现在字符中间就是普通字符
- 连字符 - 如果出现在字符串中间表示字符范围. 如果出现在首位或者末尾就是普通字符
- 右括号如果出现在首位也是普通字符
示例:
- [abc] - 可以匹配 plain 中的 a

[^xyz]

排除型字符集合. 匹配未列出的任意字符
示例:
- [^abc] - 可以匹配 plain 中的 plin

[a-z]

字符范围. 匹配指定范围内的任意字符
示例:
- [a-z] - 可以匹配 a 到 z 范围内的任意小写字母字符

[^a-z]

排除型字符范围. 匹配任何不在指定范围内的任意字符
示例:
- [^a-z] - 匹配不在 a 到 z 范围内的任意字符

[:name:]

增加命名字符类中的字符到表达式. 只能用于方括号表达式

[=elt=]

增减当前locale下排序等价于elt的字符. 只能用于方括号表达式

[.elt.]

增加排序元素elt到表达式中. 只能用于方括号表达式
这个语法用于某些排序元素由多个字符组成. 比如29个字母表的西班牙语 ,CH作为单个字母排在字母C之后,因此会产生排序cinco, credo, chispa

\b

匹配单词边界.即单词和空格间的位置
示例:
- er\b - 可以匹配 never 中的 er , 不能匹配 verb 中的 er

\B

匹配非单词边界
示例:
- er\B - 可以匹配 verb 中的 er , 不能匹配 never 中的 er

\cx

匹配由x指明的控制字符
x 的值必须为 A-Z 或者 a-z 的字符之一,否则就将 c 看作是一个原义的 c 字符
控制字符的值等于 x 的值的最小 5 bit(对十进制32的余数)
示例:
- \cM - 匹配Control-M 或者回车符
- \ca - \u001
- \cb - \u002

\d

匹配一个数字字符
等价于 [0-9]

\D

匹配一个非数字字符
等价于 [^0-9]

\f

匹配一个换页符
等价于 \x0c 和 \cL

\n

匹配一个换行符
等价于 \x0a 和 \cJ

\r

匹配一个回车符
等价于 \x0d 和 \cM

\s

匹配任何空白字符
包括空格,制表符,换页符等
等价于 [ \f\n\r\t\v]

\S

匹配任何非空白字符
等价于 [^ \f\n\r\t\v]

\t

匹配一个制表符
等价于 \x0b 和 \cI

\v

匹配一个垂直制表符
等价于 \x0b 和 \cK

\w

匹配包括下划线的任何单词字符
等价于 [A-Za-z0-9_]

\W

匹配任何非单词字符
等价于 [^A-Za-z0-9_]

\xnn

十六进制转义字符序列. 匹配两个十六进制数字nn表示的字符
正则表达式中可以使用ASCII编码
\x041 等价于 \x04&1
示例:
- \x41 - A

\num

向后引用一个子字符串,该子字符串与正则表达式的第num个用括号围起来的子表达式匹配
num是从1开始的十进制正整数,上限可以是9, 31, 99甚至无限
示例:
- (.)\1 - 匹配两个连续的相同字符

\n

标识一个八进制转义值或一个向后引用:
- 如果 \n 之前至少n个获得子表达式,则n为向后引用
- 否则 ,n为八进制数字0-7. 此时n为八进制转义值

\nm

标识一个八进制转义值或一个向后引用
- 如果 \nm 之前至少nm个获得子表达式,则nm为向后引用
- 如果 \nm 之前至少有n个获得子表达式,则n为一个后跟文字m的向后引用
- 否则如果前面的条件都不满足,并且n和m均为八进制数字0-7, 那么 \nm 将匹配八进制转义值nm

\nml

如果n为八进制数字0-3, 并且m和l均为八进制数字0-7, 那么 \nml 将匹配八进制转义值nml

\un

Unicode转义字符序列
n是一个使用4个十六进制数字表示的Unicode字符
示例:
- \u00A9 - 匹配著作权符号 (©)

\p{P}

用于Unicode正则表达式前缀
- 小写p是property, 表示Unicode属性
- 大括号中的P表示Unicode字符集中七个字符属性之一的标点字符.还有其余六个属性:
  - L : 字母
  - M : 标记符号. 通常不会单独出现
  - Z : 分隔符. 比如空格,换行等
  - S : 符号. 比如数学符号,货币符号等
  - N : 数字. 比如阿拉伯数字,罗马数字等
  - C : 其余字符
注意: 在JavaScript中不支持该语法

\ < \ >

匹配词word的开始 \ < 和结束 \ >
示例:
- \ <the\ > - 可以匹配字符串 for the wise 中的 the , 不能匹配 otherwise 中的 the

()

将 ( 和 ) 之间的表达式定义为组group, 并且将匹配这个表达式的字符保存到一个临时区域. 一个正则表达式最多可以保存9个这样的临时区域,分别使用 \1 到 \9 的符号来引用

|

将两个匹配条件进行逻辑或or运算
示例:
- (him|her) - 可以匹配 it belongs to hin 或 it belongs to her, 不能匹配 it belongs to them

正则表达式使用场景

字符串替换

转换日期格式示例

Matcher

Matcher类中提供四个将匹配字符串替换成指定字符串的方法:
- replaceAll()
- replaceFirst()
- appendReplacement()
- appendTail()
重点掌握一下appendReplacement() 方法和appendTail() 方法

appendReplacement()

appendReplacement(StringBuffer sb, String replacement):
- 将当前匹配子串替换为指定字符串
- 并且将替换后的子串以及到上次匹配之后的字符串添加到一个StringBuffer对象

appendTail()

appendTail(StringBuffer sb):
- 将最后一次匹配后剩余的字符添加到一个StringBuffer对象

示例

字符串fatcatfatcatfat, 正则表达式模式cat:

第一次匹配后调用appendReplacement(sb, "dog"), 这时StringBuffer内容为fatdog. 即fatcat中的cat被替换为dog并且与匹配子串前的内容加到sb里
第二次匹配后调用appendReplacement(sb, "dog"), 这时sb的内容就成为fatdogfatdog
最后一次调用appendTail(sb), 那么sb的内容成为fatdogfatdogfat

字符校验

正则表达式校验示例

全部评论

推荐最新楼层

05-14 10:08

已编辑

哈尔滨工业大学

计算机组成原理：面试官喜欢问什么

本统计结果来源于 八股精网站，展示了计算机组成原理相关面试题中出现频率较高的关键词。通过对这些关键词的分析，我们可以提炼出面试考察的重点方向，并据此制定高效的学习和复习策略。🔍 一、高频关键词解析（Top 5）📌 1. CPU占比：9.57%（排名第一）重要性：CPU 是计算机的核心部件，掌握其结构、工作原理及性能优化是理解整个计算机系统的关键。建议重点掌握内容： CPU 的基本组成（ALU、控制器、寄存器）指令执行过程（取指、译码、执行、访存、写回）流水线技术、超标量、乱序执行等现代 CPU 特性多核与超线程技术📌 2. 计算机占比：4.56%说明：这是一个宏观概念类词汇，通常用于引出...

30万真题，揭秘面试官最... 面试经验谈面试常问题系列

点赞评论收藏

分享

05-12 13:14

已编辑

中山大学算法工程师

这种简历还能找到实习吗...

有气魄的海豚在喝茶：第一次在牛客看到三九博

你的简历改到第几版了简历中的项目经历要怎么写

点赞评论收藏

分享

03-31 15:04

黑龙江科技大学 Java

牛客10001：问就是六个月，全国可飞，给钱就干

点赞评论收藏

分享

03-20 22:00

重庆大学 Java

世界上最不值钱的就是码农

面试要排队就算了，现在校内接单也要排队

适彼乐土：“他们不行再找你” 最后的底牌吗？有点意思

点赞评论收藏

分享

05-13 19:41

已编辑

沈阳工业大学 C++

记录一波自己的面试经历，也给准备找工作和实习的兄弟一些面试问题经验，希望我和大家都能能快快找到工作，呜呜┭┮﹏┭┮注：题主答得很烂，各位看看题目就行，答主的答案仅供参考。C++的private在继承的时候，子类可以获取吗，在实际项目中有什么用：private子类不能继承，protect可以继承。实际项目不知道C++都＋在什么地方，你认为C++的特色是什么：C++对比C语言主要在于多态，多态，和STL（自我发挥，瞎编的）如果自己实现以下字符串拷贝的函数，需要考虑到什么：编码，长度问题（就想到这俩）虚函数是什么，虚函数表在程序中有几份：虚函数是实现接口的，只定义不实现，可以让派生类去自定义。只有一...

查看14道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛油的搬砖plog #

26234次浏览 113人参与

# 大学最后一个寒假，我想…… #

28960次浏览 273人参与

# 一人一个landing小技巧 #

23560次浏览 458人参与

# 运营每日一题 #

67598次浏览 648人参与

# 查收我的offer竞争力报告 #

176528次浏览 1065人参与

# 面试被问第一学历差时该怎么回答 #

122576次浏览 765人参与

# 电网笔面经互助 #

31634次浏览 317人参与

# 为什么那么多公司毁约 #

163461次浏览 1223人参与

# 我在牛爱网找对象 #

178388次浏览 1339人参与

# 520告白墙 #

18495次浏览 325人参与

# 找工作的破防时刻 #

25532次浏览 383人参与

# 实习学不到东西怎么办？ #

203765次浏览 2113人参与

# 2023届毁约公司名单 #

190367次浏览 938人参与

# 通信硬件知识分享 #

25541次浏览 460人参与

# 实习/项目/竞赛奖项，哪个对找工作更重要？ #

80319次浏览 1102人参与

# 腾讯音乐求职进展汇总 #

86266次浏览 484人参与

# 25届秋招公司红黑榜 #

259469次浏览 1089人参与

# 如果公司降薪，你会跳槽吗？ #

65658次浏览 515人参与

# 我想象的实习vs现实的实习 #

277604次浏览 2207人参与

# 我发现一个规律 #

3212次浏览 31人参与

牛客网
牛客企业服务