JAVA正则表达式匹配符


JAVA正则表达式匹配符

Java中正则表达式与之前使用的Python是有区别的,区别在于Java对于反斜线()处理的不同。
在Python中"\d"表示 匹配一位数字(0-9),而Java中匹配一位数字(0-9),需要的正则表达式为"\d"。
不过换行符和制表符只需要单反斜线“\n\t”。

字符

字符 描述
B 指定字符B
\xhh 十六进制值为oxhh的字符
\uhhhh 十六进制值为oxhhhh的Unicode字符
\t tab
\n 换行
\r 回车
\e 转义

字符类

字符类 描述
. (小数点) 任意字符
[abc] [ ] 中括号,包含a,b,c中任意字符
[^abc] [ ]中括号加^, 表示否定,除a,b,c之外的
[a-z] 从a到z的任意字符
[a-z&&[hi]] &&表示交集,即包含h或i
\s 空白字符,包含空格,换行,回车,tab,换页
\S 大写为小写的取反,非空白字符,等价于[^\s]
\d 数字0-9
\D 非数字,等价于[^0-9]
\w 词字符,数字,大小写字母,等价于[0-9a-zA-Z]
\W 非词,等价于[^\w]

逻辑操作符

逻辑操作符 描述
XY Y跟在X后面,并且XY同时满足
X|Y X或者Y
(X) () 小括号表示捕获组(group),可以对group进行处理,尤其是获取其中的内容

边界匹配符

边界匹配符 描述
^ 一行的开始
$ 一行的结束
\b 词的边界

量词

量词描述了一个模式匹配文本的方式,包含

  • 贪婪型:量词默认是贪婪的,发现尽可能多的匹配
  • 勉强型:通过问号(?)指定,匹配最小的字符数,也称为懒惰型,最少匹配,非贪婪。
  • 占有型:通过加号(+)指定,当用于字符串时防止匹配失败时回溯。
贪婪型 勉强型 占有型 描述
X? X?? X?+ 匹配0个或1个X
X* X*? X*+ 匹配0个或多个X
X+ X+? X++ 匹配1个或多个X
X{n} X{n}? X{n}+ 恰好匹配n个X
X{n,} X{n,}? X{n,}+ 至少匹配n个X
X{n,m} X{n,m}? X{n,m}+ 至少匹配n个X,最多匹配m个X