正则表达式量词
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
java正则表达式中的数量词
java中的正则位于java.util.regex包中,这个包中只有一个MatchResult接口和Matcher、Pattern两个类。正则中的数量词有Greedy (贪婪)、Reluctant(懒惰)和Possessive(强占)三种。
Greedy数量词:
X ?---X,一次或一次也没有。
X*---X,零次或多次。
X+---X,一次或多次。
X{n}---X,恰好n次。
X{n,}---X,至少n次。
X{n,m}---X,至少n次,但是不超过m次。
Greedy是最常用的,它的匹配方式是先把整个字符串吞下,然后匹配整个字符串,如果不匹配,就从右端吐出一个字符,再进行匹配,直到找到匹配或把整个字符串吐完为止。
Matcher m=pile("a.*b").matcher("a====b=========b=====");
while(m.find()){
System.out.println(m.group());
}
输出:
a====b=========b
因为总是从最大匹配开始匹配,故称贪婪。
Reluctant数量词:
X??--- X,一次或一次也没有。
X*?--- X,零次或多次。
X+?--- X,一次或多次。
X{n}?--- X,恰好n次。
X{n,}?--- X,至少n次。
X{n,m}?--- X,至少n次,但是不超过m次。
Reluctant正好和Greedy相反,它先从最小匹配开始,先从左端吞入一个字符,然后进行匹配,若不匹配就再吞入一个字符,直到找到匹配或将整个字符串吞入为止。
Matcher m=pile("a.*?b").matcher("a====b=========b====="); while(m.find()){
System.out.println(m.group());
}
输出:
a====b
因为总是从最小匹配开始,故称懒惰。
Possessive数量词:
X?+--- X,一次或一次也没有。
X*+--- X,零次或多次。
X++ ---X,一次或多次。
X{n}+--- X,恰好n次。
X{n,}+ ---X,至少n次。
X{n,m}+--- X,至少n次,但是不超过m次。
Possessive和Greedy的匹配方式一样,先把整个字符串吞下,然后匹配整个字符串,如果匹配,就认为匹配,如果不匹配,就认为整个字符串不匹配,它不会从右端吐出一个字符串再进行匹配,只进行一次。
Matcher m=pile("a.*+b").matcher("a====b=========b====="); while(m.find()){
System.out.println(m.group());
}
输出:
a====b=========b
因为贪婪但并不聪明,故称强占。