Python简明教案 第8章 Python中使用正则表达式
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
go{2,}gle:匹配的范围从google到goo…gle
{n,m}
匹配前面的字符最少n次, 最多m次
employe{0,2}:匹配employ、employe和employee
使用re模块实现正则表达式操作
匹配字 符串
分割字 符串
1
3
替换字 符串
2
re.match(pattern, string, [flags])
Python中使用正则表达式
正则表达式语法
[ 概念]
正则表达式是一种用来匹配字符串的 强有力的武器。设计思想是用一种描述性 的语言来给字符串定义一个规则,凡是符 合规则的字符串,就认为它“匹配”,否 则就不匹配。
Fra Baidu bibliotek
行定位 符
元字符
限定符 字符类
排除字 符
选择字 符
转义字 符
分组
. 匹配除换行符以外的任意字符 \w 匹配字母、数字、下划线或汉字 \W 匹配字母、数字、下划线或汉字以外的字符 \s 匹配任意的空白符 \b 匹配单词的开始或结束 \d 匹配数字
替换字符串
re.sub(pattern, repl, string, count, flags)
re.I:不区分字母大小写 re.A:让\w不匹配汉字
re.split(pattern, string, [maxsplit], [flags])
re.I:不区分字母大小写 re.A:让\w不匹配汉字
re.I:不区分字母大小写 re.A:让\w不匹配汉字
re.search(pattern, string, [flags])
re.I:不区分字母大小写 re.A:让\w不匹配汉字
re.findall(pattern, string, [flags])
re.I:不区分字母大小写 re.A:让\w不匹配汉字
使用正则表达 式分割字符串
谢谢大家!
?
匹配前面的字符零次或一次 colou?r:匹配colour和color
+
匹配前面的字符一次或多次 go+gle:匹配的范围从gogle到goo…gle
*
匹配前面的字符零次或多次 go*gle:匹配的范围从ggle到goo…gle
{n} 匹配前面的字符n次
go{2}gle:只匹配google
{n,} 匹配前面的字符最少n次