【IT专家】python编程基础—正则表达式
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本文由我司收集整编,推荐下载,如有疑问,请与我司联系
python编程基础—正则表达式
2017/08/20 0 正则表达式正则表达式就是描述字符串排列的一套规则。利用正则表达式可以做很多事情,主要用于字符串的匹配在实际项目中,我们经常需要找到某一类符合某种格式的信息,此时,我们可以观察这些数据的规律,然后将这些数据的格式规律用正则表达式形式描述出来,然后利用正则表达式函数进行相应的处理即可。本节主要为大家介绍正则表达式怎么去写,将从原子、原子符、模式修正符、贪婪模式与懒惰模式等方面介绍1.原子原子是正则表达式中最基本的组成单位,每个正则表达式中至少要包含一个原子常见的原子有这几类:普通字符作为原子、非打印字符作为原子、通用字符作为原子和原子表
(1) 普通字符作为原子我们可以使用一些普通的字符,比如数字,大小写字母,下划线等都可作为原子使用,如下程序中,‘yue’作为原子使用,这里有三个原子,分别是y,u,e#普通字符作为原子import repattern = “yue”#yue作为原子使用,有三个原子,分别是y,u,estring = “yum.iqianyue”resultl = re.search(pattern,string)#在string中匹配正确的正则表达式,若匹配成功,将匹配结果返回给变量
resultprint(resultl) _sre.SRE_Match object; span=(16, 19), match=‘yue’ (2) 非打印字符作为原子指的是一些在字符串中用于格式控制的符号,比如换行符等(常用的非打印字符为‘\n’:用于匹配一个换行符,‘\t’:用于匹配一个制表符)##非打印字符作为原子import repattern = “\n”string = ‘‘‘yum.iqianyuebaidu’’’ #字符串变量string中包含一个多行的数据,因此这个数据里面包含了对应的换行符,因此,此时进行换行符匹配resultl = re.search(pattern,string)print(resultl) _sre.SRE_Match object; span=(23, 24), match=‘\n’ import repattern = “\n”string = ‘‘‘yum.iqianyuebaidu’’’#在字符串中不包含换行,因此无法成功匹配,故最后输出Noneresultl = re.search(pattern,string)print(resultl)None(3) 通用字符作为原子(即一个原子可以匹配一类字符)通用字符,即一个原子可以匹配一类字符常见的通用字符及其含义:符号含义\w匹配任意一个字母、数字和下划线\W匹配除任意一个字母、数字和下划线以外的任意一个字符\d匹配任意一个十进制数\D匹配除十进制数以外的任意一个