A07.正则.txt

UP 返回
1.写法
import re		#导入正则
string="taoyunjiaoyu"
pat="yum"
rst=re.search(pat,string)		#pat要匹配的正则式,string被匹配的字符串
print(rst)

2.模式修正符
I	匹配时忽略大小写
M	多行匹配
L	本地化识别匹配
U	Unicode
S	让.匹配包括换行符

string="Python"
pat="pyt"
rst=re.search(pat,string,re.I)	#忽略大小写的匹配
print(rst)

3.贪婪模式与懒惰模式
string=“poythonrfgereryerrger”
pat1="p.*y"	#贪婪模式
pat2="p.*?y"	#懒惰模式
rst1=re.search(pat1,string,re.I)
rst2=re.search(pat2,string,re.I)
print(rst1)
print(rst2)

4.正则表达式函数
【#1】match  只能从头开始匹配
string=“opoythonrfgereryerrger”
pat2="p.*?y"	
rst2=re.match(pat2,string,re.I)		#无法匹配
print(rst2)
【#2】search  可以在字符串任意位置匹配
【#3】全局匹配函数
1和2都只能匹配到一次
string=“poysptykpcykpby”
pat2="p.*?y"	
rst2=re.compile(pat2).findall(string)		
print(rst2)		#返回匹配到的所有信息在一个列表中
【#4】sub  通过对检查到的字符串进行替换操作

5.常见正则匹配式
【#1】匹配.com和.cn网址
string="<a href='https://www.baidu.com'>百度首页</a>"
pat="[a-zA-Z]+://[^\s]*[.com|.cn]"
rst=re.compile(pat).findall(string)
print(rst)
【#2】匹配电话号码
pat="\d{4}-\d{7}|\d{3}-\d{8}"













DOWN 返回