正则表达式
基本用法
. 匹配换行符外的任意字符
\w 匹配字母、数字、下划线、汉字 \W 匹配非字母、数字、下划线、汉字
\s 匹配任意空白符 \S 匹配除单个字符外的所有字符(包括tal和换行符)
\d 匹配数字 \D 匹配非数字
\b 匹配单词边界
() 分组
^ 匹配字符串开始 $匹配字符串结束
\A 匹配字符串开始 \Z匹配字符串结束
?0次或多次
+1次或多次
*0次或多次
{n} n次
{n,} 最少n次
{n,m} n次到m次
| 表示或
转义 \
[^ ] 排除匹配
贪婪匹配 .*
非贪婪匹配 .*?
匹配汉字 [\u4e00-\u9fa5]
匹配英文字母 [a-zA-Z] 含大小写
匹配英文字母和数字组合 [a-zA-Z0-9]
python中的正则表达式
- findall
import re |
- search和group
import re |