正则表达式学习笔记-终极篇

三.perl风格正则表达式及相关函数
1.perl正则语法
perl分隔符,可使用”/”,”!”和”{}”。
例1:/^[^0-9]/ !^[0-9]! {^[0-9]}三个都一样。
在分隔符内部,分隔字符本身就是一个特殊敏感字符,要进行转义。如果用分隔符”/”,正则中又用了表达字符的”/”,则必须要用”\/”。如果混合用”/”和”!”就没问题。
例2:/\/\/$/ !//$! 两者也相同
例3:!^\!\![0-9]$! /^!![0-9]$/ 两者也相同
2.perl特殊意义字符
\a ASCII值为7的告警符
\b 词的边界
\A 和脱出符号(“/”)等价
\B 非词边界
\cn 控制字符
\d 单个数字
\D 单个非数字
\s 单个空白
\S 单个非空白
\w 单个的字母或下划线
\W 单个的非词字符(不是字母也不是下划线)
\Z 从目标字串的尾部开始匹配
3.高级特性
1)或运算”|”:
例如!^ex|em!匹配条件是ex或em开头的字符串,还可以写成!^e(x|m)!。
注意:()内的内容代表子模式\
2)逻辑符号后面的模式选项
!正则表达式!逻辑选项
A:只匹配位于目标字串开头的字符。
E:该选项使转义字符$构成的正则表达式只匹配目标字符串的结尾字符。如果选择m选项,该选项就被忽略。
U:该选项禁止最大长度的搜索。一般情况下,搜索会尽量找最长的匹配字符串。例如模式/a+/在”caaaaab”字符串中的匹配结果是”aaaaa”,但是使用该选项的模式/a+/U匹配的结果会是”a”。
S:对模式进行学习,提高查找速度。
i:该选项忽略大小写。
m:该选项将含有换行符的字符串视为多行而不是一行。这个时候”$”,”^”等字符会匹配每个换行符。
s:该选项使句点”.”也匹配换行符。
x:该选项通知PHP解释器在分析的时候忽略正则表达式定义中的非转义空格符。这样可以在正则表达式中使用空格来增强其可读性,但这时在表达式中使用空格符必须使用转义字符。
3)扩展模式符号。
(?#comment) 添加注释comment,可以增强正则可读性。
(?=pattern) 指定在模式之后必须跟随值pattern。
(?!pattern) 指定在模式之后不能跟随值pattern。
(?n) 在模式内部而非结尾处定义模式选项n。

4.per正则函数
1.preg_grep函数
preg_grep(pattern,array input);
输入数组input中寻找匹配模式pattern的字串,并将所有的匹配字符串返回。返回值就是所有匹配的字符串组成的数组。
2.preg_match函数
preg_match(pattern,string subject,[array matches])
该函数在subject字符串中寻找匹配pattern的字符串。如果找到则返回一个非零值,否则返回零值。如果选用了可选项matches,那么匹配的字符串将被放到第一个元素的位置,可以用$matches[0]来读取,圆括号匹配的结果也按顺序放在这个数组中,第一个是$matches[1],第二个是$matches[2],依次类推。
3.preg_match_all函数
preg_match_all(pattern,subject,array matches,[int order])
该函数在subject字符串中寻找匹配pattern的互不重叠的文本,找到了匹配的文本则返回匹配文本的个数,否则返回0。匹配文本被放在二维数组matches中,matches[0]中存放的是所有符合的字符串。各种嵌入的子模式匹配的结果依次放在数组matches[1]~[n]中。
order参数可选,可取的值为PREG_PATTERN_ORDER和PREG_SET_ORDER。
4.preg_replace函数
preg_replace(pattern,replacement,subject,[int limit])
该函数将subject中符合pattern模式的部分替换成replacement,返回值类型和subject类型一样,如果有替换,则返回替换后的值,反之则返回原来的值。
参数可以是数组也可以是变量,有几种情况:
<1>如果subject参数是数组类型。函数对每一个数组元素进行替换操作;
<2>如果pattern是数组则函数根据每一个pattern中的类型进行替换;
<3>如果pattern和replacement都是数组,则按两个数组中的元素对应完成替换;
<4>如果replacement中的元素个数少于pattern中的元素个数。那么不够的部分将有空字符串来代替。
5.preg_split函数
preg_split(pattern,subject,[int limit][flages])
该函数以pattern定义的模式为分隔符将subject字符串分隔为若干个部分,返回数组,其中存放被分隔后的字符串。limit可限制返回字符串的数目,如果设置为-1表示对返回的字符串数目不加任何限制。flags也是可选项,其有两个值:PREG_SPLIT_NO_EMPTY设定函数不返回空字符串,PERG_SPLIT_DELIM_CAPTURE,该选项设定pattern中的嵌入子模式也会被函数匹配。

完………………………

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据