2007-07-09

正则表达式

关键字: 正则表达式

正则表达式的直接量字符  
字母数字字符 自身
/0 NUL字符(\u000)
\t 制表符(\u0009)
\n 换行符(\u000A)
\v 垂直制表符(\u000B)
\f 换页符(\u000C)
\r 回车(\u000D)
\xnn 十六进制数nn指定的拉丁字符,例如,\x0A等价于\n
\uxxxx 由十六进制xxxx指定的Unicode字符,例如,\u0009等价于\t
\cX 控制字符。例如,\cJ等价于换行符\n
   
正则表达式的字符类  
[...] 位于括号之内的任意字符 
[^…] 不在括号之内的任意字符 
. 除换行符合其他Unicode行终止符之外的任意字符
\w 任何ASCLL单字字符,等价于[a-zA-Z0-9]
\W 任何ASCLL非单字字符,等价于^[a-zA-Z0-9]
\s 任何Unicode空白符
\S 任何非Unicode空白符,注意\w和\S不同
\d 任何ASCLL数字[0-9]
\D 除了ASCLL数字之外的任何字符,等价于[^0-9]
[\b] 退格直接量(特例)
   
正则表达式的重复字符  
{n,m} 匹配前一项至少n次,但是不能超过m次
{n,} 匹配前一项n次,或更多次
{n} 匹配前一项恰好N次
匹配前一项0次或1次,也就是说前一项十可选的。等价于{0,1}
+ 匹配前一项1次或多次,等价于{1,}
* 匹配前一项0次或多次,等价于{0,}
 
(…) 组合。将几个项目组合为一个单元,这个单元可由*,+,?和|等符号使用,而且还可以记住和这个组合匹配的字符以供此后的引用使用
(?:...) 只组合。吧项目组合到一个单元,但是不记忆与改组匹配的字符
 |  分隔供选择的字符,匹配的是该符号左边的子表达式或右边的子表达式。如:ab|cd|ef,匹配的是,ab,cd,和ef.\d{3}|[a-z]{4}匹配的是三位小数或四个小写字母,选择项从左到右考虑,a|ab,如ab,只匹配第一个字母a
\n 和几个分组第一次匹配的的字符相匹配。组合括号中的子表达式(可能有是嵌套的)。组号是从左到右计数的左括号数。以(?:形式风分组的组不编码。

 

   
^ 匹配字符串的开头,在多行索引中,匹配一行的开头
$ 匹配字符串的,在多行索引中,匹配一行的结尾
\b 匹配一个词语的边界。简而言之。就是位于字符\w和\w之间的位置,或位于字符\w和字符串的开头或结尾之间的位置。(注意[\b]匹配的是退格符)
\B 匹配非词语边界的字符
(?=p) 正前向声明要求接下来的字符都与模式p匹配,但是不包括匹配中的那些字符
(?!p) 反向声明要求接下来的字符都不与模式p匹配
   
 i  执行大小写不敏感的匹配
 g  执行一个全局匹配。简而言之,即找到所有匹配,而不是找到第一个之后就停止。
 m  多行模式,^匹配一行的开头和字符串的开头,$匹配一行的结尾或字符串的结尾。

 

评论
发表评论

您还没有登录,请登录后发表评论

shikonglaike
搜索本博客
最近加入圈子
存档
最新评论