正則表達式的匹配先后順序:
1.模式單元
2.重復匹配 ? * + {}
3.邊界限定 ^ $ b B
4.模式選擇 |
模式修正符:
模式修正符是標記在整個(gè)模式之外的.
i :模式中的字符將同時(shí)匹配大小寫(xiě)字母.
m :字符串視為多行.
s :將字符串視為單行,換行符作為普通字符.
x :將模式中的空白忽略.
A :強制僅從目標字符串的開(kāi)頭開(kāi)始匹配.
D :模式中的美元元字符僅匹配目標字符串的結尾.
U :匹配最近的字符串.
PHP與正則表達式中的模式修正符
Submitted by 孤魂 on 2009, July 23, 8:56 PM. 學(xué)習┊取長(cháng)補短
下面列出了當前在 PCRE 中可能使用的修正符。括號中是這些修正符的內部 PCRE 名。
i (PCRE_CASELESS)
如果設定此修正符,模式中的字符將同時(shí)匹配大小寫(xiě)字母。
m (PCRE_MULTILINE)
默認情況下,PCRE 將目標字符串作為單一的一“行”字符所組成的(甚至其中包含有換行符也是如此)。“行起始”元字符(^)僅僅匹配字符串的 起始,“行結束”元字符($)僅僅匹配字符串的結束,或者最后一個(gè)字符是換行符時(shí)其前面(除非設定了 D 修正符)。這和 Perl 是一樣的。
當設定了此修正符,“行起始”和“行結束”除了匹配整個(gè)字符串開(kāi)頭和結束外,還分別匹配其中的換行符的之后和之前。這和 Perl 的 /m 修正符是等效的。如果目標字符串中沒(méi)有“\n”字符或者模式中沒(méi)有 ^ 或 $,則設定此修正符沒(méi)有任何效果。
s (PCRE_DOTALL)
如果設定了此修正符,模式中的圓點(diǎn)元字符(.)匹配所有的字符,包括換行符。沒(méi)有此設定的話(huà),則不包括換行符。這和 Perl 的 /s 修正符是等效的。排除字符類(lèi)例如 [^a] 總是匹配換行符的,無(wú)論是否設定了此修正符。
x (PCRE_EXTENDED)
如果設定了此修正符,模式中的空白字符除了被轉義的或在字符類(lèi)中的以外完全被忽略,在未轉義的字符類(lèi)之外的 # 以及下一個(gè)換行符之間的所有字符,包括兩頭,也都被忽略。這和 Perl 的 /x 修正符是等效的,使得可以在復雜的模式中加入注釋。然而注意,這僅適用于數據字符??瞻鬃址赡苡肋h不會(huì )出現于模式中的特殊字符序列,例如引入條件子模式的序列 (?( 中間。
e
如果設定了此修正符,preg_replace() 在替換字符串中對逆向引用作正常的替換,將其作為 PHP 代碼求值,并用其結果來(lái)替換所搜索的字符串。
只有 preg_replace() 使用此修正符,其它 PCRE 函數將忽略之。
注: 本修正符在 PHP3 中不可用。
A (PCRE_ANCHORED)
如果設定了此修正符,模式被強制為“anchored”,即強制僅從目標字符串的開(kāi)頭開(kāi)始匹配。此效果也可以通過(guò)適當的模式本身來(lái)實(shí)現(在 Perl 中實(shí)現的唯一方法)。
D (PCRE_DOLLAR_ENDONLY)
如果設定了此修正符,模式中的美元元字符僅匹配目標字符串的結尾。沒(méi)有此選項時(shí),如果最后一個(gè)字符是換行符的話(huà),美元符號也會(huì )匹配此字符之前(但不會(huì )匹配任何其它換行符之前)。如果設定了 m 修正符則忽略此選項。Perl 中沒(méi)有與其等價(jià)的修正符。
S
當一個(gè)模式將被使用若干次時(shí),為加速匹配起見(jiàn)值得先對其進(jìn)行分析。如果設定了此修正符則會(huì )進(jìn)行額外的分析。目前,分析一個(gè)模式僅對沒(méi)有單一固定起始字符的 non-anchored 模式有用。
U (PCRE_UNGREEDY)
本修正符反轉了匹配數量的值使其不是默認的重復,而變成在后面跟上“?”才變得重復。這和 Perl 不兼容。也可以通過(guò)在模式之中設定 (?U) 修正符來(lái)啟用此選項。
X (PCRE_EXTRA)
此修正符啟用了一個(gè) PCRE 中與 Perl 不兼容的額外功能。模式中的任何反斜線(xiàn)后面跟上一個(gè)沒(méi)有特殊意義的字母導致一個(gè)錯誤,從而保留此組合以備將來(lái)擴充。默認情況下,和 Perl 一樣,一個(gè)反斜線(xiàn)后面跟一個(gè)沒(méi)有特殊意義的字母被當成該字母本身。當前沒(méi)有其它特性受此修正符控制。
u (PCRE_UTF8)
此修正符啟用了一個(gè) PCRE 中與 Perl 不兼容的額外功能。模式字符串被當成 UTF-8。本修正符在 Unix 下自 PHP 4.1.0 起可用,在 win32 下自 PHP 4.2.3 起可用。
舉例:
//標記在整個(gè)模式之外;
例://$mode="/\bis\b/U",其中U在外面;
//修正符:i 不區分大小寫(xiě)的匹配;
//如:"/abc/i"可以與abc或aBC或ABc等匹配;
//修正符:m 將字符串視為多行,不管是那行都能匹配;
例://模式為:$mode="/abc/m";
//要匹配的字符串為:$str="bcefg5e\nabcdfe"
//注意其中\n,換行了;abc換到了下一行;
//$str和$mode仍可以匹配,修正符m使得多行也可匹配;
//修正符:s 將字符串視為單行,換行符作為普通字符;
例://模式為:$mode="/pr.y/";
//要匹配字符串為:$str="pr\ny";
//兩者不可匹配; . 是除了換行以外的字符可匹配;
//修改下模式為:$mode="/pr.y/s";
//其中修正符s將\n視為普通字符,即不是換行;
//最后兩者可以匹配;
//修正符:x 將模式中的空白忽略;
//修正符:A 強制從目標字符串開(kāi)頭匹配;
例://$mode="/abc/A";
//可以與$str="abcsdfi"匹配,
//不可以與$str2="sdsdabc"匹配;
//因為$str2不是以abc開(kāi)頭;
//修正符:D 如果使用$限制結尾字符,則不允許結尾有換行;
例://模式為:$mode="/abc$/";
//可以與最后有換行的$str="adshabc\n"匹配;
//元子符$會(huì )忽略最后的換行\n;
//如果模式為:$mode="/abc/D",
//則不能與$str="adshabc\n"匹配,
//修正符D限制其不可有換行;必需以abc結尾;
//修正符:U 只匹配最近的一個(gè)字符串;不重復匹配;
例:
如模式為:
$mode="/a.*c/";
$str="abcabbbcabbbbbc" ;
preg_match($mode,$str,$content);
echo $content[0]; //輸出:abcabbbcabbbbbc;
//如果$mode="/a.*c/";變成$mode="/a.*c/U";
// 則只匹配最近一個(gè)字符串,輸出:abc;
//修正符:e 配合函數preg_replace()使用,
可以把匹配來(lái)的字符串當作正則表達式執行;
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請
點(diǎn)擊舉報。