| 模式名稱(chēng) |
啟用,禁用 |
缺省啟用 |
說(shuō)明 |
| UNIX_LINES |
(?d)啟用,(?-d)禁用 |
是 |
啟用Unix行模式。 在此模式下,只有 ‘\n‘被認為是行結束符。它會(huì )影響., ^, 和 $ 的行為。 |
| CASE_INSENSITIVE |
(?i)啟用,(?-i)禁用 |
否 |
啟用忽略大小寫(xiě)模式。 缺省時(shí),忽略大小寫(xiě)模式只會(huì )影響 ASCII字符的匹配。 而Unicode范圍的忽略大小寫(xiě)匹配需要通過(guò) UNICODE_CASE 標志與本標志聯(lián)合使用。 啟用此模式會(huì )影響匹配性能。 |
| COMMENTS |
(?x)啟用,(?-x)禁用 |
否 |
允許空格和注釋出現在正則表達式中。 在此模式下,空格被忽略,以#開(kāi)始的單行注釋被忽略。 |
| MULTILINE |
(?m)啟用,(?-m)禁用 |
是 |
啟用多行模式。 In multiline mode the expressions ^ and $ match just after or just before, respectively, a line terminator or the end of the input sequence. By default these expressions only match at the beginning and the end of the entire input sequence. |
| DOTALL |
(?s)啟用,(?-s)禁用 |
否 |
讓.可以匹配行結束符。 在此模式下,元字符.可以匹配行結束符。缺省不允許如此匹配。 |
| UNICODE_CASE |
(?u)啟用,(?-u)禁用 |
否 |
Enables Unicode-aware case folding. When this flag is specified then case-insensitive matching, when enabled by the CASE_INSENSITIVE flag, is done in a manner consistent with the Unicode Standard. By default, case-insensitive matching assumes that only characters in the US-ASCII charset are being matched. 啟用此模式會(huì )影響性能。 |
| CANON_EQ |
(?c)啟用,(?-c)禁用 |
否 |
Enables canonical equivalence. When this flag is specified then two characters will be considered to match if, and only if, their full canonical decompositions match. The expression "a\u030A", for example, will match the string "?" when this flag is specified. By default, matching does not take canonical equivalence into account. 啟用此模式會(huì )影響性能。 |
| 正則表達式字符串 |
匹配的字符串 |
| X |
字符X,包括 CJK ExtB 區漢字 |
| \\ |
反斜杠\ |
| \0n | 八進(jìn)制0n代表的字符(0<=n<=7) |
| \0nn |
八進(jìn)制0nn代表的字符(0<=n<=7) |
| \0mnn |
八進(jìn)制0mnn代表的字符(0<=m<=3,0<=n<=7) |
| \xhh |
十六進(jìn)制 0xhh所代表的字符 |
| \uhhhh |
十六進(jìn)制 0xhhhh所代表的字符。注意,目前尚不支持CJK ExtB區漢字。 |
| \t |
制表符(‘\u0009‘) |
| \n |
換行(‘\u000A‘) |
| \r |
回車(chē)(‘\u000D‘) |
| \a |
響鈴符(‘\u0007‘) |
| \e |
取消符Escape(‘\001B‘) |
| \cx |
x所代表的控制字符 |
| 正則表達式字符串 |
匹配的字符串 |
| XY |
X后面跟隨Y |
| X|Y |
X或者Y |
| (X) |
X作為分組表達式 |
| 正則表達式字符串 |
匹配的字符串 |
| \n |
第n個(gè)匹配的分組 |
| 邊界字符 |
匹配的字符串 |
| ^ |
行首 |
| $ |
行末 |
| \b | 字符邊界 |
| \B |
非字符邊界 |
| \A |
輸入流的開(kāi)始 |
| \G |
上次匹配的結束處 |
| \Z |
輸入流的結束,或者是最后一個(gè)行結束符,參見(jiàn)行結束符。 |
| \z |
輸入流的結束 |
| 正則表達式字符串 |
匹配的字符串 |
| X? |
X重復一次,或者不重復 |
| X* |
X重復0次或多次 |
| X+ |
X重復1次或多次 |
| X{n} |
X重復n次,不多也不少。 |
| X{n,} |
X至少重復n次 |
| X{n,m} |
X至少重復n次,至多重復m次。 |
| 正則表達式字符串子集 |
匹配的字符串 |
組合方式 |
| [abc] |
字符a,b或c,包括 CJK ExtB 區漢字 |
簡(jiǎn)單子集 |
| [^abc] |
任意非a,b或c的字符。 |
排除 |
| [a-zA-Z] | 從a到z,或者A到Z,包含a,z,A,Z。 |
區間 |
| [a-d[m-p]] |
從a到d,或者m到p,等于[a-dm-p]。 |
聯(lián)合 |
| [a-z&&[def]] |
d,e或者f。 |
交集 |
| [a-z&&[^bc]] |
從a到z,除了b和c,等于[ad-z] |
扣除 |
| [a-z&&[^m-p]] |
從a到z,并且不包括從m到p,等于[a-lq-z] |
扣除 |
| 邊界字符 |
匹配的字符串 |
| . |
任意字符,可能匹配行結束符。 |
| \d |
數字[0-9] |
| \D | 非數字[^0-9] |
| \s |
空白符[ \t\n\x0B\f\r] |
| \S |
非空白符[^\s] |
| \w |
單詞符,包含有字母和數字[a-zA-Z_0-9] |
| \W |
非單詞符,不包含有字母和數字。 |
| 正則表達式字符串 |
匹配的字符串 |
| 名稱(chēng) |
塊名稱(chēng)(\p{InXXX}) |
簡(jiǎn)化通配符 |
標準Unicode塊,或者漢字列表 |
| 任意雙字節字符(漢字或全角符號) |
\p{InQuqnJiao} |
\E |
任意由GBK表示的漢字,不包括GB18030擴展部分, 以及CJK ExtB區的漢字。 |
| 任意單字節字符 |
\p{InFQuanJiao} |
\~E |
任意單字節字符。 |
| 任意全角ASCII字符 |
\p{InQJAscii} |
\H |
標準HalfwidthandFullwidthForms塊 |
| 任意收錄在BIG5碼集中的雙字節字符 |
\p{InBig5} |
\I |
Big5可編碼雙字節字符 |
| 匹配未收錄在BIG5碼集中的雙字節字符 | \p{InFBig5} |
\~I |
非Big5可編碼雙字節字符 |
| 匹配任意漢字(不包括符號) |
\p{InHanziOrCJKExtB} |
\X |
任意漢字,包括GB18030擴展部分。 |
| 匹配任意漢字(不包括符號) |
\p{InHanzi} |
\M |
任意漢字,不包括GB18030擴展部分。 |
| 匹配非漢字的雙字節字符 |
\p{InFHanzi} |
\~M |
任意非漢字的雙字節字符, 包括GB18030擴展部分。 |
| 地支字符 |
\p{InDiZhi} |
\U |
子丑寅卯辰巳午未申酉戌亥 |
| 匹配收錄在GB碼集中的雙字節字符 |
\p{InGB} |
\g |
收錄在GB碼集中的雙字節字符, 不包括GB18030擴展部分。 |
| 匹配非收錄在GB碼集中的雙字節字符 |
\p{InFGB} |
\~g |
未收錄在GB碼集中的雙字節字符, 不包括GB18030擴展部分。 |
| 匹配收錄在GBK碼集中的雙字節字符 |
\p{InGBK} |
\h |
收錄在GBK碼集中的雙字節字符, 不包括GB18030擴展部分。 |
| 匹配非收錄在GBK碼集中的雙字節字符 |
\p{InFGBK} |
\~h |
未收錄在GBK碼集中的雙字節字符, 不包括GB18030擴展部分。 |
| 大寫(xiě)希臘字母 |
\p{InDaXila} |
\K |
ΑΒΓΔΕΖΗΘΙΚΛΜΝ ΞΟΠΡΣΤΥΦΧΨΩ |
| 日文片假名 |
\p{InPianJia} |
\j |
標準Katakana塊 |
| 日文平假名 |
\p{InPingJia} |
\J |
標準Hiragana塊 |
| 小寫(xiě)希臘字母 |
\p{InXiaoXila} |
\k |
αβγδεζηθικλμν ξοπρστυφχψω |
| 數學(xué)符號 |
\p{InMathe} |
\m |
±×÷∶∧∨∑∏∪∩∈∷√⊥∥∠⌒⊙ ∫∮≡≌≈∽∝≠≮≯≤≥∞∵∴ |
| 中文數字 |
\p{InCnDigit} |
\i |
〇一二三四五六七八九十百千萬(wàn)億兆吉京 |
| 大寫(xiě)中文數字 |
\p{InDaCnDigit} |
\N |
零壹貳叁肆伍陸柒捌玖拾佰仟萬(wàn)億兆吉京 |
| 全角標點(diǎn)符號 |
\p{InQJBiaoDian} |
\o |
、。·ˉˇ¨〃々—~‖…‘’“”〔〕 〈〉《》「」『』〖〗【】?。ⅲВǎ?, -.:;<=>?[]{|}`﹉﹊﹋﹌﹍﹎﹏﹐﹑﹒﹔﹕﹖﹗﹙﹚ ﹛﹜﹝﹞︵︶︹︺︿﹀︽︾﹁﹂﹃﹄ ︻︼︷︸︱︳︴ |
| 小寫(xiě)俄文字母 |
\p{InXiaoEWen} |
\l |
абвгдеёжзийклмн опрстуфхцчшщъыьэюя |
| 大寫(xiě)俄文字母 |
\p{InDaEWen} |
\R |
АБВГДЕЁЖЗИЙКЛМНО ПРСТУФХЦЧШЩЪЫЬЭЮЯ |
| 中文序號 |
\p{InCnSN} |
\q |
ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫ ?、ⅱ"あアΒБá?br>再加上Unicode標準EnclosedAlphanumerics塊 |
| 天干字符 |
\p{InTianGan} |
\T |
甲乙丙丁戊己庚辛壬癸 |
| 豎排標點(diǎn)符號 |
\p{InSPBiaoDian} |
\V |
︵︶︹︺︿﹀︽︾﹁﹂﹃﹄︻︼︷︸︱︳︴ |
| 拼音字符 |
\p{InPinyin} |
\y |
āáǎàēéěèīíǐìōóǒòūúǔùǖǘǚǜüêɑńňɡ GBK -> 0xA8A1- 0xA8C0 只是Unicode標準LatinExtended-A塊的一部分。 |
| 注音字符 |
\p{InZhuyin} |
\Y |
標準Bopomofo塊 |
| 制表字符 |
\p{InZhiBiao} |
\C |
標準BoxDrawing塊。 經(jīng)檢查發(fā)現 textpro 的算法含有部分非標 準Unicode制表符:“∟∣≒≦≧⊿═”。 |
| 正則表達式字符串 |
匹配的字符串 |
| \p{Lower} |
小寫(xiě)字母[a-z] |
| \p{Upper} |
大寫(xiě)字母[A-Z] |
| \p{ASCII} |
所有的ASCII字符[\x00-\x7F] |
| \p{Alpha} |
大小寫(xiě)字母[\p{Lower}\p{Upper}] |
| \p{Digit} |
數字[0-9] |
| \p{Alnum} |
字母數字符,包含大小寫(xiě)字母和數字[\p{Alpha}\p{Digit}] |
| \p{Punct} |
標點(diǎn)符號,!"#$%&‘()*+,-./:;<=>?@[\]^_`{|}~之一。 |
| \p{Graph} |
可顯示字符[\p{Alnum}\p{Punct}] |
| \p{Print} |
可打印字符[\p{Graph}] |
| \p{Blank} |
空格或者制表符[ \t] |
| \p{Cntrl} |
控制字符[\x00-\x1F\x7F |
| \p{XDigit} |
十六進(jìn)制數字[0-9a-fA-F] |
| \p{Space} |
空白符[ \t\n\x0B\f\r] |
| 塊 |
中文名稱(chēng)(摘自Word XP) |
代碼區域 |
| BasicLatin |
基本拉丁語(yǔ) |
\u0000-\u007F |
| Latin-1Supplement |
拉丁語(yǔ)-1 |
\u0080-\u00FF |
| LatinExtended-A |
拉丁語(yǔ)擴充-A |
\u0100-\u017F |
| LatinExtended-Bound |
拉丁語(yǔ)擴充-B |
\u0180-\u024F |
| IPAExtensions |
國際音標擴充 |
\u0250-\u02AF |
| SpacingModifierLetters |
進(jìn)格的修飾字符 |
\u02B0-\u02FF |
| CombiningDiacriticalMarks |
組合用發(fā)音符 |
\u0300-\u036F |
| Greek |
基本希臘語(yǔ) |
\u0370-\u03FF |
| Cyrillic |
西里爾語(yǔ) |
\u0400-\u04FF |
| Armenian |
\u0530-\u058F |
|
| Hebrew |
\u0590-\u05FF |
|
| Arabic |
\u0600-\u06FF |
|
| Syriac |
\u0700-\u074F |
|
| Thaana |
\u0780-\u07BF |
|
| Devanagari |
\u0900-\u097F |
|
| Bengali |
\u0980-\u09FF |
|
| Gurmukhi |
\u0A00-\u0A7F |
|
| Gujarati |
\u0A80-\u0AFF |
|
| Oriya |
\u0B00-\u0B7F |
|
| Tamil |
\u0B80-\u0BFF |
|
| Telugu |
\u0C00-\u0C7F |
|
| Kannada |
\u0C80-\u0CFF |
|
| Malayalam |
\u0D00-\u0D7F |
|
| Sinhala |
\u0D800-\uDFF |
|
| Thai |
\u0E00-\u0E7F |
|
| Lao |
\u0E80-\u0EFF |
|
| xizang |
藏語(yǔ) |
\u0F00-\u0FFF |
| Myanmar |
\u1000-\u109F |
|
| Georgian |
\u10A0-\u10FF |
|
| HangulJamo |
\u1100-\u11FF |
|
| Ethiopic |
\u1200-\u137F |
|
| Cherokee |
\u13A0-\u13FF |
|
| UnifiedCanadianAboriginalSyllabics |
\u1400-\u167F |
|
| Ogham |
\u1680-\u169F |
|
| Runic |
\u16A0-\u16FF |
|
| Khmer |
\u1780-\u17FF |
|
| Mongolian |
蒙古語(yǔ) |
\u1800-\u18AF |
| LatinExtendedAdditional |
\u1E00-\u1EFF |
|
| GreekExtended |
\u1F00-\u1FFF |
|
| GeneralPunctuation |
廣義標點(diǎn) |
\u2000-\u206F |
| SuperscriptsandSubscripts |
\u2070-\u209F |
|
| CurrencySymbols |
貨幣符號 |
\u20A0-\u20CF |
| CombiningMarksforSymbols |
\u20D0-\u20FF |
|
| LetterlikeSymbols |
類(lèi)似字母的符號 |
\u2100-\u214F |
| NumberForms |
數字形式 |
\u2150-\u218F |
| Arrows |
箭頭 |
\u2190-\u21FF |
| MathematicalOperators |
數學(xué)運算符 |
\u2200-\u22FF |
| MiscellaneousTechnical |
零雜技術(shù)用符號 |
\u2300-\u23FF |
| ControlPictures |
\u2400-\u243F |
|
| OpticalCharacterRecognition |
\u2440-\u245F |
|
| EnclosedAlphanumerics |
帶括號的字母數字 |
\u2460-\u24FF |
| BoxDrawing |
制表符 |
\u2500-\u257F |
| BlockElements |
方塊圖形 |
\u2580-\u259F |
| GeometricShapes |
幾何圖形 |
\u25A0-\u25FF |
| MiscellaneousSymbols |
零雜丁貝符(示意符等) |
\u2600-\u26FF |
| Dingbats |
\u2700-\u27BF |
|
| BraillePatterns |
\u2800-\u28FF |
|
| CJKRadicalsSupplement |
\u2E80-\u2EFF |
|
| KangxiRadicals |
\u2F00-\u2FDF |
|
| IdeographicDescriptionCharacters |
\u2FF0-\u2FFF |
|
| CJKSymbolsandPunctuation |
CJK符號和標點(diǎn) |
\u3000-\u303F |
| Hiragana |
平假名 |
\u3040-\u309F |
| Katakana |
片假名 |
\u30A0-\u30FF |
| Bopomofo |
注音 |
\u3100-\u312F |
| HangulCompatibilityJamo |
\u3130-\u318F |
|
| Kanbun |
\u3190-\u319F |
|
| BopomofoExtended |
擴展注音 |
\u31A0-\u31BF |
| EnclosedCJKLettersandMonths |
帶括號的CJK字母及月份 |
\u3200-\u32FF |
| CJKCompatibility |
CJK兼容字符 |
\u3300-\u33FF |
| CJKUnifiedIdeographsExtensionA |
CJK統一漢字擴展-A |
\u3400-\u4dBF |
| CJKUnifiedIdeographs |
CJK統一漢字 |
\u4E00-\u9fAF |
| YiSyllables |
\uA000-\uA48F |
|
| YiRadicals |
\uA490-\uA4CF |
|
| HangulSyllables |
\uAC00-\uD7A3 |
|
| HighSurrogates |
\uD800-\uDB7F |
|
| HighPrivateUseSurrogates |
\uDB80-\uDBFF |
|
| LowSurrogates |
\uDC00-\uDFFF |
|
| PrivateUse |
專(zhuān)用區 |
\uE000-\uF8FF |
| CJKCompatibilityIdeographs |
CJK兼容漢字 |
\uF900-\uFAFF |
| AlphabeticPresentationForms |
\uFB00-\uFB4F |
|
| ArabicPresentationForms-A |
\uFB50-\uFDFF |
|
| CombiningHalfMarks |
\uFE20-\uFE2F |
|
| CJKCompatibilityForms |
CJK兼容形式 |
\uFE30-\uFE4F |
| SmallFormVariants |
小寫(xiě)變體 |
\uFE50-\uFE6F |
| ArabicPresentationForms-Bound |
\uFE70-\ufeFF |
|
| Specials |
\uFFF0-\uFFFF |
|
| HalfwidthandFullwidthForms |
半形及全形字符 |
\uFF00-\uFFEF |
| 分類(lèi) |
全稱(chēng) |
說(shuō)明 |
| Cn |
UNASSIGNED |
|
| Lu |
UPPERCASE_LETTER |
|
| Ll |
LOWERCASE_LETTER |
|
| Lt |
TITLECASE_LETTER |
|
| Lm |
MODIFIER_LETTER |
|
| Lo |
OTHER_LETTER |
|
| Mn |
NON_SPACING_MARK |
|
| Me |
ENCLOSING_MARK |
|
| Mc |
COMBINING_SPACING_MARK |
|
| Nd |
DECIMAL_DIGIT_NUMBER |
|
| Nl |
LETTER_NUMBER |
|
| No |
OTHER_NUMBER |
|
| Zs |
SPACE_SEPARATOR |
|
| Zl |
LINE_SEPARATOR |
|
| Zp |
PARAGRAPH_SEPARATOR |
|
| Cc |
CNTRL |
|
| Cf |
FORMAT |
|
| Co |
PRIVATE_USE |
|
| Cs |
SURROGATE |
|
| Pd |
DASH_PUNCTUATION |
|
| Ps |
START_PUNCTUATION |
|
| Pe |
END_PUNCTUATION |
|
| Pc |
CONNECTOR_PUNCTUATION |
|
| Po |
OTHER_PUNCTUATION |
|
| Sm |
MATH_SYMBOL |
|
| Sc |
CURRENCY_SYMBOL |
|
| Sk |
MODIFIER_SYMBOL |
|
| So |
OTHER_SYMBOL |
|
| L |
LETTER |
|
| M |
MARK |
|
| N |
NUMBER |
|
| Z |
SEPARATOR |
|
| C |
CONTROL |
|
| P |
PUNCTUATION |
|
| S |
SYMBOL | |
| LD |
LETTER_OR_DIGIT |
|
| L1 |
Latin-1 |
|
| all |
ALL |
|
| ASCII |
ASCII |
|
| Alnum |
字母數字(0-9,a-z,A-Z) |
|
| Alpha |
字母(a-z,A-Z) |
|
| Blank |
空格和制表符(‘ ‘|\t) |
|
| Cntrl |
控制字符,不可打印 |
|
| Digit |
數字(0-9) |
|
| Graph |
可打印且可視字母(例如空格‘ ‘是可打印的但不是可視字母,而 `a‘ 兩者都是。) |
|
| Lower |
小寫(xiě)字母 |
|
| Print |
可打印字母(非控制字符) |
|
| Punct |
標符號(字母、數字、控制、空白符以外的字母),如:!@#$%}{<>,./?[]等等。 |
|
| Space |
空白符(‘ ‘,\t,0x09,0x0A,0x0B,0x0C,0x0D,0x20) |
|
| Upper |
大寫(xiě)字母 |
|
| XDigit |
十六進(jìn)制數字(0-9,a-f, A-F) |
| 特殊字符介紹 |
描述 |
| \n |
換行 |
| \b |
向前刪除一個(gè)字符。當這個(gè)字符位于替換串之首時(shí),將刪除匹配串之前的一個(gè)字符。若匹配串位于行首,將使匹配串所在行與前一行相合并。 |
| \d |
向后刪除一個(gè)字符。當這個(gè)字符位于替換串之末時(shí),將刪除匹配串之后的一個(gè)字符。若匹配串位于行末,將使匹配串所在行與下一行相合并。 |
| \e |
插入一個(gè)ESC字符 |
| \t |
插入一個(gè)TAB字符 |
| \n |
n代表查找正則表達式中的子表達式(組)。\1代表第一個(gè)子表達式,\2代表第二個(gè)子表達式,依次類(lèi)推。\0代表整個(gè)匹配到的字符串。 |
| \v |
大寫(xiě)下一個(gè)字母 |
| \U |
全部大寫(xiě)以后的字母,直到碰到其它指示符為止。 |
| \l |
小寫(xiě)下一個(gè)字母 |
| \L |
全部小寫(xiě)以后的字母,直到碰到其它指示符為止。 |
| \E |
取消所有的字母大小寫(xiě)指示符。 |
聯(lián)系客服