在使用String.split方法分隔字符串時(shí),分隔符如果用到一些特殊字符,可能會(huì )得不到我們預期的結果。
我們看jdk doc中說(shuō)明
public String[] split(String regex)
Splits this string around matches of the given regular expression.
參數regex是一個(gè) regular-expression的匹配模式而不是一個(gè)簡(jiǎn)單的String,他對一些特殊的字符可能會(huì )出現你預想不到的結果,比如測試下面的代碼:
用豎線(xiàn) | 分隔字符串,你將得不到預期的結果
String[] aa = "aaa|bbb|ccc".split("|");
//String[] aa = "aaa|bbb|ccc".split("\\|"); 這樣才能得到正確的結果
for (int i = 0 ; i <aa.length ; i++ ) {
System.out.println("--"+aa[i]);
}
用豎 * 分隔字符串運行將拋出java.util.regex.PatternSyntaxException異常,用加號 + 也是如此。
String[] aa = "aaa*bbb*ccc".split("*");
//String[] aa = "aaa|bbb|ccc".split("\\*"); 這樣才能得到正確的結果
for (int i = 0 ; i <aa.length ; i++ ) {
System.out.println("--"+aa[i]);
}
顯然,+ * 不是有效的模式匹配規則表達式,用"\\*" "\\+"轉義后即可得到正確的結果。
"|" 分隔串時(shí)雖然能夠執行,但是卻不是預期的目的,"\\|"轉義后即可得到正確的結果。
還有如果想在串中使用"\"字符,則也需要轉義.首先要表達"aaaa\bbbb"這個(gè)串就應該用"aaaa\\bbbb",如果要分隔就應該這樣才能得到正確結果:
String[] aa = "aaa\\bbb\\bccc".split("\\\\");