用正則表達式[\u4e00-\u9fa5]
public static void main(String[] args) {
int count=0;
String regEx = "[\\u4e00-\\u9fa5]";
//System.out.println(regEx);
String str = "中文fdas";
//System.out.println(str);
Pattern p = Pattern.compile(regEx);
Matcher m = p.matcher(str);
while (m.find()) {
for (int i = 0; i <= m.groupCount(); i++) {
count=count+1;
}
}
System.out.println("共有"+count+"個(gè)");
}
更簡(jiǎn)單的方法
public static void main(String[] args)
{
String input = "中文語(yǔ)言fd何as最近幾天dafds工作dfds效率不高fdsf番dfsfdsa啊";
String temp = null;
Pattern p = Pattern.compile("[\u4E00-\u9FA5]+");
Matcher m = p.matcher(input);
while (m.find())
{
temp = m.group(0);
System.out.println(temp + ":" + temp.length());
}
}
補充:
使用這個(gè)兩個(gè)包java.util.regex.Pattern;和java.util.regex.Matcher;
Pattern
正則表達式的編譯表示形式。
指定為字符串的正則表達式必須首先被編譯為此類(lèi)的實(shí)例。然后,可將得到的模式用于創(chuàng )建 Matcher 對象,依照正則表達式,該對象可以與任意字符序列匹配。執行匹配所涉及的所有狀態(tài)都駐留在匹配器中,所以多個(gè)匹配器可以共享同一模式。
因此,典型的調用順序是
Pattern p = Pattern.compile("a*b"); Matcher m = p.matcher("aaaaab"); boolean b = m.matches();
在僅使用一次正則表達式時(shí),可以方便地通過(guò)此類(lèi)定義 matches 方法。此方法編譯表達式并在單個(gè)調用中將輸入序列與其匹配。語(yǔ)句
boolean b = Pattern.matches("a*b", "aaaaab");
等效于上面的三個(gè)語(yǔ)句,盡管對于重復的匹配而言它效率不高,因為它不允許重用已編譯的模式。
此類(lèi)的實(shí)例是不可變的,可供多個(gè)并發(fā)線(xiàn)程安全使用。Matcher 類(lèi)的實(shí)例用于此目的則不安全。
Matcher
通過(guò)解釋 Pattern 對 字符序列 執行匹配操作的引擎。
通過(guò)調用模式的 matcher 方法從模式創(chuàng )建匹配器。創(chuàng )建匹配器后,可以使用它執行三種不同的匹配操作:
每個(gè)方法都返回一個(gè)表示成功或失敗的布爾值。通過(guò)查詢(xún)匹配器的狀態(tài)可以獲取關(guān)于成功匹配的更多信息。
group
public String group(int group)
- 返回在以前匹配操作期間由給定組捕獲的輸入子序列。
對于匹配器 m、輸入序列 s 和組索引 g,表達式 m.group(g) 和 s.substring(m.start(g), m.end(g)) 是等效的。
捕獲組是從 1 開(kāi)始從左到右的索引。組零表示整個(gè)模式,因此表達式 m.group(0) 等效于 m.group()。
如果該匹配成功了,但指定組未能匹配輸入序列的任何部分,則返回 null。注意,某些組(例如,(a*))匹配空字符串。當這些的組成功匹配輸入中的空字符串時(shí),此方法將返回空字符串。
-
- 指定者:
- 接口
MatchResult 中的 group
-
- 參數:
group - 此匹配器模式中捕獲組的索引。 - 返回:
- 在以前的匹配期間組所捕獲的子序列(可能為空);如果組未能匹配輸入的部分,則返回 null。
- 拋出:
IllegalStateException - 如果沒(méi)有嘗試任何匹配,或者以前的匹配操作失敗。 IndexOutOfBoundsException - 如果在給定索引的模式中不存在捕獲組。
find
public boolean find()
- 嘗試查找與該模式匹配的輸入序列的下一個(gè)子序列。
此方法從匹配器區域的開(kāi)頭開(kāi)始,如果該方法的前一次調用成功了并且從那時(shí)開(kāi)始匹配器沒(méi)有被重置,則從以前匹配操作沒(méi)有匹配的第一個(gè)字符開(kāi)始。
如果匹配成功,則可以通過(guò) start、end 和 group 方法獲取更多信息。
-
-
- 返回:
- 當且僅當輸入序列的子序列匹配此匹配器的模式時(shí)才返回 true。