欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費電子書(shū)等14項超值服

開(kāi)通VIP
iso10646/unicode/utf8
http://www.surfchen.org/wiki.php/iso10646#wiki_h1
ISO10646/Unicode規定了一套字符集,包含了世界上大多數常用字符,規定了這些字符的編碼。也就是說(shuō),每個(gè)字符會(huì )有一個(gè)規定好的編碼。
UTF8,UTF16,UTF32則規定了一套算法。根據各自的算法存儲ISO10646/Unicode的相應字符。
[Edit UTF-8]UTF-8
UTF-8的算法根據unicode字符的范圍而有變化,主要表現在存儲的字節數上,這是為了兼容ascii的單字節編碼。具體是這樣的:
0000-007F | 0xxxxxxx
0080-07FF | 110xxxxx 10xxxxxx
0800-FFFF | 1110xxxx 10xxxxxx 10xxxxxx
10000-10FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
上面這個(gè)表里,字段1表示范圍,字段2表示編碼所使用的算法,或許稱(chēng)為模板更為準確。
例如有一個(gè)字符(汜),在unicode里的編碼為十六進(jìn)制的6C5C,范圍在0800-FFFF之間,所以取模板1110xxxx 10xxxxxx 10xxxxxx(也就是說(shuō),該字符為三字節的寬字符),該字符編碼換算成二進(jìn)制后代入模板,得1110[0110] 10[110001] 10[011100]。中括號里的數字,連接起來(lái)就是該字符的unicode編碼的二進(jìn)制表示。
下面是一個(gè)我寫(xiě)的把html的實(shí)體轉換為utf-8的函數,編程語(yǔ)言為php。html的實(shí)體的其中一種格式為 &#unicode編碼的十進(jìn)制;,注意最后有個(gè)分號。
function htmlentity2utf8($string) {
if (!preg_match("@&#(\d+);@",$string,$matches)) return $string;
$he=$matches[1];
$he=(int)$he;
if ($he>=0x0000 && $he<=0x007f) {
$template=array("0%");
} elseif ($he>=0x0080 && $he<=0x007ff) {
$template=array("110%","10%");
} elseif ($he>=0x0800 && $he<=0xffff) {
$template=array("1110%","10%","10%");
} elseif ($he>=0x10000 && $he<=0x10ffff) {
$template=array("11110%","10%","10%","10%");
} else {
return $string;
}
$template=array_reverse($template);
$utf8=‘‘;
$he_b=(string)sprintf("%b",$he);
$offset=0;
foreach ($template as $t) {
$t_len=strlen($t);
$need_count=9-$t_len;
$offset-=$need_count;
$current_he=substr(sprintf("%0".abs($offset)."s",$he_b),$offset,$need_count);
$tmp=sprintf("%0".$need_count."d",$current_he);
$utf8=chr(base_convert((str_replace(‘%‘,$tmp,$t)),2,10)).$utf8;
}
return $utf8;
}
Config........0.00045204162597656 SECs
Instantiate..0.010334014892578 SECs
Render......3.3175349235535 SECs
This wiki is underGPL and the latest version can be foundhere.
iso10646
Navigator
UTF-8
KeyShortCuts
o - login/logout e - edit h - histories v - recently views m - recently modifies w - go home [ - go to previous ] - go to next u - lock/unlock c - passwd Accesskey(s) - save AccessKey(c) - discard
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請點(diǎn)擊舉報。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
中文化和國際化問(wèn)題權威解析之一:字符編碼發(fā)展歷程
Unicode字符編碼規范
常見(jiàn)編碼總結:Unicode、UTF、ISO 8859
徹底搞定各種編碼ASCII、ANSI、GBK、unicode、UTF-8淵源、占用字節等
EF BB BF Unicode簽名BOM(Byte Order Mark)
ASCII、ANSI、UNICODE及UTF-8編碼
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導長(cháng)圖 關(guān)注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久