一個(gè)字固定等于兩個(gè)字節(jié)么(計(jì)算機(jī)程序常識(shí)講解)
char型變量中能不能存貯一個(gè)中文漢字。確定下一個(gè)漢字到底占幾個(gè)字符?
char類(lèi)型可以存儲(chǔ)一個(gè)中文漢字。因?yàn)镴ava中char的編碼方式為UTF-16BE。UTF-16編碼使用2或者4字節(jié),在65536以?xún)?nèi)的占兩個(gè)字節(jié)。而基本上所有中文的Unicode編碼在19968到40869之間——既Unicode至少包含了20902個(gè)漢字,所以一個(gè)char類(lèi)型可以存儲(chǔ)一個(gè)漢字。
占用的字節(jié)
GB2312
GB2312標(biāo)準(zhǔn)主要針對(duì)的是簡(jiǎn)體中文常見(jiàn)字符,包括約7000個(gè)漢字,不包括一些罕用詞,不包括繁體字。
GBK
GBK建立在GB2312的基礎(chǔ)上,向下兼容GB2312,也就是說(shuō),GB2312編碼的字符和二進(jìn)制表示,在GBK編碼里是完全一樣的。需要注意的是,低位字節(jié)是從0x40也就是64開(kāi)始的,也就是說(shuō),低位字節(jié)最高位可能為0。
GB18030
GB18030向下兼容GBK,增加了五萬(wàn)五千多個(gè)字符,共七萬(wàn)六千多個(gè)字符。包括了很多少數(shù)民族字符,以及中日韓統(tǒng)一字符。
Big5
Big5是針對(duì)繁體中文的,廣泛用于臺(tái)灣香港等地。
Big5包括1萬(wàn)3千多個(gè)繁體字,和GB2312類(lèi)似,一個(gè)字符同樣固定使用兩個(gè)字節(jié)表示。在這兩個(gè)字節(jié)中,高位字節(jié)范圍是0x81-0xFE,低位字節(jié)范圍是0x40-0x7E和0xA1-0xFE。
總之,byte是1個(gè)字節(jié),char是兩個(gè)字節(jié),但是char里可以存一個(gè)漢字,這么說(shuō)漢字就占用兩個(gè)字節(jié)?String類(lèi)型里的漢字,按照編碼格式的不同,分為2-4個(gè)字節(jié)的占用,UTF-8占用3個(gè)字節(jié),特別的占用4個(gè)字節(jié)。GBK里漢字確實(shí)是占用2個(gè)字節(jié)。UTF-16里漢字一般占2個(gè)字節(jié),特殊的是4個(gè)字節(jié)。
綜上所述,那要看漢字是以什么編碼格式來(lái)存儲(chǔ)了,以及漢字是否為特殊漢字本站部分文章來(lái)自網(wǎng)絡(luò)或用戶投稿。涉及到的言論觀點(diǎn)不代表本站立場(chǎng)。閱讀前請(qǐng)查看【免責(zé)聲明】發(fā)布者:方應(yīng),如若本篇文章侵犯了原著者的合法權(quán)益,可聯(lián)系我們進(jìn)行處理。本文鏈接:http://www.gdyuanyu.cn/tougao/83416.html