Contents ...
udn網路城邦
電腦上的漢字字數計算
2009/07/14 09:53
瀏覽1,216
迴響2
推薦9
引用0

  電腦上的英文字集共有多少字?答案是26個大寫字母加上26個小寫字母,只有少少的52個字。那電腦上的漢字字集共有多少字?答案是二萬多字,至於精確的數字,用計算就能求解。

  目前微軟(Microsoft,簡稱MS)主要的作業系統(Operating System,簡稱OS)VistaWindows XP, 中文內碼是Unicode,Unicode可翻譯成統一碼,就「標準字集」而言,第一個漢字是「一」字,內碼是4E00,最後一個漢字是「龥」字,內碼是9FA5。中文內碼是採連續編碼,也就是中間沒有間隙,故只要將9FA5減去4E00,即可知道漢字共有多少字。

  但接下來的問題是,這兩組數字裡面竟然含有英文字母,也就是它們不是十進位數(Decimal),無法用一般的算術去計算,它們是電腦概論(Basic Computer Concept,簡稱BCC)常提到的十六進位(Hexadecimal)。

要計算十六進位的數字,方法一是使用Windows的小算盤做計算,進入小算盤之後,在功能表選檢視,再選工程型,在面板上選十六進位,即可計算9FA5-4E00的差值,最後再加1,即可得到20,902。

方法二是使用紙筆做計算,十六進位裡,前十個是數字0至9;至於後面的英文字母代表的數字,分別是A:10、B:11、C:12、D:13、E:14、F:15。至於權值,由右至左,分別是16^0=1、16^1=16、16^2=256、16^3=4,096,式中^代表次方。接下來進行細步計算:

4E00 =4*16^3+14*16^2+0*16^1+0*16^0

     =4*4,096+14*256+0*16+0*1

     =16,384+3,584+0+0

     =19,968

9FA5=9*16^3+15*16^2+10*16^1+5*16^0

     =9*4,096+15*256+10*16+5*1

     =3,6864+3840+160+5

     =40,869

9FA5-4E00+1=40,869-19,968+1

            =20,902

  以上兩種計算方法,皆可以得知電腦上Unicode統一碼的漢字之字數,位在「標準字集」的字數,共計20,902字,比起目前還有人在使用的BIG5大五碼的13,053字,足足多出了7,849字。 因此,今後您若在電視上或報紙上,看到監察院長「王建煊」的「煊」字,還在使用造字或拼字的「火宣」,或前行政院長「游錫堃」的「堃」字,還在使用造字或拼字的「方方土」,代表對方的電腦系統不是使用Unicode。「統一碼」漢字的字數既然比「大五碼」多出將近八千字,為何還不趕快換用呢?

﹝備註﹞

  讀者若對漢字有興趣的話,可到「知識學習類」的「語言版」閱讀多篇和漢字相關的文章。

有誰推薦more
你可能會有興趣的文章:
迴響(2) :
2樓. angelhohoho
2009/07/15 08:13
雖然我看不懂
但是我謝謝你

  謝謝您閱讀本文,日後若有人想知道這方面的資訊,您可以指引他們來這邊看。 王國良(阿國) ~談綠香蕉2009/07/15 10:31回覆
1樓. 思于
2009/07/15 06:35
專家阿國

專家阿國

你真的是格友中的稀有動物哩


思于
  思于格友,謝謝您從我成立部落格以來,一路相挺,真是感恩不盡,只好更加努力撰文,以不辜負大家的厚愛。  王國良(阿國) ~談綠香蕉2009/07/15 10:35回覆