Java Unicode編碼系統


Unicode是一種通用的國際標準字元編碼,能夠表示世界上大多數的書面語言。

為什麼java使用Unicode系統?

Unicode之前,有很多語言標準:

  • ASCII (美國資訊交換標準程式碼)。
  • ISO 8859-1 用於表示西歐語言。
  • KOI-8 用於表示俄文。
  • GB18030BIG-5 用於表示中文等等。

問題

這導致兩個問題:

  1. 指定程式碼值對應於各種語言標準中的不同字母。
  2. 具有大字元集的語言的編碼具有可變長度。一些常見字元被編碼為單位元組,其他需要兩個或多個位元組。

解決辦法

為了解決這些問題,開發了一種新的語言標準,即Unicode系統。在unicode中,每個字元儲存為2個位元組,因此java也使用2個位元組的字元。

最小值: \u0000
最高值: \uFFFF