基本拉丁字母 (Unicode區段)
来自维基百科,自由的百科全书
基本拉丁字母(Basic Latin),又稱C0控制字符及基本拉丁字母(C0 Controls and Basic Latin),是Unicode標準下的首個Unicode區段,亦是唯一一個在UTF-8下,以單一位元組編碼的區段。此區段包含ASCII編碼下所有字母與控制字符。該區段的範圍為U+0000..U+007F(共128個字符),包含C0控制字符、ASCII標點符號與規約符號、ASCII數字、英文字母中的大寫與小寫字母,以及一個控制字符。
基本拉丁字母區段內的字符Unicode標準的1.0版本起一直沿用至今,多年來未曾對此作出任何增減。[3]該區段在1.0版本的名稱為ASCII。[4]
字符表
下表列出基本拉丁字母包含的所有字符[5]:
|
|
|
|
子標題
「C0控制字符及基本拉丁字母」區段內包含六個子標題。[5]
「C0控制字符」(C0 Controls,於1.0版本中稱為C0 ASCII控制符)乃繼承自ASCII及其他7位元及8位元編碼系統。C0控制字符的別名乃基於ISO/IEC 6429:1992標準而取。[5]
「ASCII數字」(ASCII Digits)子標題包含標準歐式數字字符1-9及0。[5]
「大寫拉丁字母」(Uppercase Latin alphabet)子標題包含26個標準、無附加符號的大寫拉丁字母。[5]
「小寫拉丁字母」(Lowercase Latin alphabet)子標題包含26個標準、無附加符號的小寫拉丁字母。[5]
「控制字符」(Control Character)子標題僅包含「刪除」字符。[5]
符號、字母與控制符數量
下表列出C0控制字符及基本拉丁字母區段中,各子標題的字母、符號與控制符數量。
子標題名稱 | 符號數量 | 字符代碼範圍 |
---|---|---|
C0控制字符 | 32個控制字符 | U+0000..U+001F |
ASCII標點及符號 | 33個標點符號與符號 | U+0020..U+002F、U+003A..U+0040、U+005B..U+0060及U+007B..U+007E |
ASCII數字 | 10個數字 | U+0030..U+0039 |
大寫拉丁字母 | 26個無附加符號的大寫拉丁字母 | U+0041..U+005A |
小寫拉丁字母 | 26個無附加符號的小寫拉丁字母 | U+0061..U+007A |
控制字符 | 1個包含「刪除」字符的控制字符 | U+007F |
區塊
變體
歷史
參見
註釋
參考資料
Wikiwand - on
Seamless Wikipedia browsing. On steroids.