热门问题
时间线
聊天
视角

基本拉丁字母 (Unicode區段)

来自维基百科,自由的百科全书

Remove ads

基本拉丁字母Basic Latin),又稱C0控制字符及基本拉丁字母C0 Controls and Basic Latin),是Unicode標準下的首個Unicode區段,亦是唯一一個在UTF-8下,以單一字節編碼的區段。此區段包含ASCII編碼下所有字母英語ISO basic Latin alphabet控制字符。該區段的範圍為U+0000..U+007F(共128個字元),包含C0控制字符、ASCII標點符號規約符號ASCII數字英文字母中的大寫小寫字母,以及一個控制字元。

事实速览 C0控制字符及基本拉丁字母 C0 Controls and Basic Latin, 範圍 ...

基本拉丁字母區段內的字元Unicode標準的1.0版本起一直沿用至今,多年來未曾對此作出任何增減。[3]該區段在1.0版本的名稱為ASCII[4]

Remove ads

字符表

下表列出基本拉丁字母包含的所有字符[5]

字符表
更多信息 碼位, 顯示 ...
A 字符U+005C(\)在日/韓語字體中或會顯示成日元(¥)或韓圜符號(₩),皆因這些字體錯誤地視Unicode(尤其是UTF-8)為一款傳統字符集,並將反斜線取代成這些符號。[6]
Remove ads

子標題

「C0控制字符及基本拉丁字母」區段內包含六個子標題。[5]

C0控制字符

「C0控制字符」(C0 Controls,於1.0版本中稱為C0 ASCII控制符)乃繼承自ASCII及其他7位元及8位元編碼系統。C0控制字符的別名乃基於ISO/IEC 6429:1992標準而取。[5]

ASCII標點及符號

此子標題乃指標準標點字元、簡單數學運算子,以及比索符號($)、百分號、&符號、下劃線和管道符號等符號。[5]

ASCII數字

「ASCII數字」(ASCII Digits)子標題包含標準歐式數字字元1-9及0。[5]

大寫拉丁字母

「大寫拉丁字母」(Uppercase Latin alphabet)子標題包含26個標準、無附加符號的大寫拉丁字母。[5]

小寫拉丁字母

「小寫拉丁字母」(Lowercase Latin alphabet)子標題包含26個標準、無附加符號的小寫拉丁字母。[5]

控制字元

「控制字元」(Control Character)子標題僅包含「刪除」字元。[5]

符號、字母與控制符數量

下表列出C0控制字符及基本拉丁字母區段中,各子標題的字母、符號與控制符數量。

更多信息 子標題名稱, 符號數量 ...

區塊

C0控制字符和基本拉丁字母
C0 Controls and Basic Latin[a]
Unicode Consortium 官方碼表 (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+000x NUL SOH STX ETX EOT ENQ ACK BEL  BS   HT   LF   VT   FF   CR   SO   SI 
U+001x DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN  EM  SUB ESC  FS   GS   RS   US 
U+002x  SP  ! " # $ % & ' ( ) * + , - . /
U+003x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
U+004x @ A B C D E F G H I J K L M N O
U+005x P Q R S T U V W X Y Z [ \ ] ^ _
U+006x ` a b c d e f g h i j k l m n o
U+007x p q r s t u v w x y z { | } ~ DEL
  1. 截至Unicode版本 15.1
Remove ads

變體

部份字元若跟從變體指示器(variant indicators),則會以標準化變體的定義生成。

區段內亦有一個為字元「0」定義、帶有短對角斜線的變體0︀U+0030 DIGIT ZERO U+FE00 VS1)。[7][8]

12個字元可透過U+FE0E VS15U+FE0F VS16以生成繪文字變體。[9][10][11][12]它們均為鍵帽英語Keycap基底字符(base characters),如#️⃣(U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBINING ENCLOSING KEYCAP)。VS15版本是「文字樣式」,而VS16版本則為「繪文字樣式」。[8]

繪文字可選變體
U+ 0023 002A 0030 0031 0032 0033 0034 0035 0036 0037 0038 0039
基本碼位 # * 0 1 2 3 4 5 6 7 8 9
基本+VS15+鍵帽 #︎⃣ *︎⃣ 0︎⃣ 1︎⃣ 2︎⃣ 3︎⃣ 4︎⃣ 5︎⃣ 6︎⃣ 7︎⃣ 8︎⃣ 9︎⃣
基本+VS16+鍵帽 #️⃣ *️⃣ 0️⃣ 1️⃣ 2️⃣ 3️⃣ 4️⃣ 5️⃣ 6️⃣ 7️⃣ 8️⃣ 9️⃣
Remove ads

歷史

以下與Unicode相關的文檔記錄了在基本拉丁字母區塊中定義特定字符的目的和過程:

更多信息 版本, 最終碼位[a] ...

參見

注釋

  1. 縮寫為EXC
  2. 縮寫為QUO
  3. 縮寫為DEL

參考資料

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads