特殊 (Unicode區段)

包含一些特殊代码点和两个非字符的Unicode块 来自维基百科,自由的百科全书

特殊字符是Unicode的一個簡短的區段,分配在基本多文種平面的最末端,位於U+FFF0-FFFF。在這16個碼位中,有5個是從Unicode 3.0開始分配的。

  • U+FFF9 行間註解錨,標誌着註解文本的開始。
  • U+FFFA 行間註解分隔符,標記註解字符的開始。
  • U+FFFB 行間註解終止符,標誌着註解塊的結束。
  • U+FFFC  OBJECT REPLACEMENT CHARACTER,在文本中為另一個未指定的對象提供占位符,例如在一個複合文件中。
  • U+FFFD � REPLACEMENT CHARACTER(替換字符),用於替換一個未知的、不被認可的或無法表示的字符。
  • U+FFFE <非字符-FFFE> 不是一個字符。
  • U+FFFF <非字符-FFFF> 不是一個字符。
事实速览 特殊字符 Specials, 範圍 ...
特殊字符
Specials
範圍U+FFF0..U+FFFF
(16個碼位)
平面基本多文種平面BMP
文字通用
已分配5個碼位
未分配9個保留碼位
2個非字元
統一碼版本歷史
1.0.01 (+1)
2.12 (+1)
3.05 (+3)
碼表
點擊此處
註釋[1][2]
关闭

FFFE和FFFF不是通常意義上的未分配字符,但不是Unicode字符。它們可以用來猜測一個文本的編碼方案,因為根據定義,任何包含這些的文本都不是一個正確編碼的Unicode文本。Unicode的U+FEFF BYTE ORDER MARK字符可以插在Unicode文本的開頭,以表示它的字節性:一個程序在閱讀這樣的文本並遇到0xFFFE時,就會知道它應該為後面的所有字符轉換字節順序。

它在Unicode 1.0中的區段名是特殊。[3]

特殊字符[1][2][3]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+FFFx IAA IAS IAT
注釋
1.^ 依據Unicode 15.0
2.^ 灰色區域表示未分配的代碼點。
3.^ 黑色區域表示非字符英語Universal_Character_Set_characters#Non-characters(保證在Unicode標準中永遠不會被分配為編碼字符的碼位)。

歷史

參考資料

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.