特殊 (Unicode区段)

包含一些特殊代码点和两个非字符的Unicode块 来自维基百科,自由的百科全书

特殊字符是Unicode的一个简短的区段,分配在基本多文种平面的最末端,位于U+FFF0-FFFF。在这16个码位中,有5个是从Unicode 3.0开始分配的。

  • U+FFF9 行间注解锚,标志着注解文本的开始。
  • U+FFFA 行间注解分隔符,标记注解字符的开始。
  • U+FFFB 行间注解终止符,标志着注解块的结束。
  • U+FFFC  OBJECT REPLACEMENT CHARACTER,在文本中为另一个未指定的对象提供占位符,例如在一个复合文件中。
  • U+FFFD � REPLACEMENT CHARACTER(替换字符),用于替换一个未知的、不被认可的或无法表示的字符。
  • U+FFFE <非字符-FFFE> 不是一个字符。
  • U+FFFF <非字符-FFFF> 不是一个字符。
事实速览 特殊字符 Specials, 范围 ...
特殊字符
Specials
范围U+FFF0..U+FFFF
(16个码位)
平面基本多文种平面BMP
文字通用
已分配5个码位
未分配9个保留码位
2个非字符
统一码版本历史
1.0.01 (+1)
2.12 (+1)
3.05 (+3)
码表
点击此处
注释[1][2]
关闭

FFFE和FFFF不是通常意义上的未分配字符,但不是Unicode字符。它们可以用来猜测一个文本的编码方案,因为根据定义,任何包含这些的文本都不是一个正确编码的Unicode文本。Unicode的U+FEFF BYTE ORDER MARK字符可以插在Unicode文本的开头,以表示它的字节性:一个程序在阅读这样的文本并遇到0xFFFE时,就会知道它应该为后面的所有字符转换字节顺序。

它在Unicode 1.0中的区段名是特殊。[3]

特殊字符[1][2][3]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+FFFx IAA IAS IAT
注释
1.^ 依据Unicode 15.0
2.^ 灰色区域表示未分配的代码点。
3.^ 黑色区域表示非字符英语Universal_Character_Set_characters#Non-characters(保证在Unicode标准中永远不会被分配为编码字符的码位)。

历史

参考资料

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.