热门问题
时间线
聊天
视角

Unicode区段

統一碼(Unicode)中一個連續的代碼點範圍 来自维基百科,自由的百科全书

Remove ads
Remove ads

Unicode中,字区[1]区段(block),也译为码块[2]统一码块,是一组连续码位的范围;区段会给予唯一的名称,且区段与区段间不会重叠。通常一个最小的区段至少包含16个码位,即 hhh0到hhhF。

一个区段可以明确地包含未分配的码位和非字符。[3] 不属于任何已命名区段的码位(例如尚未正式使用的第4-第13平面),上面码位关于区段的值会被设为 block="No_block".。相反地,每个分配的代码点都有一个“区段名称”的属性,表示出这个文字所在的区段。这仅由代码点确定,尽管区段名称具有描述性质,如“藏语”或“追加箭头-A”。所有已分配的码位都有一个单独的区段名称。

有些区段会将字符分类成更详细的子群(subgroup),例如收录在U+2654到U+265F的西洋棋符号英语Chess symbols in Unicode(注意和棋类符号不一样,虽然英文一样)是收录在杂项符号区段的一部份。“西洋棋符号”仅作为给用户关于这个子群的信息补充,并不归类在Unicode定义的“区段”。

截至 Unicode 15.0 已经定义了327个区段,其中:[4]

  • 有164个区段在0号平面,或称基本多文种平面(the Basic Multilingual Plane, BMP
  • 有151个区段在1号平面,或称第一辅助平面多文种补充平面(the Supplementary Multilingual Plane, SMP
  • 有6个区段在2号平面,或称第二辅助平面表意文字补充平面(the Supplementary Ideographic Plane, SIP
  • 有2个区段在3号平面,或称第三表意文字补充平面(the Tertiary Ideographic Plane, TIP
  • 有2个区段在14号平面(在16进制为E),或称第十四辅助平面特别用途补充平面Supplementary Special-purpose Plane, SSP
  • 各有1个区段在15号平面(Fhex)和16号平面(10hex),分别为私人使用区(A区)(Private Use Area-A, PUA-A)和私人使用区(B区)(Private Use Area-B, PUA-B


更多信息 平面, 区段范围 ...
Remove ads

参考资料

Loading content...
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads