热门问题
时间线
聊天
视角

Unicode區段

統一碼(Unicode)中一個連續的代碼點範圍 来自维基百科,自由的百科全书

Remove ads
Remove ads

Unicode中,字区[1]區段(block),也译为码块[2]統一碼塊,是一組連續碼位的範圍;區段會給予唯一的名稱,且區段與區段間不會重疊。通常一個最小的區段至少包含16個碼位,即 hhh0到hhhF。

一個區段可以明確地包含未分配的碼位和非字符。[3] 不屬於任何已命名區段的碼位(例如尚未正式使用的第4-第13平面),上面碼位關於區段的值會被設為 block="No_block".。相反地,每個分配的代碼點都有一個「區段名稱」的屬性,表示出這個文字所在的區段。這僅由代碼點確定,儘管區段名稱具有描述性質,如「藏語」或「追加箭頭-A」。所有已分配的碼位都有一個單獨的區段名稱。

有些区段会将字符分类成更详细的子群(subgroup),例如收錄在U+2654到U+265F的西洋棋符號英语Chess symbols in Unicode(注意和棋類符號不一样,虽然英文一样)是收錄在雜項符號区段的一部份。「西洋棋符號」僅作為给用户关于這個子群的信息補充,并不归类在Unicode定义的“区段”。

截至 Unicode 15.0 已經定義了327個區段,其中:[4]

  • 有164個區段在0號平面,或稱基本多文種平面(the Basic Multilingual Plane, BMP
  • 有151個區段在1號平面,或稱第一輔助平面多文種補充平面(the Supplementary Multilingual Plane, SMP
  • 有6個區段在2號平面,或稱第二輔助平面表意文字補充平面(the Supplementary Ideographic Plane, SIP
  • 有2個區段在3號平面,或稱第三表意文字補充平面(the Tertiary Ideographic Plane, TIP
  • 有2個區段在14號平面(在16進制為E),或稱第十四輔助平面特別用途補充平面Supplementary Special-purpose Plane, SSP
  • 各有1個區段在15號平面(Fhex)和16號平面(10hex),分別為私人使用區(A區)(Private Use Area-A, PUA-A)和私人使用區(B區)(Private Use Area-B, PUA-B


更多信息 平面, 區段範圍 ...
Remove ads

参考资料

Loading content...
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads