热门问题
时间线
聊天
视角

Unicode區段

統一碼中連續的碼點區間 来自维基百科,自由的百科全书

Remove ads
Remove ads

Unicode中,字區[1]區段(block),也譯為碼塊[2]統一碼塊,是一組連續碼位的範圍;區段會給予唯一的名稱,且區段與區段間不會重疊。通常一個最小的區段至少包含16個碼位,即 hhh0到hhhF。

一個區段可以明確地包含未分配的碼位和非字元。[3] 不屬於任何已命名區段的碼位(例如尚未正式使用的第4-第13平面),上面碼位關於區段的值會被設為 block="No_block".。相反地,每個分配的代碼點都有一個「區段名稱」的屬性,表示出這個文字所在的區段。這僅由代碼點確定,儘管區段名稱具有描述性質,如「藏語」或「追加箭頭-A」。所有已分配的碼位都有一個單獨的區段名稱。

有些區段會將字元分類成更詳細的子群(subgroup),例如收錄在U+2654到U+265F的西洋棋符號英語Chess symbols in Unicode(注意和棋類符號不一樣,雖然英文一樣)是收錄在雜項符號區段的一部份。「西洋棋符號」僅作為給使用者關於這個子群的資訊補充,並不歸類在Unicode定義的「區段」。

截至 Unicode 15.0 已經定義了327個區段,其中:[4]

  • 有164個區段在0號平面,或稱基本多文種平面(the Basic Multilingual Plane, BMP
  • 有151個區段在1號平面,或稱第一輔助平面多文種補充平面(the Supplementary Multilingual Plane, SMP
  • 有6個區段在2號平面,或稱第二輔助平面表意文字補充平面(the Supplementary Ideographic Plane, SIP
  • 有2個區段在3號平面,或稱第三表意文字補充平面(the Tertiary Ideographic Plane, TIP
  • 有2個區段在14號平面(在16進制為E),或稱第十四輔助平面特別用途補充平面Supplementary Special-purpose Plane, SSP
  • 各有1個區段在15號平面(Fhex)和16號平面(10hex),分別為私人使用區(A區)(Private Use Area-A, PUA-A)和私人使用區(B區)(Private Use Area-B, PUA-B


更多資訊 平面, 區段範圍 ...
Remove ads

參考資料

Loading content...
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads