热门问题
时间线
聊天
视角
表意文字描述字元
来自维基百科,自由的百科全书
Remove ads
表意文字描述字元(英語:Ideographic Description Character,IDC)是一塊收錄描述表意文字(如漢字)結構的符號的Unicode區段,其中部分描述符號編碼於其他區段。
目前大部份編碼包含Unicode,處理漢字編碼時大致是先搜集漢字,給予每個漢字一個數字編碼。然而,漢字數量龐大,字集往往不完全;再加上漢字本身是開放組合,漢字的使用者很可能自造新字,不可能有一個可以搜集到所有漢字的字集,所以用這些字元描述某「字」如何以較簡單的部件組合起來。
Remove ads
碼表
表意文字描述字元 Ideographic Description Characters [1][2] Unicode 聯盟官方碼表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+2FFx | ⿰ | ⿱ | ⿲ | ⿳ | ⿴ | ⿵ | ⿶ | ⿷ | ⿸ | ⿹ | ⿺ | ⿻ | | | | |
注釋
|
表意文字描述序列
表意文字描述序列(英語:Ideographic Description Sequence,IDS)是Unicode標準定義的漢字結構描述語法,描述序列由描述字元與兩個以上特定字元(主要為漢字)組合而成,表示漢字的抽象結構。
Unicode定義了16種組合字元:
另有兩個描述符號並不在此區段內:
還有一個字元「⬚」,編碼是U+2B1A,雖然名稱只是「dotted square(點狀虛線的正方形)」,但也常配合表意文字描述字元使用,指無法分割的整體字。
IDS的運算方式是前綴表示法,運算子在前,對應數量的運算元在後。這種方式不需使用括號等字元輔助即可無歧義地表示運算順序。
統一碼標準中,表意文字描述序列之定義如下:[5]
IDS := 漢字 | 部首 | 中日韓筆畫 | 私人造字區 | U+FF1F | IDS二元運算子 IDS IDS | IDS三元運算子 IDS IDS IDS
IDS二元運算子 := U+2FF0 | U+2FF1 | U+2FF4 | U+2FF5 | U+2FF6 | U+2FF7 | U+2FF8 | U+2FF9 | U+2FFA | U+2FFB
IDS三元運算子 := U+2FF2 | U+2FF3
按此,合規範的IDS必須由漢字、中日韓部首字元、中日韓筆畫字元(U+31C0-U+31EF)、私人造字、全形問號字元(U+FF1F),以IDC連接而成。
Remove ads
限制
歷史
另見
參考文獻
外部連結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads