热门问题
时间线
聊天
视角

表意文字描述字符

来自维基百科,自由的百科全书

Remove ads

表意文字描述字符(英語:Ideographic Description Character,IDC)是一块收录描述表意文字(如汉字)结构的符号Unicode區段,其中部分描述符号编码于其他区段。

事实速览 表意文字描述字符 Ideographic Description Characters, 範圍 ...

目前大部份編碼包含Unicode,處理漢字編碼時大致是先搜集漢字,给予每个漢字一个數字編碼。然而,漢字數量龐大,字集往往不完全;再加上漢字本身是開放組合,漢字的使用者很可能自造新字,不可能有一个可以搜集到所有漢字的字集,所以用這些字符描述某「字」如何以較簡單的部件組合起來。

Remove ads

码表

表意文字描述字符
Ideographic Description Characters
[1][2]
Unicode 联盟官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+2FFx ⿿
注释
1. ^ 依据 Unicode 15.1

表意文字描述序列

表意文字描述序列(英語:Ideographic Description Sequence,IDS)是Unicode標準定義的漢字結構描述語法,描述序列由描述字符與兩个以上特定字元(主要為漢字)組合而成,表示漢字的抽象結構。

Unicode定義了16種組合字符:

更多信息 編碼, 字符 ...

另有两个描述符号并不在此区段内:

更多信息 編碼, 字符 ...

還有一個字元「⬚」,編碼是U+2B1A,雖然名稱只是「dotted square(點狀虛線的正方形)」,但也常配合表意文字描述字符使用,指無法分割的整體字。

IDS的運算方式是前綴表示法,運算子在前,對應數量的運算元在後。這種方式不需使用括號等字元輔助即可无歧義地表示運算順序。

统一碼標準中,表意文字描述序列之定義如下:[5]

IDS := 漢字 | 部首 | 中日韓筆畫 | 私人造字區 | U+FF1F | IDS二元運算子 IDS IDS | IDS三元運算子 IDS IDS IDS
IDS二元運算子 := U+2FF0 | U+2FF1 | U+2FF4 | U+2FF5 | U+2FF6 | U+2FF7 | U+2FF8 | U+2FF9 | U+2FFA | U+2FFB
IDS三元運算子 := U+2FF2 | U+2FF3

按此,合規範的IDS必須由漢字、中日韓部首字元、中日韓筆畫字元(U+31C0-U+31EF)、私人造字、全形問號字元(U+FF1F),以IDC連接而成。

Remove ads

限制

  • Unicode無定義漢字的唯一表述方式,依現行提案一漢字可用多種IDS表達,如「巫」可表示為「⿻工从」或「⿻工⿰人人」。
  • IDS主要目的在於表達漢字的抽象結構,而非像組合字符一樣用於動態組字。現實繪製合體字字形時須考量許多複雜要素,光用IDS不足以繪出符合一般要求的合成字,例如合體字上下、左右比例往往並非1:1,而是按二部件的實際外形調整;左上-右下、三方包圍等組合字的比例計算則更複雜;上下交疊的兩部件也需要依賴對漢字的一般認識才能正確解讀,例如「⿻工从」是將兩个「人」放到「工」的左右兩開口裡,而非簡單地將「工」和「从」上下疊合。

历史

Loading content...

另見

Loading content...

參考文獻

外部連結

Loading content...
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads