表意文字描述字符
维基百科,自由的 encyclopedia
表意文字描述字符(英语:Ideographic Description Character,IDC)是一块收录描述表意文字(如汉字)结构的符号的Unicode区段,其中部分描述符号编码于其他区段。
Quick Facts 表意文字描述字符 Ideographic Description Characters, 范围 ...
表意文字描述字符 Ideographic Description Characters | |
---|---|
范围 | U+2FF0..U+2FFF (16个码位) |
平面 | 基本多文种平面(BMP) |
文字 | 通用(英语:Script (Unicode)#Special script property values) |
已分配 | 16个码位 |
未分配 | 0个保留码位 |
来源标准 | GBK |
统一码版本历史 | |
3.0 | 12 (+12) |
15.1 | 16 (+4) |
注释:[1][2] |
Close
目前大部份编码包含Unicode,处理汉字编码时大致是先搜集汉字,给予每个汉字一个数字编码。然而,汉字数量庞大,字集往往不完全;再加上汉字本身是开放组合,汉字的使用者很可能自造新字,不可能有一个可以搜集到所有汉字的字集,所以用这些字符描述某“字”如何以较简单的部件组合起来。