中日韩统一表意文字

中日韩越统一表意文字
中日韩越统一表意文字
文字
上级分类	汉字字元
所属实体	通用字符集
话题方面	汉字统合
官方网站	https://unicode.org/charts/unihan.html

中日韩统一表意文字（英语：CJK Unified Ideograph），又称统汉码、统一汉字集（英语：Unihan），是指在ISO 10646与统一码标准中经过“汉字等同”处理的汉字。^[2]汉字等同（英语：Han unification^[3]）是指将中文、日文、韩文、越南文、壮文、琉球文等书写系统共通的中日韩汉字赋予相同编码的做法；^[5]被合并编码的汉字，往往起源相同、本义相通、形状大同小异。^[6]整理出来的中日韩统一表意文字，由统一码联盟建置的Unihan数据库维护。

事实速览 中日韩越统一表意文字, 文字 ...

本条目含有越南语的喃字，操作系统及浏览器须支持相关字符渲染才能正确显示为喃字，否则可能变成乱码、问号、空格等其它符号。

[2]

[3]

[5]

[6]

ISO 10646版本	统一码版本	新增	置放平面	字数	累计字数
1993	1.1	中日韩统一表意文字（U+4E00–U+9FA5）	基本多文种平面	20902	20915
		1汉字（U+3007，〇），于中日韩符号和标点区	基本多文种平面	1
		在“中日韩兼容表意文字”中但实则独一的汉字（U+FA0E﨎、U+FA0F﨏、U+FA11﨑、U+FA13﨓、U+FA14﨔、U+FA1F﨟、U+FA21﨡、U+FA23﨣、U+FA24﨤、U+FA27﨧、U+FA28﨨、U+FA29﨩）^{[注 1]}	基本多文种平面	12
1999	3.0	中日韩统一表意文字扩展区A（U+3400–U+4DB5）	基本多文种平面	6582	27497
2001	3.1	中日韩统一表意文字扩展区B（U+20000–U+2A6D6）	第二辅助平面	42711	70208
2005	4.1	HKSCS-2004未加入ISO 10646的汉字（U+9FA6–U+9FB3，龦龧龨龩龪龫龬龭龮龯龰龱龲龳）和GB 18030-2000未加入ISO 10646的印刷业常用偏旁和字形部件（U+9FB4–U+9FBB，龴龵龶龷龸龹龺龻）	基本多文种平面	22	70230
2008	5.1	7日语汉字^[13]（U+9FBC–U+9FC2，龼龽龾龿鿀䜤鿂），U+4039䀹拆分为U+4039䀹和U+9FC3鿃^[14]	基本多文种平面	8	70238
2009	5.2	中日韩统一表意文字扩展区C（U+2A700–U+2B734）	第二辅助平面	4149	74395
2009	5.2	2日语用汉字（ARIB #47、#95，U+9FC4鿄，U+9FC5鿅）、1新增汉字（ARIB #93，U+9FC6鿆）、HKSCS-2004推出后新增的5香港汉字^[15]（U+9FC7–U+9FCB，鿇鿈鿉鿊鿋）	基本多文种平面	8	74395
2010	6.0	中日韩统一表意文字扩展区D（U+2B740–U+2B81D）	第二辅助平面	222	74617
2012	6.1	1汉字（U+9FCC鿌）	基本多文种平面	1	74618
2015	8.0	中日韩统一表意文字扩展区E（U+2B820–U+2CEA1）	第二辅助平面	5762	80389
2015	8.0	“急用汉字”：《通用规范汉字表》余下未收入的3字（U+9FCD–U+9FCF，鿍鿎鿏），1个从U+4CA4（䲤）分离出来的字U+9FD0（䲤），5个其他图书用字及化学元素用字（U+9FD1–U+9FD5，鿑鿒鿓鿔鿕）	基本多文种平面	9	80389
2017	10.0	中日韩统一表意文字扩展区F（U+2CEB0–U+2EBE0）	第二辅助平面	7473	87883
2017	10.0	21汉字（U+9FD6–U+9FEA，鿖鿗鿘鿙鿚鿛鿜鿝鿞鿟鿠鿡鿢鿣鿤鿥鿦鿧鿨鿩鿪）	基本多文种平面	21	87883
2018	11.0	5汉字（U+9FEB–U+9FEF，鿫鿬鿭鿮鿯），前三字是新命名的化学元素用字，后两字来自日本	基本多文种平面	5	87888
2020	13.0	中日韩统一表意文字扩展区G（U+30000–U+3134A）	第三辅助平面	4939	92857
		急用科学与技术用字^[16]（U+9FF0–U+9FFC，鿰鿱鿲鿳鿴鿵鿶鿷鿸鿹鿺鿻鿼）、10个需分离的汉字^[17]^[18]^[19]（U+4DB6–U+4DBF，䶶䶷䶸䶹䶺䶻䶼䶽䶾䶿）	基本多文种平面	23
		昆曲工尺谱用字^[20]（U+2A6D7–U+2A6DD，𪛗𪛘𪛙𪛚𪛛𪛜𪛝）	第二辅助平面	7
2021	14.0	3汉字（U+9FFD–U+9FFF，鿽鿾鿿）	基本多文种平面	3	92866
		2汉字（U+2A6DE–U+2A6DF，𪛞𪛟）	第二辅助平面	2
		4汉字（U+2B735–U+2B738，𫜵𫜶𫜷𫜸）	第二辅助平面	4
2022	15.0	中日韩统一表意文字扩展区H（U+31350–U323AF）	第三辅助平面	4192	97059
2022	15.0	1汉字（U+2B739，𫜹）	第二辅助平面	1	97059
2023	15.1	中日韩统一表意文字扩展区I（U+2EBF0–U+2EE5F）	第二辅助平面	622	97681
2025	17.0	中日韩统一表意文字扩展区J（U+323B0–U+33479）	第三辅助平面	4316	101996
		6汉字（U+2B73A－U+2B73F，𫜺𫜻𫜼𫜽𫜾𫜿）	第二辅助平面	6
		12汉字（U+2CEA2－U+2CEAD，𬺢𬺣𬺤𬺥𬺦𬺧𬺨𬺩𬺪𬺫𬺬𬺭）	第二辅助平面	12

提交源（类别）	提交量
中国大陆（国标源）	65941
香港	17654
澳门	344
台湾	58597
日本	16148
韩国	20739
朝鲜	23795
越南	13278
英国	2503
大藏经文本数据库委员会	3455
统一码协会	1019
总计	223653

类别	来源代码	名称	字数
中国大陆国标源（G）	G0	GB 2312-80	6763
	G1	GB 12345-90	2352（含58香港字和92吏读字，不包括和GB 2312重复的字）
	G3	GB 7589-87繁体版本	7237
	G5	GB 7590-87繁体版本	7039
	G7	现代汉语通用字表	42（G0、1、3、5、8未包括的字）
	G8	GB 8565.2-89	290（G0、1、3、5未包括的字）
台湾源（T）	T1	CNS 11643-1986第一字面	5401＋9计量用汉字
	T2	CNS 11643-1986第二字面	7650
	TE	CNS 11643-1986第十四字面	6319＋239中文信息交换码特字＋10施乐字符集（Xerox Character Code Standard，XCCS）特字
日本源（J）	J0	JIS X 0208-90	6335＋非汉字1个（仝）^[23]
日本源（J）	J1	JIS X 0212-90	5801
韩国源（K）	K0	KS C 5601-87	4888（含268重见字^[24]）
韩国源（K）	K1	KS C 5657-91	2856
委员会源（U）		KS C 5601-1987（当中重复的汉字）
		美国国会图书馆之东亚字符编码（East Asia Character Code，简称EACC；标准号ANSI Z39.64-1989）^[25]
		大五码
		中文信息交换码第一字面
		GB 12052-89（汉字部分）
		JEF（富士通标准）
		中国大陆电报码
		台湾电报码（CCDC）
		施乐中文编码
		人名用汉字准用字体表（人名用汉字许容字体表；日本）
		IBM选取的日本和韩国表意文字

类别	来源代码	名称	字数
中国大陆国标源（G）	G_KX	《康熙字典》	5357（独有1892字）
	G_HZ	《汉语大字典》	5888（独有339字）
	G3	GB 7589-87繁体版本	2391
	G5	GB 7590-87繁体版本	1226
	G7	现代汉语通用字表	120
	GS	新加坡汉字^[a]	226
台湾源（T）	T3	CNS 11643-1992第三字面（原为CNS 11643-1986第十四字面）新加入字符	2178
	T4	CNS 11643-1992第四字面	2917
	T5	CNS 11643-1992第五字面	395
	T6	CNS 11643-1992第六字面	197
	T7	CNS 11643-1992第七字面	133
	TF	CNS 11643-1992第十五字面	86
日本源（J）	JA	日本信息技术零售商统一当代表意文字（1993）	574
韩国源（K）	K2	PKS C 5700-1:1994
韩国源（K）	K3	PKS C 5700-2:1994	1834
越南源（V）	V0	TCVN 5773:1993	138
越南源（V）	V1	TCVN 6056:1995

类别	来源代码	名称	字数
中国大陆国标源（G）	G_KX	《康熙字典》	18486（包括在补遗篇出现的一字）
	G_HZ	《汉语大字典》	28914
	G_CY	《辞源》	66
	G_CH	《辞海》	247
	G_HC	《汉语大词典》	553
	G_BK	《中国大百科全书》	86
	G_FZ	北大方正排版系统	65
	G_4K	《四库全书》	522
香港源（H）	H	香港增补字符集（HKSCS）	1081
台湾源（T）	T4	CNS 11643-1992第四字面	3408
	T5	CNS 11643-1992第五字面	8111
	T6	CNS 11643-1992第六字面	5934
	T7	CNS 11643-1992第七字面	6299
	TF	CNS 11643-1992第十五字面	6401
日本源（J）	J3	JIS X 0213:2000，level 3	25
	J3A	JIS X 0213:2004，level 3	1
	J4	JIS X 0213:2000，level 4	277
韩国源（K）	K4	PKS 5700-3:1998	166
朝鲜源（KP）	KP0	KPS 9566-97
朝鲜源（KP）	KP1	KPS 10721-2000	5766
越南源（V）	V2	VHN 01:1998	2290
越南源（V）	V3	VHN 02:1998	425

类别	来源代码	名称	字数
中国大陆国标源（G）	G_BK	《中国大百科全书》	74
	G_FZ	北京大学方正排版系统	1
	G_HZ	《汉语大字典》	1
	G_HC	《汉语大词典》	14
	G_GH	《古代汉语词典》	50
	G_GJZ	商务印书馆用字	61
	G_XC	《现代汉语词典》	25
	G_CH	《辞海》	264
	G_KX	《康熙字典》及补遗	6
	G_CYY	中国测绘科学研究院用字	55
	G_ZFY	《汉语方言大辞典》	202
	G_ZJW	《殷周金文集成引得》	366
台湾源（T）	TC	CNS 11643-1992第12字面	634
	TD	CNS 11643-1992第13字面	767
	TE	CNS 11643-1992第14字面	350
澳门源	MAC	澳门资讯系统字集（Colectânea dos Caracteres Chineses dos Sistemas Informáticos de Macau）	16
日本源（J）	JK	日本国字集（Japanese KOKUJI Collection）	367
韩国源（K）	K5	韩国表意文字小组汉字集第五版（2001，Korean IRG Hanja Character Set 5th Edition: 2001）	404（当中主要包含古代字例）
朝鲜源（KP）	KP1	KPS 10721:2003	5357（独有1892字）
越南源（V）	V4	《喃字词典》（Từ điển chữ Nôm）［阮光红（Nguyễn Quang Hồng），2006］
		《岱喃字字典》（Từ điển chữ Nôm Tày，Hoàng Triều Ân，2006）
		《沔南喃字榜查》（Bảng tra chữ Nôm miền Nam，Vũ Văn Kính，1994）
委员会源（U）		ABC Chinese-English Dictionary（德范克，John DeFrancis等，第二版（1998），火奴鲁鲁：夏威夷大学出版社）
		耶稣基督后期圣徒教会香港分会用字
		Mathews' Chinese-English Dictionary（Robert H. Mathews（1975），剑桥：哈佛大学出版社）
		宋本《广韵》
		《中国鸟类系统检索》（郑作新等，北京：科学出版社，2000）
		段玉裁《说文解字注》

类别	来源代码	名称	字数
中国大陆国标源（G）	G_BK	《中国大百科全书》	15
	G_CH	《辞海》	112
	G_CY	《辞源》	3
	G_CYY	中国测绘科学院用字（地名用字）	98
	G_DZ	地质出版社用字	1
	G_GH	《古代汉语词典》	176
	G_HC	《汉语大词典》	7
	G_IDC	公安部身份证系统人名和地名用字	36
	G_JZ	商务印书馆用字	147
	G_KX	《康熙字典》	22
	G_RM	人民日报用字	3
	G_WZ	汉语大词典出版社用字	12
	G_XC	《现代汉语词典》	57
	G_XH	《新华字典》	4
	G_ZFY	《汉语方言大辞典》	712
	G_ZJW	《殷周金文集成引得》	1410
台湾源（T）	TC	CNS 11643-1992第12平面323字（台湾人名用字）	323
	TD	CNS 11643-1992第13平面595字（台湾人名用字）	595
	TE	CNS 11643-1992第14平面339字（台湾人名用字）	339
日本源（J）	JK	日本国字集	415
澳门源（M）	MAC	澳门资讯系统字集	48
委员会源（U）	UTC	从各处收集到的未收录汉字	227
越南源（V）	V4	《喃字词典》（Từ điển chữ Nôm）［阮光红（Nguyễn Quang Hồng），2006］	1028
		《岱喃字字典》（Từ điển chữ Nôm Tày，Hoàng Triều Ân，2006）
		《沔南喃字榜查》（Bảng tra chữ Nôm miền Nam，Vũ Văn Kính，1994）

类别	来源代码	名称	字数
中国大陆国标源（G）	G_CY	《辞源》	122
	G_FC	《现代汉语规范词典》	27
	G_IDC	公安部身份证用字	1
	G_LGYJ	《壮族嘹歌研究》	1
	G_OCD	《牛津英汉汉英词典》	2
	G_PGLG	《壮族民歌文化丛书·平果嘹歌》	70
	G_XHZ	《新华大字典》	51
	G_Z	《古壮字字典》	995
	G_ZJW	《殷周金文集成引得》	33
	G_ZYS	《壮族人民的文化遗产——方块壮字》《中国民族古文字研究》	2
日本源（J）	JMJ	日本文字信息基础工程	1645
韩国源（K）	KC	韩国历史情报统合系统	1793
澳门源（M）	MAC	澳门资讯系统字集	22
大藏经研究组（SAT）	USAT	《大正新修大藏经》（SAT版）	2884
委员会源（U）	UTC	从各处收集到的未收录汉字	1

类别	来源代码	名称	字数
中国大陆国标源（G）	G_HZR	《汉语大字典》（第二版）	878
	G_PGLG	《壮族民歌文化丛书·平果嘹歌》	13
	G_Z	《古壮字字典》	1191
韩国源（K）	KC	韩国历史情报统合系统（한국 역사 정보 통합 시스템）	428
台湾源（T）	T13	CNS 11643第19字面（将设立的新平面）	347
	TB	CNS 11643第11字面	3
	TC	CNS 11643第12字面	2
	TD	CNS 11643第13字面	1
英国源（UK）	UK	IRG N2107R2	1566
大藏经研究组（SAT）	USAT	《大正新修大藏经》（SAT版）	329
委员会源（U）	UTC	从各处收集到的未收录汉字	239

涵盖范围

名称

历史

版本

成员机构

收字来源

总计

最初期统一汉字

扩展A区

扩展B区

统一码4.1汉字

统一码5.1汉字

扩展C区

扩展D区

扩展E区

急用汉字

扩展F区

扩展G区

扩展H区

扩展I区

汉字统合

理论基础

三个原则

原字集分离原则

起源不同原则

第三个统合原则

对异体字的处理不一致

后续发展

Unihan数据库

批评

对异体字的处理

收字过少

收字过多

准则矛盾

汉字“〇”

已统一汉字

未统一汉字

技术问题

扩展B区

参见

注释

参考文献

外部链接