文字 (Unicode)
维基百科,自由的 encyclopedia
在Unicode中,一种文字(script)是字母和其他书面符号的一个集合,用于在一个或多个书写系统(writing system)中表示文本信息。[1]有些文字只支持一种书写系统和语言,例如亚美尼亚语。其他文字支持许多不同的书写系统:例如,拉丁文字支持英语、法语(英语:French orthography)、德语、意大利语(英语:Italian alphabet)、越南语、拉丁语本身以及其他多种语言。一些语言有多种可选的书写系统,因而也就使用多种文字:例如,在土耳其语中,阿拉伯文字在20世纪之前使用,但在20世纪初过渡到拉丁文字。有关每种文字支持的语言列表,请参阅按文字列出的语言列表(英语:List of languages by writing system)。符号和Unicode控制字符某种程度上与文字互补。
统一化后的变音字符和标点字符经常具有“通用”或“继承”的文字属性。然而,独立的文字往往有自己的标点和变音符号,以至于许多文字不仅包含字母,还包含变音符号等标记、标点、数字,甚至还有自己的特殊符号和空格字符。
Unicode 15.0定义了161种独立的文字,包括94种现代文字和67种古代或历史文字。[2][3]更多的文字正在编码过程中,有的已被临时分配予计划中的编码。[4]