字符编码
维基百科,自由的 encyclopedia
字符编码(英语:Character encoding)、字码、字集码是把字符集中的字符为指定集合中某一对象(例如:位元模式、自然数序列、八位元或者电脉冲),以便文本在电脑中存储和通过通信网络的传递。有时,为强调其所使用的方式而使用其他术语,譬如:为说明“电脑系统‘内部’ 处理文字资料所使用的字符编码”时,会使用内码。为“不同电脑系统之间,为了‘交换’资料所采用的字符编码”时,会使用交换码。
此条目需要补充更多来源。 (2014年2月6日) |
常见的例子包括将拉丁字母表编码成摩斯电码和ASCII。其中,ASCII将字母、数字和其它符号编号,并用7位元的二进制来表示这个整数。通常会额外使用一个扩充的位元,以便于以1个字节的方式存储。
在电脑技术发展的早期,如ASCII(1963年)和EBCDIC(1964年)这样的字符集逐渐成为标准。但这些字符集的局限很快就变得明显,于是人们开发了许多方法来扩展它们。对于支持包括东亚CJK字符家族在内的写作系统的要求能支持更大量的字符,并且需要一种系统而不是临时的方法实现这些字符的编码。