印度文字资讯交换码
维基百科,自由的 encyclopedia
印度文字资讯交换码(英:Indian Script Code for Information Interchange,缩:ISCII,印度文: सूचना अन्तरविनिमय के लिए भारतीय लिपि संहिता,IS13194:1991)是一种编码系统,其对象为多种在印度所使用的书写系统。它包含婆罗米系文字,所支持的文字包含了:阿萨姆文、孟加拉文、天城文、古吉拉特文、古木基文、卡纳达文、马拉雅拉姆文、奥里亚文、淡米尔文和泰卢固文。 它不支持由阿拉伯文所派生出来的印度书写系统。 但它仍混和使用喀什米尔语、信德语、乌尔都语、波斯语、普什图语和阿拉伯语。由阿拉伯语派生的书写系统则采用之后的波斯阿拉伯文字资讯交换码。
婆罗米系书写系统在结构上类似,只是使用不同的字母外形。此编码将相同音的编在相同码位。如 0xB3 0xDB 代表 [ki]。在天城文中产生 कि ,在古木基文中为 ਕਿ,在淡米尔文中则为 கி 。在富文件可以利用标记来选择或在纯文件中使用 ATR 码。
使用此方法的动机为,它可以很容易地在不同书写系统间做转写。然而,其彼此间的不兼容又使得这在实现不容易。见 关于印度文字资讯交换码(页面存档备份,存于互联网档案馆)。
此编码是八位元编码。其较低的 128 码位为纯ASCII,其较高 128 码位为此编码专用。除了表示字符的码位,此编码还包括一个记忆用码位,用来指示接下来的字节包含两种资讯之一。一种会改变书写系统直到下一个书写系统指示器或行结尾。另一种则选择显示模式,如粗体或斜体。此编码并未提供默认书写系统。