热门问题
时间线
聊天
视角
代码页437
来自维基百科,自由的百科全书
Remove ads
代码页437(Code page 437)是始祖IBM PC(个人电脑)或MS-DOS使用的字元编码。又名为CP437、OEM 437[1] PC-8[2]、或MS-DOS Latin US[3]。该字集包含ASCII由32–126的字码、附加符号、一些希腊字母、图示以及制图符号。其有时也称为“OEM字型”或“high ASCII”或“extended ASCII”[2](互不兼容的众多ASCII扩充字集之一)。

严格来说,此字元集并非打算用来做什么“代码页”;而只不过是在当时的IBM PC用来图像化的表现字形而已。此字元集仍然是所有EGA以及VGA相容显示卡核心的主要字型。当电脑开机时,在加载任何储存媒体之前所使用的就是此“代码页”。[4]。大多数在IBM PC时代开发的档案格式,例如.nfo,都是内定以此为预设编码。
显示卡
最初的IBM PC以每个字元9×14像素的形式储存在MDA显示卡旳唯读记忆体,以及以每个字元8×8像素的形式储存在CGA显示卡。EGA包含的是8×14像素的版本,而VGA包含的是9×16像素的版本。
此等显示卡全都有文字模式,当中每个字元方块包含8位元的字元码位,亦即提供一共256个字元。所有256个码位都分配予唯读记忆体中的图像字元,当中0至31的码位保留予ASCII用作非图像控制字元。
代码页
代码页有两个主要功:
- 作为资讯交换码(以档案和电讯形式),当中0至127码位担当的角式与ASCII的相同,而128至175码位代表国际文字字元(见下表);
- 作为用于萤幕和印表机的图像资源(该字元可用于显示或打印),整段256个码位范围都可用作图像字元。
字元
以下字表显示代码页437的字元。每个字元同时显示其对应的Unicode码位及其十进位值。
1–31和127码位(00–1Fhex和7Fhex)可用作控制或图像字元,视情况而定。[5]
Remove ads
除了0至31(00hex至1Fhex)可用作ASCII控制码及图像dingbat以外,某些字元也有多于一个意义。对应的Unicode有可能多于一个,视情况而定:
- 0和255(FFhex)都会产生空格;32(20hex)也是。将255用作U+00A0不换行空格(NBSP)在IBM PC时代的文书处理软件已有先例。
- 176至223(B0hex至DFhex)为方框绘制字符
- 225(E1hex)是德文的sharp S(U+00DF, ß),也是希腊文的小阶beta(U+03B2, β)。
- 227(E3hex)是希腊文小阶的pi(U+03C0, π),但早期的字型,例如Terminal使用的字型并不明确,有可能是希腊文大阶的pi(U+03A0, Π),也可以是“n次积符号”(U+220F, ∏)。
- 228(E4hex)是“n次叠加符号”(U+2211, ∑),也是希腊文大写的sigma(U+03A3, Σ)。
- 230(E6hex)是微的符号(U+00B5, µ),也是希腊文小写的mu(U+03BC, μ)。
- 234(EAhex)是欧姆符号(U+2126, Ω),也是希腊文大写的omega(U+03A9, Ω)。(Unicode将欧姆符号等同大写omega,并建议两种情况都用后者)[7]).
- 235(EBhex)是希腊文小写delta(U+03B4, δ),但也用作冰岛文小写的 eth(U+00F0, ð)和偏微分符号(U+2202, ∂)的替代品。
- 237(EDhex)应当用作希腊文小写的phi,但现在主要用作空集符号(U+2205, ),还用作用来表示角度的斜体希腊文phi符号(U+03D5, )、直径符号(U+2300, )以及拉丁文小写“带斜线的小写O”(U+00F8, ø)的替代品。
- 238(EEhex)既是希腊文小写的epsilon(U+03B5, ε),也是element-of符号(U+2208, ∈)。后来还用作欧元符号(U+20AC, €)。
Remove ads
另见
参考资料
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads