热门问题
时间线
聊天
视角

Windows-1252

来自维基百科,自由的百科全书

Windows-1252
Remove ads

Windows-1252CP-1252拉丁字母字元编码,主要用于英文、 爱尔兰语、意大利语、挪威语、葡萄牙语、西班牙语、瑞典语以及德语、芬兰语、冰岛语、法语、荷兰语(除了IJ字符)、斯洛文尼亚语(除了č字符)等西方文字版本 Microsoft Windows 的预设编码,为Windows代码页之一。LaTeX软件称之为“ansinew”。

Thumb
Windows-1252,有时误称为“ANSI”。蓝点代表未有使用的或控制字元

详情

此编码是 ISO 8859-1超集,但和 IANA 的 ISO-8859-1 分别在于在 80 至 9F (hex) 范围使用可显示字元而非控制字元。在 Windows 称为代码页1252,还有个 IANA 登记名称“Windows‑1252”。此代页码包含所有 ISO 8859-15 中的可显示字(但部分码位不同)。

常见错误是将 Windows-1252 文本误标为 ISO-8859-1 字元集。常见的结果是所有引号和撇号(由 Microsoft 软件的“smart quotes”功能产生)在非 Windows 操作系统都变成问号或方格。为了解决此问题,现在大部分网页浏览器和电邮用户端都懂得将 MIME 字元集 ISO-8859-1 视作 Windows-1252 处理。这也是 HTML5 草稿规格要求的处理方式,要求将自称是 ISO-8859-1 的文件视作 Windows-1252 编码。[1]

在 Windows,“ANSI代码页” (ACP) 是用来指称多个不同的代码页,其中一个就是真的是 ANSI(美国国家标准协会)标准,例如 ISO-8859-1。虽然 Windows-1252 是首个,也是最流行的 Windows 代码页,但其从来不是正式 ANSI 标准。

Remove ads

代码页配置

下表显示 Windows-1252 代码页。每个字元同时显示其 Unicode 码位和十进制值。Unicode 的参考值使用“最适”原则。[2]

图例:黄格是控制字元、蓝格是标点、紫格是数字、绿格是 ASCII 字母、橙格是国际字母。和 ISO-8859-1 有分别的地方以粗绿框表示。

更多信息 _0, _1 ...

根据 Microsoft 和 Unicode 协会的网站,81、8D、8F、90 和 9D 都未有使用;但 Windows API MultiByteToWideChar 会将此等码位对映至 C1控制字元

旧版在没有欧元符号、带抑扬符(ˇ)的 S、s、Z 和 z。

Remove ads

另见

  • 西方拉丁字元集
  • Windows-1250

注释

外部链接

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads