热门问题
时间线
聊天
视角
Windows-1252
来自维基百科,自由的百科全书
Remove ads
Windows-1252 或 CP-1252 是拉丁字母的字元编码,主要用于英文、 爱尔兰语、意大利语、挪威语、葡萄牙语、西班牙语、瑞典语以及德语、芬兰语、冰岛语、法语、荷兰语(除了IJ字符)、斯洛文尼亚语(除了č字符)等西方文字版本 Microsoft Windows 的预设编码,为Windows代码页之一。LaTeX软件称之为“ansinew”。

详情
此编码是 ISO 8859-1 的超集,但和 IANA 的 ISO-8859-1 分别在于在 80 至 9F (hex) 范围使用可显示字元而非控制字元。在 Windows 称为代码页1252,还有个 IANA 登记名称“Windows‑1252”。此代页码包含所有 ISO 8859-15 中的可显示字(但部分码位不同)。
常见错误是将 Windows-1252 文本误标为 ISO-8859-1 字元集。常见的结果是所有引号和撇号(由 Microsoft 软件的“smart quotes”功能产生)在非 Windows 操作系统都变成问号或方格。为了解决此问题,现在大部分网页浏览器和电邮用户端都懂得将 MIME 字元集 ISO-8859-1 视作 Windows-1252 处理。这也是 HTML5 草稿规格要求的处理方式,要求将自称是 ISO-8859-1 的文件视作 Windows-1252 编码。[1]
在 Windows,“ANSI代码页” (ACP) 是用来指称多个不同的代码页,其中一个就是真的是 ANSI(美国国家标准协会)标准,例如 ISO-8859-1。虽然 Windows-1252 是首个,也是最流行的 Windows 代码页,但其从来不是正式 ANSI 标准。
Remove ads
代码页配置
下表显示 Windows-1252 代码页。每个字元同时显示其 Unicode 码位和十进制值。Unicode 的参考值使用“最适”原则。[2]
图例:黄格是控制字元、蓝格是标点、紫格是数字、绿格是 ASCII 字母、橙格是国际字母。和 ISO-8859-1 有分别的地方以粗绿框表示。
根据 Microsoft 和 Unicode 协会的网站,81、8D、8F、90 和 9D 都未有使用;但 Windows API MultiByteToWideChar
会将此等码位对映至 C1控制字元。
Remove ads
另见
- 西方拉丁字元集
- Windows-1250
注释
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads