热门问题
时间线
聊天
视角
Windows-1252
来自维基百科,自由的百科全书
Remove ads
Windows-1252 或 CP-1252 是拉丁字母的字元編碼,主要用於英文、 愛爾蘭語、義大利語、挪威語、葡萄牙語、西班牙語、瑞典語以及德語、芬蘭語、冰島語、法語、荷蘭語(除了IJ字符)、斯洛維尼亞語(除了č字符)等西方文字版本 Microsoft Windows 的預設編碼,為Windows代碼頁之一。LaTeX軟體稱之為「ansinew」。

詳情
此編碼是 ISO 8859-1 的超集,但和 IANA 的 ISO-8859-1 分別在於在 80 至 9F (hex) 範圍使用可顯示字元而非控制字元。在 Windows 稱為代碼頁1252,還有個 IANA 登記名稱「Windows‑1252」。此代頁碼包含所有 ISO 8859-15 中的可顯示字(但部份碼位不同)。
常見錯誤是將 Windows-1252 文本誤標為 ISO-8859-1 字元集。常見的結果是所有引號和撇號(由 Microsoft 軟體的「smart quotes」功能產生)在非 Windows 操作系統都變成問號或方格。為了解決此問題,現在大部份網頁瀏覽器和電郵用戶端都懂得將 MIME 字元集 ISO-8859-1 視作 Windows-1252 處理。這也是 HTML5 草稿規格要求的處理方式,要求將自稱是 ISO-8859-1 的文件視作 Windows-1252 編碼。[1]
在 Windows,「ANSI代碼頁」 (ACP) 是用來指稱多個不同的代碼頁,其中一個就是真的是 ANSI(美國國家標準協會)標準,例如 ISO-8859-1。雖然 Windows-1252 是首個,也是最流行的 Windows 代碼頁,但其從來不是正式 ANSI 標準。
Remove ads
代碼頁配置
下表顯示 Windows-1252 代碼頁。每個字元同時顯示其 Unicode 碼位和十進位值。Unicode 的參考值使用「最適」原則。[2]
圖例:黃格是控制字元、藍格是標點、紫格是數字、綠格是 ASCII 字母、橙格是國際字母。和 ISO-8859-1 有分別的地方以粗綠框表示。
根據 Microsoft 和 Unicode 協會的網站,81、8D、8F、90 和 9D 都未有使用;但 Windows API MultiByteToWideChar
會將此等碼位對映至 C1控制字元。
Remove ads
另見
- 西方拉丁字元集
- Windows-1250
注釋
外部連結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads