热门问题
时间线
聊天
视角

ISO/IEC 8859-1

字符編碼 来自维基百科,自由的百科全书

Remove ads

ISO 8859-1,正式編號為ISO/IEC 8859-1:1998,又稱Latin-1或「西歐語言」,是國際標準化組織ISO/IEC 8859的第一個8位字符集。它以ASCII為基礎,在空置的0xA0-0xFF的範圍內,加入96個字母符號,藉以供使用附加符號拉丁字母語言使用。曾推出過 ISO 8859-1:1987 版。

ISO-8859-1的別名有: iso-ir-100csISOLatin1latin1l1IBM819Oracle資料庫WE8ISO8859P1[1]

與Windows-1252的區別

網際網路上,常見把Windows-1252編碼的文本誤標稱為ISO-8859-1,最常見後果是引號與撇號‘ ’“ ”在非Windows環境下被當作不識別字符顯示為問號或方塊(boxes)字符。大部分現代網頁瀏覽器與e-mail客戶端把網際網路媒體類型字符集為ISO-8859-1當作Windows-1252來處理。HTML5標準要求把宣稱為ISO-8859-1的文本當作Windows-1252編碼來解析。[2]

截至2017年10月 (2017-10),4.5%聲明是ISO 8859-1編碼。[3]這包含了未知數量的實際上是Windows-1252或UTF-8編碼的網頁常常被瀏覽器識別為ISO 8859-1編碼。

ISO-8859-1與Windows-1252代碼頁的區別是:碼位128至159(十六進制80至9F)原本是罕用的C1控制字符編碼範圍,被替換為額外的一些常用但未包含在ISO-8859-1中的字符。實際上Windows-1252代碼頁包含了所有出現在ISO-8859-15中的字符。ISO-8859-1對應的Windows代碼頁是Windows-28591[4]然而,英文版的Windows 7、Windows10家庭中文版系統上沒有Windows-28591代碼頁。

Remove ads

與ISO/IEC 10646即Unicode的關係

ISO-8859-1對應於ISO/IEC 10646即Unicode的前256個碼位。

適用語言

此字符集支持部分於歐洲使用的語言,包括阿爾巴尼亞語巴斯克語布列塔尼語加泰隆尼亞語丹麥語荷蘭語法羅語弗里西語加利西亞語德語格陵蘭語冰島語愛爾蘭蓋爾語義大利語拉丁語盧森堡語挪威語葡萄牙語里托羅曼斯語蘇格蘭蓋爾語西班牙語瑞典語

英語雖然沒有重音字母,但仍會標明為ISO/IEC 8859-1編碼。除此之外,歐洲以外的部分語言,如南非荷蘭語斯瓦希里語印尼語馬來語、菲律賓他加洛語等也可使用ISO/IEC 8859-1編碼。

法語芬蘭語本來也使用ISO/IEC 8859-1來表示。但因它沒有法語使用的 œŒŸ 三個字母及芬蘭語使用的 ŠšŽž ,故於1998年被ISO/IEC 8859-15所取代。(ISO 8859-15同時加入了歐元符號)

字符集

更多資訊 ISO/IEC 8859-1, x0 ...

在上表中,0x20是空格、0xA0是不換行空格、0xAD是選擇性連接號

0x00-0x1F、0x7F、0x80-0x9F在此字符集中未有定義。(控制字符是由ISO/IEC 6429定義)。

Remove ads

參考資料

參閲

外部連結

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads