cover image

UTF-8

統一碼編碼不同的字節倍數 / 維基百科,自由的 百科全書

UTF-88-bit Unicode Transformation Format)是一種針對Unicode可變長度字元編碼,也是一綴碼。它可以用一至四節對Unicode字符集中的所有有效編碼點進編碼屬於Unicode准的一部分,最初由肯·布·派克提出。[2][3]於較小值的編碼點一般使用高,直接使用Unicode編碼效率低下,大量浪費內存空。UTF-8就是了解兼容ASCII設計,Unicode中前128字符,使用ASCII相同的二制值的單個編碼,而且字面ASCII的字面一一對應,這使得原來處理ASCII字元的軟體無須或只須做少部份修改,即可繼續使用。因此,它逐漸成為電子郵件網頁及其他儲存或傳送文字優先採用的編碼方式。

Quick facts: 語言, 標准, 分類, 拓展自, 變換/編碼...
UTF-8
國際
Unicode
EASCII
變長編碼variable-width encoding
Unicode轉換格式
拓展自US-ASCII
變換/編碼ISO 10646 (Unicode)
前用UTF-1
Close
顯示了谷歌所記錄的2001年至2012年主要編碼方法的使用情況,[1]2008年,UTF-8的使用率超所有其他編碼方式,在2012年超所有網頁的60%。其中ASCII only包括所有包含ASCII字符的網頁無論數據明如何。

自2009年以,UTF-8一直是全球資訊網的最主要的編碼形式(所有,而不是Unicode范圍內編碼)(由WHATWG宣布為強制性的「適所有事物(for all things)[4]截止到2019年11月, 在所有網頁中,UTF-8編碼應用率高94.3%(其中一些是ASCII編碼,因它是UTF-8的子集),而在排名最高的1000個網頁中占96%。[5] 第二熱門的多字節編碼方式Shift JIS和GB 2312分具有0.3%和0.2%的占有率。[6][7][1]Internet盟( Internet Mail Consortium, IMC)建所有件程序都能使用UTF-8展示和件,[8] W3C建UTF-8作XML文件和HTML文件的默認編碼方式。[9]網際網路工程工作小組(IETF)要求所有網際網路協議都必須支持UTF-8編碼[10]互聯網郵件聯盟(IMC)建議所有電子郵件軟件都支持UTF-8編碼。[11]