热门问题
时间线
聊天
视角

UTF-1

来自维基百科,自由的百科全书

Remove ads

UTF-1是一種將ISO 10646 / Unicode轉化成位元組流的方式。由於其本身的設計問題,如果自中間的一個字元開始解碼,UTF-1將無法重新同步(這造成擷取的困難),而且UTF-1也沒辦法進行可靠的位元組搜尋。又因為UTF-1使用的除數不是2的冪,所以轉化得也相當緩慢。由於以上這些問題,UTF-1從來沒有得到廣泛採用,並已被UTF-8所取代。

快速預覽 語言, 現狀 ...

設計

UTF-1是一個類似於UTF-8的多位元組編碼;一個單一的Unicode代碼點可以被編碼成一個、兩個、三個或五個八位位元組。而如同UTF-8ASCII碼系列可被編碼為一個八位位元組,ASCII碼的八位位元組0X21 - 0x7E(十進制數33-126)也被用於UTF-1多位元組編碼;所以UTF-1不適合於許多網際網路協定,包括MIME

UTF-1在其他編碼里不使用C0和C1控制碼-任何0x00-0X20或0x7F-0x9F的八位位元組代表相應的在ISO-8859-1的編碼位置(分別為U+0000-0020和U+007F-009F)。這種設計有66個八位位元組的保護力求與ISO 2022相容。

UTF-1編碼系統使用190的求模運算(256-66=190),它被設計用來對完整的31位元原版通用字元集(UCS-4)進行編碼。相比較而言,UTF-8保護所有128個ASCII八位位元組,而且需要兩個跟蹤位元組的多位元組編碼才能達成這個目的,它構成對64的求模運算(8-2=6, 26=64)。BOCU-1只保護所需的相容MIME的極小集(0x00,0X07-0X0F,0X1A-0X1B和0X20),構成對243的求模運算(256-13=243)。

更多資訊 編碼位置, UTF-16BE ...
Remove ads

參見

參考文獻

  • ISO IR 178 (PDF,256 KB,不再被使用的UTF-1規範)
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads