UTF-7
字符編碼 / 维基百科,自由的 encyclopedia
UTF-7(全称:7位元Unicode转换格式)是一种可变长度字元编码方式,用以将Unicode字元以ASCII编码的字元串来呈现,可以应用在电子邮件传输之类的应用。
SMTP为基本的电子邮件传输标准之一,其指明了传输格式为US-ASCII,并且不允许超过ASCII所定义的字元范围以外的位元值,也就是说八位元的字串将无法正常的被传输。MIME(RFC 2045 ~ 2049)扩展了网路邮件以支援不同的媒体类型以及字元集,包含UTF-8与UTF-16的字元集皆可被指定使用。但由于MIME并未明确将Unicode定义为可支援的字元集,并且也没有说明其应如何编码,这使得既有的SMTP传输架构下仍旧无法保证可正确的处理8位元资料。base64编码也有其问题,例如甚至连纯英文的US-ASCII字元也可能会变成不可辨认;至于像是UTF-8与quoted-printable的编码结合,则需要6~9个位元来为非ASCII的字元(Unicode的基本多文种平面中定义的字元)进行编码,至于在基本多文种平面(BMP)以外的字原则需要多达12位元的长度才能完成编码。