热门问题
时间线
聊天
视角

區域指示符

来自维基百科,自由的百科全书

Remove ads

區域指示符(英語:regional indicator symbols)是一組用以對ISO 3166-1二位字母代碼標準的二字母國家地區代碼進行編碼的26個Unicode字符。這種編碼允許對於特定地區的符號進行特殊處理。

2010年10月,Unicode 6.0的發布為國家地區旗幟的繪文字表示提供了區域指示符,作為「對每一面旗幟都進行編碼」的替代方案。除了作為拉丁字母顯示外,這些符號的部分組合還可以在一些設備上渲染成符號對應的國家地區旗幟[1][2]Unicode FAQ頁面存檔備份,存於網際網路檔案館)表明,國家與地區的旗幟不會在Unicode中直接編碼到單獨的碼位上去,而應當以此法編碼。[3]

在Unicode編碼中,這些符號位於U+1F1E6 🇦 REGIONAL INDICATOR SYMBOL LETTER AU+1F1FF 🇿 REGIONAL INDICATOR SYMBOL LETTER Z之間,在第一輔助平面帶圈字母數字補充區段英語Enclosed Alphanumeric Supplement[4]

Remove ads

繪文字旗幟列表

在一些系統中,旗幟的繪文字可能會顯示為二位國家地區代碼。[5]

一組區域指示符稱為一個「繪文字旗幟序列」,雖然其代碼代表的是地區而非旗幟。[6]

在所有的26 × 26 = 676個雙字母組合中只有270個是合法的Unicode地區代碼,包含了通用當地數據儲存庫(CLDR)的以下子集:[6][7][8]

  • CLDR中全部的256個常規的地區代碼序列
  • CLDR中的兩個宏觀區域(macroregion)的代碼序列(EU與UN)
  • CLDR中全部12個已棄用的地區代碼序列(僅作向前兼容用)
更多信息 旗幟, 代碼 ...
更多信息 已棄用的文字序列, 取而代之的文字序列[10][11] ...
Remove ads

Unicode區段

帶圈字母數字補充區段英語Enclosed Alphanumeric Supplement[1]的區域指示符部分

Unicode聯盟官方碼表頁面存檔備份,存於網際網路檔案館) (PDF)

  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1F1Ex (U+1F100–U+1F1E5 已省略)   🇦     🇧     🇨     🇩     🇪     🇫     🇬     🇭     🇮     🇯  
U+1F1Fx   🇰     🇱     🇲     🇳     🇴     🇵     🇶     🇷     🇸     🇹     🇺     🇻     🇼     🇽     🇾     🇿  
Notes
1.^ 依據Unicode 13.0
Remove ads

背景

在2007年,Unicode收到了一份對於廣泛使用的繪文字編碼提案,這份提案上的繪文字主要出自日本通訊公司NTT DOCOMOKDDI軟銀集團之手。[12]提案中的符號包含了下列十面旗幟[13] 中國(🇨🇳)、 德國(🇩🇪)、 西班牙(🇪🇸)、 法國(🇫🇷)、 英國(🇬🇧)、 義大利(🇮🇹)、 日本(🇯🇵)、 南韓(🇰🇷)、 俄羅斯(🇷🇺)和 美國(🇺🇸)。有觀點認為,僅僅對於這十面旗幟編碼這一做法包含偏見。[14]一個被駁回的編碼提案是,在保留旗幟的情況下,稱它們為「繪文字兼容字符-n」(EMOJI COMPATIBILITY SYMBOL-n)並以標準「EC n」顯示,而不展示它們代表的旗幟;[15]另一個被駁回的提案為676種雙字母組合中每一種都分配了碼位,以ISO 3166標準(如FR代表法國)或國家和地區頂級域(如EU代表歐盟)與旗幟對應。[16]

最終被接受的方案添加了與拉丁字母相對應的26個字符以表示區域指示符,當其按照上文的序列出現時會呈現出對應的旗幟,同時為繪文字的擴充預留了空間以供後續添加。[2]根據Unicode標準,「此類[區域指示符的]組合的主要目的是,為表情符號核心集合中使用的特定字符提供明確雙向映射」(the main purpose of such [regional indicator symbol] pairs is to provide unambiguous roundtrip mappings to certain characters used in the emoji core sets[17],此處特指以下十面國旗:[18]🇨🇳、🇩🇪、🇪🇸、🇫🇷、🇬🇧、🇮🇹、🇯🇵、🇰🇷、🇷🇺和🇺🇸。

由於Unicode的區域指示符只提供地區代碼、不提供旗幟,特定的系統可以採取不渲染字符的方式以避免引起非議。如在台灣問題中,對於實際統治台灣地區台北政府北京政府拒絕承認,因此在中國大陸的新聞媒體報道中,中華民國國旗會被作馬賽克處理,而在大陸法律下的電子產品,「🇹🇼」也會顯示為字符缺失或不作為旗幟顯示。[19][20]

參見

註釋

參考文獻

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads