トップQs
タイムライン
チャット
視点

ブロック (Unicode)

Unicodeにおける符号位置の連続する範囲 ウィキペディアから

Remove ads

Unicodeにおいて、ブロック英語: block)とは、符号位置 (code points) の連続する範囲を意味する。ブロックには一意に名前が付けられ、重なりはない。各ブロックは hhh0 形式の開始符号位置と hhhF 形式の終了符号位置を持つ。ブロックは、未割当 (unassigned) または非文字 (non-character) である符号位置 (en) を、明示的に含むことができる[1]。名前付きのブロックのいずれにも属さない符号位置、例えば未割当のである第4面-第13面に属する符号位置は、ブロックとして「No_block」という値を持つ。

逆に言えば、割当済 (assigned) の符号位置はすべて「ブロック名」(Block name) という特性英語版 (property) を持つ。これはその文字 (character) があるブロックの名前である。これは符号位置のみによって決定されるが、ブロック名には説明的な性質がある。例えば「チベット文字」(Tibetan) や「補助矢印A」(Supplemental Arrows-A) が典型である。すべての割当済の符号位置は、それぞれ単一のブロック名を持つ。

その他の記号 (Miscellaneous symbols) ブロック中の「チェスシンボル英語版」(Chess symbols) のような下位区分は、「ブロック」ではない。下位グループの名前は有益な編集上の追加でしかない。

一個のブロックに含まれる符号位置の数は16の倍数になる。ブロックの範囲の大きさは、最小で16個から、最大で65,536個の符号位置までである。

Unicode 9.0 では273個のブロックが定義されている[2]

  • 第0面の基本多言語面 (Basic Multilingual Plane; BMP) に、161個。
  • 第1面の追加多言語面 (Supplementary Multilingual Plane; SMP) に、103個。
  • 第2面の追加漢字面 (Supplementary Ideographic Plane; SIP) に、5個。
  • 第14面(十六進数表記でE)の追加特殊用途面 (Supplementary Special-purpose Plane; SSP) に、2個 。
  • 第15面 (Fhex) と第16面 (10hex) の私用面に、それぞれ補助私用領域A (Supplementary Private Use Area-A)、補助私用領域B (Supplementary Private Use Area-B) という名前のブロックが1個ずつ。
Remove ads

ブロックの一覧

ブロックについてはUnicodeコンソーシアムに資料※があり、本一覧表との相違を本一覧表の次に示す。相違はおおむね本一覧表が古いことによる。 ※出元:15.1:<https://www.unicode.org/Public/15.1.0/ucd/Blocks.txt> ※出元:16.0 draft:<https://www.unicode.org/Public/draft/UCD/ucd/Blocks.txt>

さらに見る 面, ブロックの範囲 ...
本一覧表とUnicodeコンソーシアムの資料※との相違。 ※出元:<https://www.unicode.org/Public/15.1.0/ucd/Blocks.txt> ※出元:<https://www.unicode.org/Public/draft/UCD/ucd/Blocks.txt>
U+0860U+086FSyriac Supplementシリア文字拡張16
シリア文字補助
U+1000U+109FMyanmarビルマ文字160
ミャンマー文字
U+18B0U+18FFUnified Canadian Aboriginal Syllabics Extended統合カナダ先住民文字拡張80
統合カナダ先住民音節拡張
U+1950U+197FTai Leタイ・ナ文字48
タイ・レ文字
U+1980U+19DFNew Tai Lue新タイロ文字96
新タイ・ルー文字
U+A9E0U+A9FFMyanmar Extended-Bビルマ文字拡張B32
ミャンマー文字拡張B
U+AA60U+AA7FMyanmar Extended-Aビルマ文字拡張A
ミャンマー文字拡張A
U+AA80U+AADFTai Vietタイ・ヴィエト文字96
タイ・ヴェト文字
U+10280U+1029FLycianリュキア文字32
リキア文字
U+10920U+1093FLydianリュディア文字
リディア文字
U+10B60U+10B7FInscriptional Pahlavi碑文パフラヴィ文字
碑文パフラヴィー文字
U+10B80U+10BAFPsalter Pahlavi詩編パフラヴィ文字48
詩編パフラヴィー文字
U+10E60U+10E7FRumi Numeral Symbolsルミ数字記号32
ルーミー数字記号
U+111E0U+111FFSinhala Archaic Numbers旧シンハラ数字
シンハラ旧数字
U+11400U+1147FNewaネワ文字128
ネワール文字
<要追加>
U+11B00U+11B5FDevanagari Extended-Aデーヴァナーガリー文字拡張A96
U+13430U+1343FEgyptian Hieroglyph Format Controlsエジプト聖刻文字書式制御記号16
U+1345F48# ブロックが拡張されている(16→48)。
<要追加>
U+16A70U+16ACFTangsaタングサ文字96
U+1E100U+1E14FNyiakeng Puachue HmongNyiakeng Puachue Hmong文字80
ニアケン・プアチュ・フモン文字
U+1E290U+1E2BFTotoトト48
トト文字
Remove ads

脚注

出典

関連項目

外部リンク

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads