トップQs
タイムライン
チャット
視点
グジャラート文字 (Unicodeのブロック)
Unicodeのブロック ウィキペディアから
Remove ads
グジャラート文字(グジャラートもじ、英語: Gujarati)は、Unicodeの26個目のブロック。
解説
インド西部のグジャラート州などで話されているグジャラート語を表記するグジャラート文字を収録している。
グジャラート文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。母音記号はものによっては文字の左側に付けられることがあるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。
また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるヴィラーマという記号を子音字の下に付加したりする。例えば子音字kaકの後にヴィラーマと子音字ssaષが後続するとkssaક્ષという合字が形成される。
書字方向はラテン文字やキリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。なお、デーヴァナーガリーやベンガル文字とは異なり文字の上部に水平線(シローレーカー)は持たない。
子音字は有声音と無声音の弁別に加えて、有気音であるか無気音であるかを区別する。そのため、各調音点における破裂音には計4種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられているが、現在のグジャラート語では発音上は区別されないものもある。
符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。
加えて、アラビア文字やタイ文字などと同様に独自の数字体系(グジャラート数字)を有している。
Unicodeのバージョン1.0においても「グジャラート文字(Gujarati)」というブロック名で制定されていた。[1]
Remove ads
収録文字
要約
視点
「ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919に従う。
Remove ads
小分類
要約
視点
このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「従属母音記号」(Dependent vowel signs)、「ヴィラーマ」(Virama)、「サンスクリット語用の追加母音字」(Additional vowels for Sanskrit)、「予約済」(Reserved)、「数字」(Digits)、「省略記号」(Abbreviation sign)、「通貨記号」(Currency symbol)、「追加の子音字」(Additional consonant)、「翻字用記号」(Transliteration signs)の12個となっている。[3]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。
各種記号(Various signs)
この小分類にはグジャラート文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。
独立母音字(Independent vowels)
この小分類にはグジャラート文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。
子音字(Consonants)
この小分類にはグジャラート文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。
従属母音記号(Dependent vowel signs)
この小分類にはグジャラート文字のうち、子音字に結合する母音記号が収録されている。文字によっては子音字の左側に結合されるため文字の符号上の順序とレンダー上の順序が入れ替わる場合があり、また、組み合わせる先の子音字によっては特殊な合字を形成することがある。
ヴィラーマ(Virama)
この小分類にはグジャラート文字のうち、ヴィラーマ(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。但し、文字によっては半子音字形を持たずただ単にヴィラーマが子音字の下に付く場合もある。
サンスクリット語用の追加母音字(Additional vowels for Sanskrit)
この小分類にはグジャラート文字のうち、サンスクリット語の表記に用いられる音節主音化した母音字としての流音の文字が収録されている。
予約済(Reserved)
この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点(Generic punctuation for scripts of India)」に相当する。
なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する。[3]
数字(Digits)
この小分類にはグジャラート文字で用いられる固有の数字が収録されている。
省略記号(Abbreviation sign)
この小分類にはグジャラート文字のうち、略語に用いられる省略記号1つのみが収録されている。
通貨記号(Currency symbol)
この小分類にはグジャラート文字のうち、インド・ルピーの通貨記号1つのみが収録されている。
追加の子音字(Additional consonant)
この小分類にはグジャラート文字のうち、アヴェスター語(アヴェスター文字)の翻字に用いられる子音字1文字のみが収録されている。
翻字用記号(Transliteration signs)
この小分類にはイスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される記号[3]が収録されている。
文字コード
グジャラート文字(Gujarati)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0A8x | ઁ | ં | ઃ | અ | આ | ઇ | ઈ | ઉ | ઊ | ઋ | ઌ | ઍ | એ | |||
U+0A9x | ઐ | ઑ | ઓ | ઔ | ક | ખ | ગ | ઘ | ઙ | ચ | છ | જ | ઝ | ઞ | ટ | |
U+0AAx | ઠ | ડ | ઢ | ણ | ત | થ | દ | ધ | ન | પ | ફ | બ | ભ | મ | ય | |
U+0ABx | ર | લ | ળ | વ | શ | ષ | સ | હ | ઼ | ઽ | ા | િ | ||||
U+0ACx | ી | ુ | ૂ | ૃ | ૄ | ૅ | ે | ૈ | ૉ | ો | ૌ | ્ | ||||
U+0ADx | ૐ | |||||||||||||||
U+0AEx | ૠ | ૡ | ૢ | ૣ | ૦ | ૧ | ૨ | ૩ | ૪ | ૫ | ૬ | ૭ | ૮ | ૯ | ||
U+0AFx | ૰ | ૱ | ૹ | ૺ | ૻ | ૼ | ૽ | ૾ | ૿ | |||||||
注釈
|
履歴
要約
視点
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
Remove ads
出典
関連項目
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads