トップQs
タイムライン
チャット
視点
オリヤー文字 (Unicodeのブロック)
ウィキペディアから
Remove ads
オリヤー文字(オリヤーもじ、英語: Oriya)は、Unicodeの27個目のブロック。
解説
インド東部のオリッサ州などで話されているオリヤー語を表記するためのオリヤー文字を収録している。
オリヤー文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生したいわゆるブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/(現在のオリヤー語では[ɔ])を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。母音記号はものによっては文字の左側に付けられることがあるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。
また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるヴィラーマという記号を子音字の下に付加したりする。
書字方向はラテン文字やキリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。なお、デーヴァナーガリーやベンガル文字とは異なり文字の上部に水平線(シローレーカー)は持たない。
子音字は有声音と無声音の弁別に加えて、有気音であるか無気音であるかを区別する。そのため、各調音点における破裂音には計4種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられている。
符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。
加えて、アラビア文字やタイ文字などと同様に独自の数字体系(オリヤー数字)を有している。
Unicodeのバージョン1.0においても「オリヤー文字(Oriya)」というブロック名で制定されていた。[1]なお、2012年からこの文字と言語の「オリヤー(Oriya)」という名前は、インドでは正式には「オディア(Odia)」と綴られているが、この綴りの変更は、安定性の保証によって制約されている Unicode ブロックまたは文字名には影響しない。[2]
Remove ads
収録文字
要約
視点
「ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919に従う。
Remove ads
小分類
要約
視点
このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「従属母音記号」(Dependent vowel signs)、「2要素からなる従属母音記号」(Two-part dependent vowel signs)、「ヴィラーマ」(Virama)、「追加の子音字」(Additional consonants)、「サンスクリット語用の追加母音字」(Additional vowels for Sanskrit)、「予約済」(Reserved)、「数字」(Digits)、「記号」(Sign)、「分数記号」(Fraction signs)の12個となっている。[2]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。
各種記号(Various signs)
この小分類にはオリヤー文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。
独立母音字(Independent vowels)
この小分類にはオリヤー文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。
子音字(Consonants)
この小分類にはオリヤー文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。
従属母音記号(Dependent vowel signs)
この小分類にはオリヤー文字のうち、子音字に結合する母音記号が収録されている。文字によっては子音字の左側に結合されるため文字の符号上の順序とレンダー上の順序が入れ替わる場合があり、また、組み合わせる先の子音字によっては特殊な合字を形成することがある。
2要素からなる従属母音記号(Two-part dependent vowel signs)
これらの母音記号には、子音の両側にグリフ部分があり、論理的な順序で子音に続くため、ほとんどの処理では 1 つの単位として扱われる。[2]
ヴィラーマ(Virama)
この小分類にはオリヤー文字のうち、ヴィラーマ(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。ただし、文字によっては半子音字形を持たずただ単にヴィラーマが子音字の下に付く場合もある。
追加の子音字(Additional consonants)
この小分類にはオリヤー文字のうち、元々のブラーフミー文字にない拡張子音字が収録されている。
ヌクタ付きの2つの子音は、CompositionExclusions.txt にリストされている。つまり、正規化中に再構成されない。NFC 形式は、分解されたシーケンスと同じである。[2]
サンスクリット語用の追加母音字(Additional vowels for Sanskrit)
この小分類にはオリヤー文字のうち、サンスクリット語の表記に用いられる音節主音化した母音字としての流音の文字が収録されている。
予約済(Reserved)
この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点(Generic punctuation for scripts of India)」に相当する。
なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する。[2]
数字(Digits)
この小分類にはオリヤー文字で用いられる固有の数字が収録されている。
記号(Sign)
この小分類にはオリヤー文字のうち、神の名を記す際などに用いられる記号1つのみが収録されている。
分数記号(Fraction signs)
文字コード
オリヤー文字(Oriya)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0B0x | ଁ | ଂ | ଃ | ଅ | ଆ | ଇ | ଈ | ଉ | ଊ | ଋ | ଌ | ଏ | ||||
U+0B1x | ଐ | ଓ | ଔ | କ | ଖ | ଗ | ଘ | ଙ | ଚ | ଛ | ଜ | ଝ | ଞ | ଟ | ||
U+0B2x | ଠ | ଡ | ଢ | ଣ | ତ | ଥ | ଦ | ଧ | ନ | ପ | ଫ | ବ | ଭ | ମ | ଯ | |
U+0B3x | ର | ଲ | ଳ | ଵ | ଶ | ଷ | ସ | ହ | ଼ | ଽ | ା | ି | ||||
U+0B4x | ୀ | ୁ | ୂ | ୃ | ୄ | େ | ୈ | ୋ | ୌ | ୍ | ||||||
U+0B5x | ୕ | ୖ | ୗ | ଡ଼ | ଢ଼ | ୟ | ||||||||||
U+0B6x | ୠ | ୡ | ୢ | ୣ | ୦ | ୧ | ୨ | ୩ | ୪ | ୫ | ୬ | ୭ | ୮ | ୯ | ||
U+0B7x | ୰ | ୱ | ୲ | ୳ | ୴ | ୵ | ୶ | ୷ | ||||||||
注釈
|
履歴
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
Remove ads
出典
関連項目
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads