トップQs
タイムライン
チャット
視点
ベンガル文字 (Unicodeのブロック)
ウィキペディアから
Remove ads
ベンガル文字(ベンガルもじ、英語: Bengali)は、Unicodeの24個目のブロック。
解説
南アジアに位置するバングラデシュ及びインド・西ベンガル州の公用語であるベンガル語や、インド・アッサム州の公用語であるアッサム語、インド・マニプル州の公用語であるマニプル語の表記に用いられるベンガル文字(及びアッサム文字)を収録している。
ベンガル文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/(ベンガル語では発音上は[ɔ])を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。母音記号はものによっては文字の左側に付けられたり、子音字を左右から挟む形で付加されるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。
また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるホロント記号という記号を子音字の下に付加したりする。例えば子音字kaকの後にホロント記号と子音字ssaষが後続するとkssaক্ষという合字が形成される。[1]
書字方向はラテン文字やキリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送る。単語毎に分かち書きをし、デーヴァナーガリーやグルムキー文字などと同様に同じ単語内ではシローレーカー(śirorekhā)と呼ばれる上部の水平線を繋げて書かれる。
子音字は有声音と無声音の弁別に加えて、有気音であるか無気音であるかを区別する。そのため、各調音点における破裂音には計4種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられているが、現在のベンガル語では発音上は区別されないものもある。
符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。
加えて、アラビア文字やタイ文字などと同様に独自の数字体系(ベンガル数字)を有している。
Unicodeのバージョン1.0においても「ベンガル文字(Bengali)」というブロック名で制定されていた。[2]
Remove ads
収録文字
要約
視点
「ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919に従う。
Remove ads
小分類
要約
視点
このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「従属母音記号」(Dependent vowel signs)、「2要素からなる母音記号」(Two-part dependent vowel signs)、「ヴィラーマ」(Virama)、「追加の子音字」(Additional consonants)、「記号」(Sign)、「サンスクリット語用の追加母音字」(Additional vowels for Sanskrit)、「予約済」(Reserved)、「数字」(Digits)、「アッサム語用の追加」(Additions for Assamese)、「通貨記号」(Currency symbols)、「小数値用の歴史的記号」(Historic symbols for fractional values)、「歴史的な通貨記号」(Historic currency sign)の15個となっている。[3]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。
各種記号(Various signs)
この小分類にはベンガル文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。
独立母音字(Independent vowels)
この小分類にはベンガル文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。
子音字(Consonants)
この小分類にはベンガル文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。なお、現在のベンガル語では短語末にある子音字は原則として母音が脱落して子音字のみで読まれる。
従属母音記号(Dependent vowel signs)
この小分類にはベンガル文字のうち、子音字に結合する母音記号が収録されている。文字によっては子音字の左側に結合されるため文字の符号上の順序とレンダー上の順序が入れ替わる場合があり、また、組み合わせる先の子音字によっては特殊な合字を形成することがある。
2要素からなる従属母音記号(Two-part dependent vowel signs)
これらの母音記号には、子音の両側にグリフ部分があり、論理的な順序で子音に続くため、ほとんどの処理では 1 つの単位として扱われる。[3]
ヴィラーマ(Virama)
この小分類にはベンガル文字のうち、ホロント(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。但し、文字によっては半子音字形を持たずただ単にホロントが子音字の下に付く場合もある。
なお、小分類名のヴィラーマはホロントと等価の記号のデーヴァナーガリー(ヒンディー語)における名称である。
追加の子音字(Additional consonants)
この小分類にはベンガル文字のうち、元々のブラーフミー文字にない拡張子音字が収録されている。
ヌクター付きの3つの子音字は、CompositionExclusions.txt にリストされており、正規化中に再構成されない。これらの文字のNFC 形式は、分解されたシーケンスと同じである。[3]
記号(Sign)
この小分類にはベンガル文字のうち、様々な目的で用いられる記号類が収録されている。
サンスクリット語用の追加母音字(Additional vowels for Sanskrit)
この小分類にはベンガル文字のうち、サンスクリット語の表記に用いられる音節主音化した母音字としての流音の文字が収録されている。
予約済(Reserved)
この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点(Generic punctuation for scripts of India)」に相当する。
なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する。これらの句読点はベンガル語ではdahri及びdouble dahriと呼ばれる。[3][18]
数字(Digits)
この小分類にはベンガル文字で用いられる固有の数字が収録されている。
アッサム語用の追加(Additions for Assamese)
通貨記号(Currency symbols)
この小分類にはベンガル文字において用いられる通貨単位の記号が2種類収録されている。
小数値用の歴史的記号(Historic symbols for fractional values)
この小分類にはベンガル文字において小数値を表す際に歴史的に用いられていた数値記号が収録されている。
これらの記号は、文字名にもかかわらず、通貨に限定して使用されるものではない。[3]
歴史的な通貨記号(Historic currency sign)
この小分類にはベンガル文字において歴史的に用いられていた通貨単位の記号が1種類のみ収録されている。
Remove ads
文字コード
ベンガル文字(Bengali)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+098x | ঀ | ঁ | ং | ঃ | অ | আ | ই | ঈ | উ | ঊ | ঋ | ঌ | এ | |||
U+099x | ঐ | ও | ঔ | ক | খ | গ | ঘ | ঙ | চ | ছ | জ | ঝ | ঞ | ট | ||
U+09Ax | ঠ | ড | ঢ | ণ | ত | থ | দ | ধ | ন | প | ফ | ব | ভ | ম | য | |
U+09Bx | র | ল | শ | ষ | স | হ | ় | ঽ | া | ি | ||||||
U+09Cx | ী | ু | ূ | ৃ | ৄ | ে | ৈ | ো | ৌ | ্ | ৎ | |||||
U+09Dx | ৗ | ড় | ঢ় | য় | ||||||||||||
U+09Ex | ৠ | ৡ | ৢ | ৣ | ০ | ১ | ২ | ৩ | ৪ | ৫ | ৬ | ৭ | ৮ | ৯ | ||
U+09Fx | ৰ | ৱ | ৲ | ৳ | ৴ | ৵ | ৶ | ৷ | ৸ | ৹ | ৺ | ৻ | ৼ | ৽ | ৾ | |
注釈
|
履歴
要約
視点
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
Remove ads
出典
関連項目
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads