トップQs
タイムライン
チャット
視点
タミル文字 (Unicodeのブロック)
Unicodeのブロック ウィキペディアから
Remove ads
タミル文字(タミルもじ、英語: Tamil)は、Unicodeの28個目のブロック。
解説
インド南東部のタミル・ナードゥ州やインド洋の島国スリランカに加え、東南アジアのマレーシア、シンガポールに居住するインド系住民(印僑)の間などで話されているドラヴィダ語族のタミル語を表記するためのタミル文字を収録している。
タミル文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生したいわゆるブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。母音記号はものによっては文字の左側に付けられることがあるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。
また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号である「プッリ(புள்ளி)」という点の形をした記号を子音字の上に付加する。
書字方向はラテン文字やキリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。なお、デーヴァナーガリーやベンガル文字とは異なり文字の上部に水平線(シローレーカー)は持たない。
デーヴァナーガリーなどの印欧語族インド・アーリア語派の言語の表記に用いられる文字体系とは異なり、子音字において有声音であるか無声音であるか、有気音であるか無気音であるかを基本的に区別しない(ただし英語からの借用語の表記のため/ca/と/ja/のみ有声・無声が区別される)。そのため、各調音点における破裂音の子音字はそれぞれ1種類ずつしか存在しない。母音字についてはデーヴァナーガリー等と同様に母音の長短によって文字が分けられている。
符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。
加えて、アラビア文字やタイ文字などと同様に独自の数字体系(タミル数字)を有している。
Unicodeのバージョン1.0においても「タミル文字(Tamil)」というブロック名で制定されていた[1]。
Remove ads
収録文字
要約
視点
「ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919に従う。
Remove ads
小分類
要約
視点
このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「従属母音記号」(Dependent vowel signs)、「2要素からなる従属母音記号」(Two-part dependent vowel signs)、「ヴィラーマ」(Virama)「予約済」(Reserved)、「数字」(Digits)、「タミル数値」(Tamil numerics)、「タミル暦用記号」(Tamil calendrical symbols)、「タミル簿記用記号」(Tamil clerical symbols)、「通貨記号」(Currency symbol)の12個となっている。[2]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。
各種記号(Various signs)
この小分類にはタミル文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。
独立母音字(Independent vowels)
この小分類にはタミル文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。
子音字(Consonants)
この小分類にはタミル文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。
従属母音記号(Dependent vowel signs)
この小分類にはタミル文字のうち、子音字に結合する母音記号が収録されている。文字によっては子音字の左側に結合されるため文字の符号上の順序とレンダー上の順序が入れ替わる場合があり、また、組み合わせる先の子音字によっては特殊な合字を形成することがある。
2要素からなる従属母音記号(Two-part dependent vowel signs)
これらの母音記号には、子音の両側にグリフ部分があり、論理的な順序で子音に続くため、ほとんどの処理では 1 つの単位として扱われる[2]。
ヴィラーマ(Virama)
この小分類にはタミル文字のうち、プッリ(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。基本的に単に子音字の上に点が合成されるだけであるが、前後の文字によっては特殊な合字を形成するための制御文字として機能することがある。
なお文字名および小分類名の「ヴィラーマ(virama)」とはデーヴァナーガリーにおける同様の機能を持つ記号の名称である。
プッリは通常、上部に点として表示されるが、一部のフォントでは上部にリングとして表示される。リング状のプッリを表すために 0B82 を使用しないようUnicode公式文書内で注意書きされている[2]。
予約済(Reserved)
この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点(Generic punctuation for scripts of India)」に相当する。
なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する[2]。
数字(Digits)
この小分類にはタミル文字で用いられる固有の数字が収録されている。
タミル数値(Tamil numerics)
この小分類にはタミル文字のうち、10以上の数を表すための数字が収録されている。
なお、Unicodeにおいて本小分類名に含まれる"numerics(数値)"は通常の10進数表現で用いられる数字を意味する"digits(数字)"とは異なり、10以上の数値や小数値・分数値などの10進数表現で用いられるものとは異なる数字体系を表すために用いられる言葉である。
また、タミル数字における分数は、U+11FC0から始まる「タミル文字補助(Tamil Supplement)」ブロックにエンコードされている[2]。
タミル暦用記号(Tamil calendrical symbols)
この小分類にはタミル文字において暦の表記に用いるための記号が収録されている。
また、他の多くの暦表記用記号は、「タミル文字補助(Tamil Supplement)」ブロックの 11FC0-11FFF にエンコードされている[2]。
タミル簿記用記号(Tamil clerical symbols)
この小分類にはタミル文字において簿記に用いられる記号が収録されている。
通貨記号(Currency symbol)
Remove ads
文字コード
タミル文字(Tamil)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0B8x | ஂ | ஃ | அ | ஆ | இ | ஈ | உ | ஊ | எ | ஏ | ||||||
U+0B9x | ஐ | ஒ | ஓ | ஔ | க | ங | ச | ஜ | ஞ | ட | ||||||
U+0BAx | ண | த | ந | ன | ப | ம | ய | |||||||||
U+0BBx | ர | ற | ல | ள | ழ | வ | ஶ | ஷ | ஸ | ஹ | ா | ி | ||||
U+0BCx | ீ | ு | ூ | ெ | ே | ை | ொ | ோ | ௌ | ் | ||||||
U+0BDx | ௐ | ௗ | ||||||||||||||
U+0BEx | ௦ | ௧ | ௨ | ௩ | ௪ | ௫ | ௬ | ௭ | ௮ | ௯ | ||||||
U+0BFx | ௰ | ௱ | ௲ | ௳ | ௴ | ௵ | ௶ | ௷ | ௸ | ௹ | ௺ | |||||
注釈
|
履歴
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
Remove ads
出典
関連項目
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads