トップQs
タイムライン
チャット
視点

タミル文字 (Unicodeのブロック)

Unicodeのブロック ウィキペディアから

Remove ads

タミル文字(タミルもじ、英語: Tamil)は、Unicodeの28個目のブロック

概要 範囲, 面 ...

解説

インド南東部のタミル・ナードゥ州インド洋の島国スリランカに加え、東南アジアマレーシアシンガポールに居住するインド系住民(印僑)の間などで話されているドラヴィダ語族タミル語を表記するためのタミル文字を収録している。

タミル文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生したいわゆるブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。母音記号はものによっては文字の左側に付けられることがあるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。

また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号である「プッリ(புள்ளி)」という点の形をした記号を子音字の上に付加する。

書字方向ラテン文字キリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。なお、デーヴァナーガリーやベンガル文字とは異なり文字の上部に水平線(シローレーカー)は持たない。

デーヴァナーガリーなどの印欧語族インド・アーリア語派の言語の表記に用いられる文字体系とは異なり、子音字において有声音であるか無声音であるか、有気音であるか無気音であるかを基本的に区別しない(ただし英語からの借用語の表記のため/ca/と/ja/のみ有声・無声が区別される)。そのため、各調音点における破裂音の子音字はそれぞれ1種類ずつしか存在しない。母音字についてはデーヴァナーガリー等と同様に母音の長短によって文字が分けられている。

符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。

加えて、アラビア文字タイ文字などと同様に独自の数字体系(タミル数字)を有している。

Unicodeのバージョン1.0においても「タミル文字(Tamil)」というブロック名で制定されていた[1]

Remove ads

収録文字

要約
視点

ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919に従う。

さらに見る コード, 文字 ...
Remove ads

小分類

要約
視点

このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「従属母音記号」(Dependent vowel signs)、「2要素からなる従属母音記号」(Two-part dependent vowel signs)、「ヴィラーマ」(Virama)「予約済」(Reserved)、「数字」(Digits)、「タミル数値」(Tamil numerics)、「タミル暦用記号」(Tamil calendrical symbols)、「タミル簿記用記号」(Tamil clerical symbols)、「通貨記号」(Currency symbol)の12個となっている。[2]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。

各種記号(Various signs

この小分類にはタミル文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。

独立母音字(Independent vowels

この小分類にはタミル文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。

子音字(Consonants

この小分類にはタミル文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。

従属母音記号(Dependent vowel signs

この小分類にはタミル文字のうち、子音字に結合する母音記号が収録されている。文字によっては子音字の左側に結合されるため文字の符号上の順序とレンダー上の順序が入れ替わる場合があり、また、組み合わせる先の子音字によっては特殊な合字を形成することがある。

2要素からなる従属母音記号(Two-part dependent vowel signs

これらの母音記号には、子音の両側にグリフ部分があり、論理的な順序で子音に続くため、ほとんどの処理では 1 つの単位として扱われる[2]

ヴィラーマ(Virama

この小分類にはタミル文字のうち、プッリ(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。基本的に単に子音字の上に点が合成されるだけであるが、前後の文字によっては特殊な合字を形成するための制御文字として機能することがある。

なお文字名および小分類名の「ヴィラーマ(virama)」とはデーヴァナーガリーにおける同様の機能を持つ記号の名称である。

プッリは通常、上部に点として表示されるが、一部のフォントでは上部にリングとして表示される。リング状のプッリを表すために 0B82 を使用しないようUnicode公式文書内で注意書きされている[2]

予約済(Reserved

この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点Generic punctuation for scripts of India)」に相当する。

なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する[2]

数字(Digits

この小分類にはタミル文字で用いられる固有の数字が収録されている。

タミル数値(Tamil numerics

この小分類にはタミル文字のうち、10以上の数を表すための数字が収録されている。

なお、Unicodeにおいて本小分類名に含まれる"numerics(数値)"は通常の10進数表現で用いられる数字を意味する"digits(数字)"とは異なり、10以上の数値や小数値・分数値などの10進数表現で用いられるものとは異なる数字体系を表すために用いられる言葉である。

また、タミル数字における分数は、U+11FC0から始まる「タミル文字補助(Tamil Supplement)」ブロックにエンコードされている[2]

タミル暦用記号(Tamil calendrical symbols

この小分類にはタミル文字においての表記に用いるための記号が収録されている。

また、他の多くの暦表記用記号は、「タミル文字補助(Tamil Supplement)」ブロックの 11FC0-11FFF にエンコードされている[2]

タミル簿記用記号(Tamil clerical symbols

この小分類にはタミル文字において簿記に用いられる記号が収録されている。

通貨記号(Currency symbol

この小分類にはタミル文字においてインド・ルピー或いはスリランカ・ルピーを表す通貨記号1つのみが収録されている。

Remove ads

文字コード

タミル文字(Tamil)[1]
Official Unicode Consortium code chart (PDF)
 0123456789ABCDEF
U+0B8x
U+0B9x
U+0BAx
U+0BBx ி
U+0BCx
U+0BDx
U+0BEx
U+0BFx
注釈
1.^バージョン15.1時点

履歴

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

さらに見る バージョン, コードポイント ...
Remove ads

出典

関連項目

Loading content...
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads