トップQs
タイムライン
チャット
視点
テルグ文字 (Unicodeのブロック)
ウィキペディアから
Remove ads
テルグ文字(テルグもじ、英語: Telugu)は、Unicodeの29個目のブロック。
解説
インド南東部のアーンドラ・プラデーシュ州およびテランガーナ州で話されているドラヴィダ語族のテルグ語を表記するためのテルグ文字を収録している。
テルグ文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生したいわゆるブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。
また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるハラント(halant)という記号を子音字の上に付加したりする。
書字方向はラテン文字やキリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。なお、デーヴァナーガリーやベンガル文字とは異なり文字の上部に水平線(シローレーカー)は持たない。
子音字は有声音と無声音の弁別に加えて、有気音であるか無気音であるかを区別する。そのため、各調音点における破裂音には計4種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられている。
符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。
加えて、アラビア文字やタイ文字などと同様に独自の数字体系(テルグ数字)を有している。
Unicodeのバージョン1.0においても「テルグ文字(Telugu)」というブロック名で制定されていた。[1]
Remove ads
収録文字
要約
視点
「ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919(および一部はIAST)に従う。
Remove ads
小分類
要約
視点
このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「サンスクリット語用の追加」(Addition for Sanskrit)、「従属母音記号」(Dependent vowel signs)、「ヴィラーマ」(Virama)、「歴史的な音声記号用異体字」(Historic phonetic variants)、「サンスクリット語用の追加母音字」(Additional vowels for Sanskrit)、「予約済」(Reserved)、「数字」(Digits)、「記号」(Sign)、「テルグ分数および重量単位記号」(Telugu fractions and weights)の12個となっている。[11]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。
各種記号(Various signs)
この小分類にはテルグ文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。
独立母音字(Independent vowels)
この小分類にはテルグ文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。
子音字(Consonants)
この小分類にはテルグ文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。
サンスクリット語用の追加(Addition for Sanskrit)
この小分類にはテルグ文字のうち、サンスクリット語の翻字に用いられる記号1つのみが収録されている。
従属母音記号(Dependent vowel signs)
この小分類にはテルグ文字のうち、子音字に結合する母音記号が収録されている。組み合わせる先の子音字によっては特殊な合字を形成することがある。
ヴィラーマ(Virama)
この小分類にはテルグ文字のうち、ハラント(halant)(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。ただし、文字によっては半子音字形を持たずただ単にハラントが子音字の上に付く場合もある。
なお文字名および小分類名の「ヴィラーマ(virama)」とはデーヴァナーガリーにおける同様の機能を持つ記号の名称である。
歴史的な音声記号用異体字(Historic phonetic variants)
この小分類にはテルグ文字のうち、かつて音声記号として用いられていた拡張子音字が3つ収録されている。
サンスクリット語用の追加母音字(Additional vowels for Sanskrit)
この小分類にはテルグ文字のうち、サンスクリット語の表記に用いられる音節主音化した母音字としての流音の文字が収録されている。
予約済(Reserved)
この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点(Generic punctuation for scripts of India)」に相当する。
なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する。[2]
数字(Digits)
この小分類にはテルグ文字で用いられる固有の数字が収録されている。
記号(Sign)
この小分類にはテルグ文字のうち、テキストの冒頭で祈りの言葉(invocation)として用いられる記号1つのみが収録されている。
テルグ分数および重量単位記号(Telugu fractions and weights)
この小分類にはテルグ文字において分数や重量の単位を表すための記号が収録されている。
文字コード
テルグ文字(Telugu)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0C0x | ఀ | ఁ | ం | ః | ఄ | అ | ఆ | ఇ | ఈ | ఉ | ఊ | ఋ | ఌ | ఎ | ఏ | |
U+0C1x | ఐ | ఒ | ఓ | ఔ | క | ఖ | గ | ఘ | ఙ | చ | ఛ | జ | ఝ | ఞ | ట | |
U+0C2x | ఠ | డ | ఢ | ణ | త | థ | ద | ధ | న | ప | ఫ | బ | భ | మ | య | |
U+0C3x | ర | ఱ | ల | ళ | ఴ | వ | శ | ష | స | హ | ఼ | ఽ | ా | ి | ||
U+0C4x | ీ | ు | ూ | ృ | ౄ | ె | ే | ై | ొ | ో | ౌ | ్ | ||||
U+0C5x | ౕ | ౖ | ౘ | ౙ | ౚ | ౝ | ||||||||||
U+0C6x | ౠ | ౡ | ౢ | ౣ | ౦ | ౧ | ౨ | ౩ | ౪ | ౫ | ౬ | ౭ | ౮ | ౯ | ||
U+0C7x | ౷ | ౸ | ౹ | ౺ | ౻ | ౼ | ౽ | ౾ | ౿ | |||||||
注釈
|
Remove ads
履歴
要約
視点
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
Remove ads
出典
関連項目
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads