トップQs
タイムライン
チャット
視点
シンハラ文字 (Unicodeのブロック)
Unicodeのブロック ウィキペディアから
Remove ads
シンハラ文字(シンハラもじ、英語: Sinhala)は、Unicodeの32個目のブロック。
解説
インド洋に浮かぶ島国スリランカの公用語である、インド・ヨーロッパ語族インド・アーリア語派のシンハラ語の表記に用いられるシンハラ文字を収録している。
シンハラ文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。母音記号はものによっては文字の左側に付けられたり、子音字を左右から挟む形で付加されるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。
また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるアル・ラクナ(al-lakuna)という記号を子音字の右上に付加したりする。
書字方向はラテン文字やキリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。
子音字は有声音と無声音の弁別に加えて、有気音であるか無気音であるかを区別する。通常のブラーフミー系文字にあるこれらの区別に加えて、シンハラ文字には前鼻音化した有声破裂音にも独立した文字が割り当てられているため、各調音点における破裂音には計5種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられている。
符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っているが、インドの文字体系ではないため他のブラーフミー系文字と符号化の順序に互換性は無い。
加えて、アラビア文字やタイ文字などと同様に独自の数字体系(シンハラ数字)を有しているが、シンハラ文字においては占星術の記述に古典的に使用されたのみで、現在の通常の文章ではあまり用いられない。
Unicodeが登場する以前のシンハラ文字の文字コード規格であるSLS 1134やISO/IEC 10646-1:1993[1]などに由来する文字セットを元に、いくつかのUnicode Consortium宛の提案文書由来の拡張文字が加えられている。Unicodeのバージョン3.0で初めて追加された。
Remove ads
収録文字
要約
視点
「ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919(および一部はIAST)に従う。
Remove ads
小分類
要約
視点
このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「記号」(Sign)、「従属母音記号」(Dependent vowel signs)、「2要素からなる母音記号」(Two-part dependent vowel signs)、「占星術用数字」(Astrological digits)、「追加の従属母音記号」(Additional dependent vowel signs)、「約物」(Punctuation)の9個となっている[2]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。
各種記号(Various signs)
この小分類にはシンハラ文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。
独立母音字(Independent vowels)
この小分類にはシンハラ文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。
子音字(Consonants)
この小分類にはシンハラ文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。
記号(Sign)
この小分類にはシンハラ文字のうち、アル・ラクナ(al-lakuna)(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。ただし、文字によっては半子音字形を持たずただ単にハラントが子音字の上に付く場合もある。
従属母音記号(Dependent vowel signs)
この小分類にはシンハラ文字のうち、子音字に結合する母音記号が収録されている。組み合わせる先の子音字によっては特殊な合字を形成することがある。
2要素からなる母音記号(Two-part dependent vowel signs)
これらの母音記号には、子音の両側にグリフ部分があり、論理的な順序で子音に続くため、ほとんどの処理では 1 つの単位として扱われる。[2]
占星術用数字(Astrological digits)
これらの数字は、シンハラ・リス・イラカム(Sinhala Lith Illakkam)とも呼ばれ、主に占星術の記述に用いられた。この数字体系には、111E1-111F4 の範囲でエンコードされているシンハラ語の古典的な数字、シンハラ・イラカム(Sinhala Illakkam)とは異なり、0のプレースホルダーの概念がある。[2]
追加の従属母音記号(Additional dependent vowel signs)
この小分類にはシンハラ文字のうち、サンスクリット語に由来する音節主音化した長母音としての流音の母音記号が2つ収録されている。
約物(Punctuation)
この小分類にはシンハラ文字のうち、テキストの終端を表す約物(句読点)1文字のみが収録されている。
文字コード
シンハラ文字(Sinhala)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0D8x | ඁ | ං | ඃ | අ | ආ | ඇ | ඈ | ඉ | ඊ | උ | ඌ | ඍ | ඎ | ඏ | ||
U+0D9x | ඐ | එ | ඒ | ඓ | ඔ | ඕ | ඖ | ක | ඛ | ග | ඝ | ඞ | ඟ | |||
U+0DAx | ච | ඡ | ජ | ඣ | ඤ | ඥ | ඦ | ට | ඨ | ඩ | ඪ | ණ | ඬ | ත | ථ | ද |
U+0DBx | ධ | න | ඳ | ප | ඵ | බ | භ | ම | ඹ | ය | ර | ල | ||||
U+0DCx | ව | ශ | ෂ | ස | හ | ළ | ෆ | ් | ා | |||||||
U+0DDx | ැ | ෑ | ි | ී | ු | ූ | ෘ | ෙ | ේ | ෛ | ො | ෝ | ෞ | ෟ | ||
U+0DEx | ෦ | ෧ | ෨ | ෩ | ෪ | ෫ | ෬ | ෭ | ෮ | ෯ | ||||||
U+0DFx | ෲ | ෳ | ෴ | |||||||||||||
注釈
|
履歴
要約
視点
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
Remove ads
出典
関連項目
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads