トップQs
タイムライン
チャット
視点

キリル文字 (Unicodeのブロック)

ウィキペディアから

Remove ads

キリル文字(キリルもじ、英語: Cyrillic)は、Unicodeの9つ目のブロック

概要 範囲, 面 ...
Remove ads

解説

ロシア語ウクライナ語ブルガリア語などの東欧地域のスラヴ語派に属する言語や、モンゴル語カザフ語キルギス語などの中央アジアのテュルク系あるいはモンゴル系の言語、サハ語タタール語チェチェン語などのロシア連邦内の共和国や少数民族の間で用いられている言語の表記において広く用いられているキリル文字を収録している。

現在キリル文字を用いて表記する言語のほか、アゼルバイジャン語ウズベク語トルクメン語など、現在はラテン文字などの別の文字体系が使われるものの、かつて正書法がキリル文字であった言語の文字や、古代教会スラヴ語古東スラヴ語のように現在死語となった言語や18世紀ごろまでのロシア語やセルビア語などの表記に用いられていた初期キリル文字英語版、かつて用いられていたキリル数字を表記するための記号なども含まれている。

Unicodeのバージョン1.0においても「キリル文字(Cyrillic)」というブロック名で制定されていた。[1]

Unicodeが登場する以前のキリル文字の文字コード規格であるISO/IEC 8859-5ISO 10754フランス語版などに由来する文字セットを元に、いくつかのUnicode Consortium宛の提案文書由来の拡張文字が加えられている。

なお、斜体(イタリック体)で表示する場合や、セルビア語ブルガリア語においてはロシア語などのキリル文字立体(ローマン体)と異なる字形で表示される文字がいくつか存在するが、Unicode上のコード位置は統合されている。これらの字形差を正しく表示するためにはHTMLなどの言語タグ(ISO 639など)やfont-style要素を使用できる環境において、スタイル及び言語ごとの字形差変化に対応したフォントに対してfont-style・言語タグを指定することで適切に表示することが可能となる。[2]

また、古い文献などでは現代の活字と大きく異なる字形の書体であるウスタフ体ロシア語版が用いられているが、書体の違いによる字形差はUnicode上では通常のキリル文字と統合されている。この場合については、対応する書体のフォントを使用することでのみ表示が可能である。

Remove ads

収録文字

要約
視点

本節における日本語名称は特記がない限りWorld Wide Web Consortiumより[3]。なお、言語名の後に括弧書きで年号や年号の範囲が書かれているものについては、その期間でのみ使われたことがあり、現在では廃字となってその言語では用いられなくなっていることを表す。また、小分類『基本ロシア語用アルファベット』の文字については用例・説明欄に特に記載が無い限りは多くの言語で共通して使われている。

さらに見る コード, 文字 ...
Remove ads

小分類

要約
視点

このブロックの小分類は「キリル拡張」(Cyrillic extensions)、「基本ロシア語用アルファベット」(Basic Russian alphabet)、「歴史的文字」(Historic letters)、「歴史的二重音字」(Historic digraphs)、「その他の歴史的記号」(Historic miscellaneous)、「拡張キリル文字」(Extended Cyrillic)、「ニヴフ語用の追加文字」(Additions for Nivkh)の7個となっている。[4]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。

キリル拡張(Cyrillic extensions

この小分類にはロシア連邦及び東欧諸国の言語で用いられるキリル文字のうち、後述する「基本ロシア語用アルファベット」に含まれない文字を収録している。この小分類に含まれる文字の大部分はキリル文字の文字コードであるISO/IEC 8859-5に由来しており、のちにUnicodeのバージョン3.0で4つのブルガリア語用の文字が追加された。

基本ロシア語用アルファベット(Basic Russian alphabet

この小分類にはキリル文字のうち、多くの言語で共通して用いられる基本的な文字を収録している。小分類名は「ロシア語用(Russian)」となっているが、ロシア語表記に必要な文字のうち唯一Ёのみは前項のキリル拡張ブロックに含まれている。前項の「キリル文字拡張」と併せてISO/IEC 8859-5に収録されている文字をカバーしている。

歴史的文字(Historic letters

この小分類にはキリル文字のうち、古代教会スラヴ語や中世ロシア語で用いられていた、現在は廃止され使われなくなったキリル文字(初期キリル文字)を収録している。

歴史的二重音字(Historic digraphs

この小分類にはキリル文字のうち、現在は廃止され使われなくなったキリル文字の合字UKの大文字・小文字の2文字のみを収録している。

その他の歴史的記号(Historic miscellaneous

この小分類にはキリル文字のうち、歴史的な数字であるキリル数字で用いられる記号や、古い文献などで用いられていた結合記号などを収録している。Unicodeのバージョン3.0でキリル数字用のの二つの記号(U+0488、U+0489)が、[7]バージョン5.1で省略などを表すU+0487が追加された。[6]

拡張キリル文字(Extended Cyrillic

この小分類にはキリル文字のうち、中央アジアコーカサス地方などの旧ソ連加盟国及び現ロシア連邦を構成する共和国やロシア国内に住む少数民族が用いる諸言語を表記するための拡張キリル文字を収録している。Unicodeのバージョン1.1でISO 10754フランス語版を由来とするものを含む38個の文字が、バージョン3.0で6つの文字が、[7]バージョン3.2でキルディン・サーミ語用の8つの文字が、[8]バージョン4.1でシベリア・ユピック語用の2つの文字が、[9]バージョン5.0でコーカサス諸語で用いられるパローチカの小文字U+04CFが追加された。[10]

ニヴフ語用の追加文字(Additions for Nivkh

この小分類にはキリル文字のうち、樺太北部及びアムール川下流域に住むニヴフ人が話すニヴフ語の表記に用いられる6つの文字を収録している。[11][12][13]バージョン5.0で追加された。

文字コード

キリル文字(Cyrillic)[1]
Official Unicode Consortium code chart (PDF)
 0123456789ABCDEF
U+040x Ѐ Ё Ђ Ѓ Є Ѕ І Ї Ј Љ Њ Ћ Ќ Ѝ Ў Џ
U+041x А Б В Г Д Е Ж З И Й К Л М Н О П
U+042x Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
U+043x а б в г д е ж з и й к л м н о п
U+044x р с т у ф х ц ч ш щ ъ ы ь э ю я
U+045x ѐ ё ђ ѓ є ѕ і ї ј љ њ ћ ќ ѝ ў џ
U+046x Ѡ ѡ Ѣ ѣ Ѥ ѥ Ѧ ѧ Ѩ ѩ Ѫ ѫ Ѭ ѭ Ѯ ѯ
U+047x Ѱ ѱ Ѳ ѳ Ѵ ѵ Ѷ ѷ Ѹ ѹ Ѻ ѻ Ѽ ѽ Ѿ ѿ
U+048x Ҁ ҁ ҂ ҃ ҄ ҅ ҆ ҇ ҈ ҉ Ҋ ҋ Ҍ ҍ Ҏ ҏ
U+049x Ґ ґ Ғ ғ Ҕ ҕ Җ җ Ҙ ҙ Қ қ Ҝ ҝ Ҟ ҟ
U+04Ax Ҡ ҡ Ң ң Ҥ ҥ Ҧ ҧ Ҩ ҩ Ҫ ҫ Ҭ ҭ Ү ү
U+04Bx Ұ ұ Ҳ ҳ Ҵ ҵ Ҷ ҷ Ҹ ҹ Һ һ Ҽ ҽ Ҿ ҿ
U+04Cx Ӏ Ӂ ӂ Ӄ ӄ Ӆ ӆ Ӈ ӈ Ӊ ӊ Ӌ ӌ Ӎ ӎ ӏ
U+04Dx Ӑ ӑ Ӓ ӓ Ӕ ӕ Ӗ ӗ Ә ә Ӛ ӛ Ӝ ӝ Ӟ ӟ
U+04Ex Ӡ ӡ Ӣ ӣ Ӥ ӥ Ӧ ӧ Ө ө Ӫ ӫ Ӭ ӭ Ӯ ӯ
U+04Fx Ӱ ӱ Ӳ ӳ Ӵ ӵ Ӷ ӷ Ӹ ӹ Ӻ ӻ Ӽ ӽ Ӿ ӿ
注釈
1.^バージョン15.1時点
Remove ads

履歴

要約
視点

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

さらに見る バージョン, コードポイント ...
Remove ads

出典

関連項目

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads