トップQs
タイムライン
チャット
視点

アラビア文字 (Unicodeのブロック)

ウィキペディアから

Remove ads

アラビア文字(アラビアもじ、英語: Arabic)は、Unicodeの13個目のブロック

概要 範囲, 面 ...
Remove ads

解説

要約
視点

中東及び北アフリカ地域に広がるアラブ圏で広く話されている、イスラム教の聖典言語であるアラビア語に加え、イラン公用語であるペルシャ語パキスタンの公用語であるウルドゥー語アフガニスタンの公用語であるパシュトー語中華人民共和国新疆ウイグル自治区に居住するテュルク系少数民族であるウイグル人に話されているウイグル語イラクイラントルコ等のクルディスタン地域に居住するクルド人に話されているクルド語(特にソラニー方言)などの、ムスリムの多く居住するイスラム圏で用いられる他の言語の表記にも用いられるアラビア文字を収録している。

現在はアラビア文字での表記が一般的ではなくなっているものの、かつては正書法がアラビア文字であったトルコ語アゼルバイジャン語(ただしイランなどに居住するアゼルバイジャン人の話す南アゼルバイジャン語では現在もアラビア文字を用いる)、マレー語カザフ語などのための文字や、現在は死語となっているオスマン語古典アラビア語などのための文字も本ブロックに含まれている。

アラビア文字は音素文字のうち、子音のみを記述するアブジャドであり、「アブジャド」の名称もアラビア文字の古典的な並び順(アブジャド順)における最初の4文字(アリフバージームダール)に由来している。一般的な文書では母音を記述しないが、イスラム教の聖典であるクルアーン(コーラン)や、初学者及び初等教育用の教材など正しい単語の読みを明示する必要がある文書ではシャクルと呼ばれる母音記号が用いられるため、これらの記号も本ブロックに収録されている。

書字方向ヘブライ文字などと同様に右から左へと横書きされ(右横書き)、一部の例外となる文字を除いてラテン文字筆記体のように同じ単語の文字同士は繋げて綴られる。また、各文字はその単語内の位置によって独立形、語頭形、語中形、語末形の4種類の形状を取るが、本ブロック内においては単語内の位置による字形差は符号位置上は統一されており、フォント内でその挙動を制御する仕様になっている。但し、一部の文字についてはアラビア文字表示形A及びアラビア文字表示形Bブロックに単語内位置における字形差の符号位置を分けられたものが収録されている。なお、文字の語内位置による字形変化を説明する場合はゼロ幅接合子(U+200D; ZWJ)を用いることで、その字形を表現することができる。例えば字母beh(U+0628 ب)の語中形は‍ب‍U+200D U+A860 U+200Dの形で表すことができる。

なお、アラビア文字から派生した、ペルシャ語を表記するためのペルシャ文字や、ウルドゥー語の表記に用いられるウルドゥー文字パンジャーブ語ラフンダー語などの表記に用いられるシャームキー文字、かつてマレー語の表記に用いられていたジャウィ文字(ただしタイに居住するマレー系民族の話すジャウィ語では現在でも使われ、マレーシアにおいても看板などの地名表記には現在でも使われている)、インドネシアでかつてジャワ語スンダ語マドゥラ語などの表記に用いられていたぺゴン文字英語版ナイジェリアニジェールなどで話されるハウサ語及び、ブルキナファソマリで話されるフラニ語の表記に用いられるアジャミ英語版、かつてマダガスカル語の表記に用いられていたソラベ文字英語版などは文献によっては別の文字体系として扱われていることがあるが、Unicode上はアラビア文字の変種として扱われ、同じ文字体系として扱われている。また、ウルドゥー語やカシミール語の表記に用いられるアラビア文字はナスタアリーク体と呼ばれる一般的なアラビア文字とは大きく字形の異なる書体が使われているが、こちらもUnicode上はアラビア文字と同じ表記体系として扱われているため、これらの文字も本ブロックに含まれている。

Unicodeのバージョン1.0においても「アラビア文字(Arabic)」というブロック名で制定されていた。[1]

Remove ads

収録文字

要約
視点

「ラテン文字転写」の列はアラビア文字のラテン翻字方式の一つであるISO 233に従う。なお、言語名の後に括弧書きで年号や年号の範囲が書かれているものについては、その期間でのみ使われたことがあり、現在では廃字となってその言語では用いられなくなっているか、あるいは一般的な表記ではなくなっていることを表す。

さらに見る コード, 文字 (独立形) ...
Remove ads

小分類

要約
視点

このブロックの小分類は「ベースライン下方のマーカー」(Subtending marks)、「ベースライン上方のマーカー」(Supertending mark)、「根号」(Radix symbols)、「文字様記号」(Letterlike symbol)、「約物」(Punctuation)、「通貨記号」(Currency symbol)、「詩用記号」(Poetic marks)、「敬称用記号」(Honorifics)、「クルアーンの註釈記号」(Quranic annotation sign)、「拡張アラビア記号」(Extended Arabic mark)、「制御文字」(Format character)、「カシミール語用の追加文字」(Addition for Kashmiri)、「ISO 8859-6に基づく文字」(Based on ISO 8859-6)、「早期ペルシャ語及びアゼルバイジャン語用の追加文字」(Additions for early Persian and Azerbaijani)、「ISO 8859-6典拠の母音記号」(Tashkil from ISO 8859-6)、「結合用のマッダ及びハムザ」(Combining maddah and hamza)、「その他の結合記号」(Other combining marks)、「アラビア・インド数字」(Arabic-Indic digits)、「古代の文字」(Archaic letters)、「母音記号」(Tashkil)、「拡張アラビア文字」(Extended Arabic letters)、「非推奨文字」(Deprecated letter)、「高位置のハムザ」(High hamza)、「カザフ語用の二重音字」(Digraphic letters for Kazakh)、「パーカリ語用の拡張アラビア文字」(Extended Arabic letters for Parkari)、「東方アラビア・インド数字」(Eastern Arabic-Indic digits)、「シンド語用の記号」(Signs for Sindhi)の26個となっている。[6]

本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。また、収録文字が1文字しかない小分類については小分類名が単数形で表現されているが、本記事では単数形か複数形かによる小分類名の表記ゆれについては別の小分類として扱わず、同一の小分類として扱うこととする。

ベースライン下方のマーカー(Subtending marks

この小分類にはアラビア文字において文字列の下方に書かれる記号類を収録している。文字列の長さに合わせて記号の長さを伸長させてレンダーすることが望まれている。

ベースライン上方のマーカー(Supertending mark

この小分類にはアラビア文字において文字列の上方に書かれる記号類を収録している。文字列の長さに合わせて記号の長さを伸長させてレンダーすることが望まれている。

根号(Radix symbols

この小分類にはアラビア文字において根号を表す数学記号を2種類収録している。

文字様記号(Letterlike symbol

この小分類にはアラビア文字における数学記号で直線を表す記号1文字のみを収録している。[7]

約物(Punctuation

この小分類にはアラビア文字で用いられる約物類を収録している。

通貨記号(Currency symbol

この小分類にはアフガニスタンの公定通貨であるアフガニ通貨記号1文字のみを収録している。

詩用記号(Poetic marks

この小分類にはアラビア文字で書かれた詩で用いられる記号2種類のみを収録している。

敬称用記号(Honorifics

この小分類にはイスラム教において宗教上特殊な地位のある偉人や聖人の名前を記す際にその人物名の上に書かれる祈りの言葉を表す記号を収録している。[2][8]

クルアーンの註釈記号(Quranic annotation sign

この小分類にはイスラム教の聖典であるクルアーンにおいて読み方などを示すために用いられる記号類を収録している。

拡張アラビア記号(Extended Arabic mark

この小分類には10~11世紀の古代ペルシャ語及び11~16世紀の古典ペルシャ語(早期ペルシャ語)で用いられていた記号を1文字のみ収録している。

制御文字(Format character

この小分類には直前の文字がアラビア文字であることを示すために用いられる、具体的なグリフ・文字幅共に持たない制御文字1文字を収録している。

カシミール語用の追加文字(Addition for Kashmiri

この小分類にはインドパキスタンの係争中の土地であるカシミール地方で話されるカシミール語で用いられるアラビア文字の拡張文字を1文字のみ収録している。

ISO 8859-6に基づく文字(Based on ISO 8859-6

この小分類には基本的なアラビア文字の字母を収録している。小分類名の通り、アラビア文字の符号化規格の一つであるISO 8859-6に準拠している。表中で特に断りが無い限りはアラビア文字を表記に用いる多くの言語で共通して使用される。

本小分類に属するアラビア文字の名前は、ISO 8859-6 から派生したローマ字表記規則に従う。 これらは、アラビア語の文字名の実際の発音とは異なり、 例えばU+0628 ب ARABIC LETTER BEH は一般的なアラビア語の発音としては「ba'」となる。[6]

早期ペルシャ語及びアゼルバイジャン語用の追加文字(Additions for early Persian and Azerbaijani

この小分類には早期ペルシャ語及びアゼルバイジャン語で用いられるアラビア文字の拡張文字を収録している。早期ペルシャ語とは10~11世紀の古代ペルシャ語及び11~16世紀の古典ペルシャ語を纏めた総称であり、かつてのペルシャ語の正書法に用いられていた文字を収録している。[9]

なお、アゼルバイジャンにおけるアゼルバイジャン語については現在はラテン文字が主要な表記体系として用いられているが、イランなどで話される南アゼルバイジャン語では現在もアラビア文字での表記が用いられている。

ISO 8859-6典拠の母音記号(Tashkil from ISO 8859-6

この小分類にはイスラム教の聖典であるクルアーンや初学者用、あるいは初等教育用の教材などで用いられる母音などを表記するための補助記号のシャクルを収録している。

なお、小分類名の"Tashkil(タシュキール)"とはシャクルと同根の単語で、アラビア語で「シャクルを振る」という動作をあらわす単語である。

結合用のマッダ及びハムザ(Combining maddah and hamza

この小分類にはシャクルのうち、ISO 8859-6に含まれていなかった結合用のマッダとハムザを収録している。

その他の結合記号(Other combining marks

この小分類にはアラビア文字を正書法に用いる様々な言語において用いられる結合記号を収録している。

アラビア・インド数字(Arabic-Indic digits

この小分類にはアラビア語で一般的に用いられる数字である、アラビア・インド数字(あるいは単にインド数字)を収録している。元来数字はインドで誕生したものであり、それまでのアラブ圏ではアラビア文字をそのまま数字として用いる伝統的なアラビア数字(呼称が同一になってしまっているが現在のラテン文字などで用いられる算用数字とは異なる)を用いていたが、インドから数字のみの用途を持つ文字を借用した結果現在まで使われるようになった経緯がある。そのため、これらの数字は「インド数字」と呼ばれている。

この小分類に属するアラビア・インド数字はアラビア語で使用されるものだが、 イランアフガニスタンパキスタンインドの諸言語で用いられるインド数字はいくつかの数字について字形が異なる[14]ため、Unicode上では "Eastern Arabic-Indic digits"(U+06F0~06F9) として別の符号領域に分けられている。[6]

古代の文字(Archaic letters

この小分類にはアラビア文字のうち、初期の加点による書き分けが存在していなかった時代の字形を2文字収録している。

母音記号(Tashkil

この小分類にはシャクルのうち、ISO 8859-6に含まれていなかったものを収録している。

拡張アラビア文字(Extended Arabic letters

この小分類にはアラビア文字のうち、アラビア語以外のみならず、ペルシャ語ウルドゥー語パシュトー語クルド語ウイグル語カザフ語アゼルバイジャン語など、アラビア文字を正書法に用いる様々な言語において用いられる拡張文字を収録している。

非推奨文字(Deprecated letter

この小分類には他の符号化規格との互換性のために追加されたが現在はUnicode上での利用が推奨されていない文字を1文字収録している。

高位置のハムザ(High hamza

この小分類にはカザフスタンなどで話されるカザフ語において二重音字を表記する際に用いられていた文字1文字を収録している。なお、現在カザフスタンにおけるカザフ語ではアラビア文字の使用は一般的に廃止されており、通常はキリル文字で書かれるが、中華人民共和国新疆ウイグル自治区に居住するカザフ人は今でもアラビア文字を用いた表記を使用している。

カザフ語用の二重音字(Digraphic letters for Kazakh

この小分類に属する文字はカザフ語の二重音字として符号化されたが、その互換性分解は望ましい表現順序を反映していない。従って、これらのカザフ語の二重音字の表現には、代わりに要素の正しい順序を持つ2文字の綴りを使用すべきである[6]

パーカリ語用の拡張アラビア文字(Extended Arabic letters for Parkari

この小分類にはパキスタンシンド州などで話されているパーカリ・コリ語英語版(あるいは単にパーカリ語とも呼ばれる)用の拡張アラビア文字を収録している。

東方アラビア・インド数字(Eastern Arabic-Indic digits

この小分類にはアラビア文字で一般的に用いられるアラビア・インド数字のうち、イランパキスタンインドのアラビア文字を用いる言語 (ペルシア語シンド語ウルドゥー語など) で使用される[6] 字形のものを収録している。一部の数字についてアラビア語で用いられるものとは異なる字形が用いられているため符号位置が分けられている。

ウルドゥー語では更に一部の数字についてアラビア語ものともペルシャ語のものとも異なる字形が用いられることがあるが、こちらはペルシャ語のものと符号位置が統一されている。

シンド語用の記号(Signs for Sindhi

この小分類にはパキスタンシンド州などで話されるシンド語において用いられる略語記号を2種類収録している。

Remove ads

文字コード

アラビア文字(Arabic)[1]
Official Unicode Consortium code chart (PDF)
 0123456789ABCDEF
U+060x  ؀   ؁   ؂   ؃   ؄   ؅  ؆ ؇ ؈ ؉ ؊ ؋ ، ؍ ؎ ؏
U+061x ؐ ؑ ؒ ؓ ؔ ؕ ؖ ؗ ؘ ؙ ؚ ؛ ALM ؝ ؞ ؟
U+062x ؠ ء آ أ ؤ إ ئ ا ب ة ت ث ج ح خ د
U+063x ذ ر ز س ش ص ض ط ظ ع غ ػ ؼ ؽ ؾ ؿ
U+064x ـ ف ق ك ل م ن ه و ى ي ً ٌ ٍ َ ُ
U+065x ِ ّ ْ ٓ ٔ ٕ ٖ ٗ ٘ ٙ ٚ ٛ ٜ ٝ ٞ ٟ
U+066x ٠ ١ ٢ ٣ ٤ ٥ ٦ ٧ ٨ ٩ ٪ ٫ ٬ ٭ ٮ ٯ
U+067x ٰ ٱ ٲ ٳ ٴ ٵ ٶ ٷ ٸ ٹ ٺ ٻ ټ ٽ پ ٿ
U+068x ڀ ځ ڂ ڃ ڄ څ چ ڇ ڈ ډ ڊ ڋ ڌ ڍ ڎ ڏ
U+069x ڐ ڑ ڒ ړ ڔ ڕ ږ ڗ ژ ڙ ښ ڛ ڜ ڝ ڞ ڟ
U+06Ax ڠ ڡ ڢ ڣ ڤ ڥ ڦ ڧ ڨ ک ڪ ګ ڬ ڭ ڮ گ
U+06Bx ڰ ڱ ڲ ڳ ڴ ڵ ڶ ڷ ڸ ڹ ں ڻ ڼ ڽ ھ ڿ
U+06Cx ۀ ہ ۂ ۃ ۄ ۅ ۆ ۇ ۈ ۉ ۊ ۋ ی ۍ ێ ۏ
U+06Dx ې ۑ ے ۓ ۔ ە ۖ ۗ ۘ ۙ ۚ ۛ ۜ  ۝  ۞ ۟
U+06Ex ۠ ۡ ۢ ۣ ۤ ۥ ۦ ۧ ۨ ۩ ۪ ۫ ۬ ۭ ۮ ۯ
U+06Fx ۰ ۱ ۲ ۳ ۴ ۵ ۶ ۷ ۸ ۹ ۺ ۻ ۼ ۽ ۾ ۿ
注釈
1.^バージョン15.1時点
Remove ads

履歴

要約
視点

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

さらに見る バージョン, コードポイント ...
Remove ads

出典

関連項目

Loading content...
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads