トップQs
タイムライン
チャット
視点

基本ラテン文字 (Unicodeのブロック)

ASCII と同じ文字を含む Unicode ブロック (U+0000-007F) ウィキペディアから

Remove ads

基本ラテン文字(きほんラテンもじ、英語: Basic Latin)は、Unicodeの1つ目のブロックである。ASCII文字コードの全ての文字(基本ラテン文字制御文字)が、同じ順番・同じコードで収録されている。C0制御文字及び基本ラテン文字(C0 Controls and Basic Latin)ともいう。UTF-8において、収録されたキャラクタが1バイトで表現できる唯一のブロックである。

概要 基本ラテン文字, 範囲 ...

基本ラテン文字ブロックはUnicode バージョン1.0.0から最新のバージョンまでの全てに含まれ、その間文字の追加・変更が行われていない[3]

Remove ads

収録文字

さらに見る コード, 文字 ...
A  U+005C(\)は、日本語フォントでは円記号、韓国語フォントではウォン記号として表示される場合がある[4]。この表ではこれらのフォントでもバックスラッシュとして表示されるようにしてある。
Remove ads

小分類

このブロックには6つの小分類(subheading)がある[5]

C0制御文字

C0制御文字英語版は、Unicodeバージョン1.0では「C0 ASCII制御文字(C0 ASCII control codes)」と呼ばれ、ASCIIや他の7ビット・8ビット文字コードから継承されている。英語の文字名はISO/IEC 6429:1992から取られている[5]

ASCIIの約物と記号

この小分類には、英文における標準的な約物、単純な数学記号、ドル記号・パーセント・アンパサンド・アンダースコア・パイプなどの記号が含まれている[5]

ASCIIの数字

この小分類には、1-9および0のアラビア数字が含まれている[5]

大文字のラテン文字

この小分類には、標準的な26文字のアクセントのない大文字のラテン文字が含まれている[5]

小文字のラテン文字

この小分類には、標準的な26文字のアクセントのない小文字のラテン文字が含まれている[5]

制御文字

「制御文字」小分類には削除文字(DEL)のみが含まれている[5]

Remove ads

文字コード表

C0制御文字及び基本ラテン文字(C0 Controls and Basic Latin)[1]
Official Unicode Consortium code chart (PDF)
 0123456789ABCDEF
U+000x  NUL   SOH   STX   ETX   EOT   ENQ   ACK   BEL    BS     HT     LF     VT     FF     CR     SO     SI  
U+001x  DLE   DC1   DC2   DC3   DC4   NAK   SYN   ETB   CAN    EM    SUB   ESC    FS     GS     RS     US  
U+002x   SP    ! " # $  % & ' ( ) * + , - . /
U+003x 0 1 2 3 4 5 6 7 8 9  :  ; < = >  ?
U+004x @ A B C D E F G H I J K L M N O
U+005x P Q R S T U V W X Y Z [ \ ] ^ _
U+006x ` a b c d e f g h i j k l m n o
U+007x p q r s t u v w x y z { | } ~  DEL 
備考
1.^ Unicode バージョン 9.0 現在

絵文字

基本ラテン文字ブロックには、U+0023, U+002A, U+0030–U+0039の12文字の絵文字が含まれている[6][7]。これらは、U+20E3 combining enclosing keycapと組み合わせて電話機の押しボタンを表す(例: # (U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBINING ENCLOSING KEYCAP) )

この12文字に対し2種類の異体字セレクタ、絵文字表示(U+FE0F VS16)かテキスト表示(U+FE0E VS15)が適用できる。いずれも、デフォルトはテキスト表示である[8]

絵文字の異体字シーケンス
U+0023002A0030003100320033003400350036003700380039
base code point#*0123456789
base+VS15 (text)#*0123456789
base+VS16 (emoji)#*0123456789
Remove ads

履歴

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

さらに見る バージョン, コードポイント ...
Remove ads

関連項目

出典

外部リンク

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads