トップQs
タイムライン
チャット
視点
基本ラテン文字 (Unicodeのブロック)
ASCII と同じ文字を含む Unicode ブロック (U+0000-007F) ウィキペディアから
Remove ads
基本ラテン文字(きほんラテンもじ、英語: Basic Latin)は、Unicodeの1つ目のブロックである。ASCII文字コードの全ての文字(基本ラテン文字と制御文字)が、同じ順番・同じコードで収録されている。C0制御文字及び基本ラテン文字(C0 Controls and Basic Latin)ともいう。UTF-8において、収録されたキャラクタが1バイトで表現できる唯一のブロックである。
基本ラテン文字ブロックはUnicode バージョン1.0.0から最新のバージョンまでの全てに含まれ、その間文字の追加・変更が行われていない[3]。
Remove ads
収録文字
Remove ads
小分類
このブロックには6つの小分類(subheading)がある[5] 。
C0制御文字
C0制御文字は、Unicodeバージョン1.0では「C0 ASCII制御文字(C0 ASCII control codes)」と呼ばれ、ASCIIや他の7ビット・8ビット文字コードから継承されている。英語の文字名はISO/IEC 6429:1992から取られている[5]。
ASCIIの約物と記号
この小分類には、英文における標準的な約物、単純な数学記号、ドル記号・パーセント・アンパサンド・アンダースコア・パイプなどの記号が含まれている[5]。
ASCIIの数字
大文字のラテン文字
この小分類には、標準的な26文字のアクセントのない大文字のラテン文字が含まれている[5]。
小文字のラテン文字
この小分類には、標準的な26文字のアクセントのない小文字のラテン文字が含まれている[5]。
制御文字
Remove ads
文字コード表
C0制御文字及び基本ラテン文字(C0 Controls and Basic Latin)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+000x | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
U+001x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
U+002x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
U+003x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
U+004x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
U+005x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
U+006x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
U+007x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
備考
|
絵文字
基本ラテン文字ブロックには、U+0023, U+002A, U+0030–U+0039の12文字の絵文字が含まれている[6][7]。これらは、U+20E3 ⃣ combining enclosing keycapと組み合わせて電話機の押しボタンを表す(例: #️⃣ (U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBINING ENCLOSING KEYCAP) )
この12文字に対し2種類の異体字セレクタ、絵文字表示(U+FE0F VS16)かテキスト表示(U+FE0E VS15)が適用できる。いずれも、デフォルトはテキスト表示である[8]。
U+ | 0023 | 002A | 0030 | 0031 | 0032 | 0033 | 0034 | 0035 | 0036 | 0037 | 0038 | 0039 |
base code point | # | * | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
base+VS15 (text) | #︎ | *︎ | 0︎ | 1︎ | 2︎ | 3︎ | 4︎ | 5︎ | 6︎ | 7︎ | 8︎ | 9︎ |
base+VS16 (emoji) | #️ | *️ | 0️ | 1️ | 2️ | 3️ | 4️ | 5️ | 6️ | 7️ | 8️ | 9️ |
Remove ads
履歴
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
Remove ads
関連項目
出典
外部リンク
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads