Лучшие вопросы
Таймлайн
Чат
Перспективы

КОИ-8

восьмибитовая кодовая таблица Из Википедии, свободной энциклопедии

КОИ-8
Remove ads

8-би́тный код для обме́на и обрабо́тки информа́ции (сокр. КОИ-8) — восьмибитная кодовая страница, являющаяся расширением кодировки КОИ-7 (объединением наборов Н0 и Н1) и вследствие этого совместимая с ISO 646 IRV (ASCII[a]), предназначенная для обмена и обработки информации с возможностью использования латинского и русского алфавитов. КОИ-8 была стандартизована в паре с ДКОИ в ГОСТ 19768—74[1], утратившем силу 1 июля 1993 года, и в настоящее время не определена ни в одном из действующих стандартов[b]. Один из вариантов КОИ-8 — KOI8-R — был широко распространён как основная русская кодировка в Unix-подобных операционных системах и в электронной почте, однако с конца 2000-х годов он постепенно выходит из употребления в связи с распространением Юникода.

Thumb
Окно настройки экрана в Mandrake Linux 7.1, демонстрирующее отображение кириллицы в отсутствие кириллического шрифта благодаря использованию кодировки koi8

Разработчики КОИ-8 разместили буквы русского алфавита в верхней половине кодовой таблицы так, чтобы их позиции совпадали с позициями фонетически аналогичных им латинских букв в нижней половине таблицы, поэтому русские буквы расположены не в алфавитном порядке. Благодаря этому при обнулении старшего (восьмого) бита символов текста, написанного в КОИ-8 (в частности, из-за прохождения через семибитную среду), получается относительно читаемый текст, подобный транслиту; так, например, слова «Русский Текст» превращаются в «rUSSKIJ tEKST».

Существует несколько расширенных вариантов КОИ-8 с поддержкой различных кириллических алфавитов; тем не менее, основной диапазон кодовых позиций кириллицы (0xC00xFF), содержащий 32 русские буквы (все кроме Ё) в обоих регистрах (строчные и прописные), во всех вариантах остаётся неизменным. Поддержка русского алфавита реализована в KOI8-R, украинского — в KOI8-U, белорусского — в KOI8-RU, таджикского — в KOI8-T.

В 1990-х годах KOI8-R фактически стала стандартом кодирования русской кириллицы в Unix-подобных операционных системах и в электронной почте. Автор данной кодировки (RFC 1489) Андрей Чернов в начале 1990-х годов работал в компании «Демос» (сеть «Релком») и непосредственно участвовал в запуске и наладке первого Интернет-канала между Россией и западными странами. KOI8-R в итоге стала первой стандартизованной русской кодировкой в Интернете.

IETF утвердил несколько RFC по расширенным вариантам КОИ-8, впоследствии зарегистрированным IANA в своём списке[3]:

  • RFC 1489 — KOI8-R (с поддержкой русского алфавита);
  • RFC 2319 — KOI8-U (с поддержкой украинского алфавита);
  • RFC 1345 — ISO-IR-111 (с ошибкой в расположении основного диапазона).

В Microsoft Windows KOI8-R присвоен идентификатор 20866, KOI8-U — 21866[4].

Remove ads

Кодовые таблицы

Суммиров вкратце
Перспектива

Нижние половины кодовых таблиц (позиции 0x000x7F) полностью совпадают с ASCII. Числа под символами обозначают их шестнадцатеричный код в Юникоде.

KOI8-R (русская)

Подробнее .0, .1 ...

KOI8-U (русско-украинская)

Здесь и далее приводятся только те строки кодовой таблицы, которые отличаются от KOI8-R.

Подробнее .0, .1 ...

KOI8-RU (русско-белорусско-украинская)

Подробнее .0, .1 ...

KOI8-C (центральноазиатская)

Подробнее .0, .1 ...

KOI8-T (таджикская)

Подробнее .0, .1 ...

KOI8-O, KOI8-S (русская дореформенная орфография)

Подробнее .0, .1 ...

ISO-IR-111, KOI8-E

Подробнее .0, .1 ...

KOI8-Unified, KOI8-F

Кодировка KOI8-F предложена компанией Fingertip Software[5]. Неразрывный пробел размещён сразу в двух кодовых позициях — 0x9A и 0xA0.

Подробнее .0, .1 ...

KOI8-M

Кодировка KOI8-M представляет собой смесь KOI8-R и первоначальной (разработанной в ВЦ АН СССР) версии альтернативной кодировки.

Подробнее .0, .1 ...
Remove ads

Некириллические варианты КОИ-8

В некоторых странах — членах СЭВ создавались модификации КОИ-8 для национальных вариантов латиницы. Основная идея была та же — при «срезании» старшего бита текст должен оставаться более или менее понятным.

Примечания

Ссылки

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads