Лучшие вопросы
Таймлайн
Чат
Перспективы

CP866

Из Википедии, свободной энциклопедии

CP866
Remove ads

Альтернати́вная кодиро́вка — основанная на CP437 кодовая страница, где большинство специфических европейских символов в верхней половине (позициях 0x800xFF) кодовой таблицы заменено на буквы русского алфавита, а псевдографические символы оставлены нетронутыми. Такой подход не портит внешнего вида зарубежных программ, использующих псевдографику (как правило, для отрисовки рамок и таблиц), а также обеспечивает возможность использования в них русских букв.

Thumb
Кодовая таблица кодировки CP866 (зарегистрированного IBM варианта альтернативной кодировки)

Разработана в паре с основной кодировкой (с которой совпадает по набору символов) в середине 1980-х годов в Вычислительном центре Академии наук СССР, была названа и описана в статье в журнале «Микропроцессорные средства и системы»[1]. Пользовалась большой популярностью среди советских пользователей IBM PC-совместимых ПК (в феврале 1989 года 85 % опрошенных заявили, что используют её)[2]. Техническим недостатком данной кодировки является разрыв основного диапазона строчных русских букв, несколько усложняющий обработку (в частности, сортировку) текстовой информации.

Исторически существовало несколько вариантов альтернативной кодировки, но все изменения, как правило, затрагивали только диапазон кодовых позиций 0xF00xFD. Окончательным стандартом стала кодировка IBM CP866, которая, помимо русского и болгарского языков, может использоваться ещё и для украинского (советского периода) и белорусского, поскольку включает буквы Є, Ї и Ў; тем не менее, в ней нет кириллической буквы І (вместо неё применяют латинскую I), а также буквы Ґ, упразднённой в 1933 году и на момент создания кодировки отсутствовавшей в украинском алфавите (восстановлена в 1990 году). Поддержка CP866 была добавлена в ОС MS-DOS версии 4.01[3] (только в локализованных и переведённых на русский язык выпусках) и повсеместно — в MS-DOS версии 6.22. В этой кодировке записываются имена объектов (файлов и каталогов) в файловой системе FAT (и короткие имена в VFAT). Поныне является популярной стандартной кодировкой Microsoft в среде DOS и OS/2, используется в консоли русифицированных ОС семейства Windows NT. Вне среды MS-DOS в Microsoft Windows заменена стандартной кодировкой CP1251, а в ОС семейства Windows NT (Windows NT 4.0, Windows 2000, Windows XP, Windows Server 2003, Windows Vista, Windows Server 2008, Windows 7 и т. д.) — Юникодом в представлении UTF-16LE (до Windows 2000 — UCS-2LE).

Хотя оригинальная альтернативная кодировка не была стандартизована ни в одном из когда-либо существовавших ГОСТов, её иногда называют «альтернативной кодировкой ГОСТа» или «альтернативной кодировкой ГОСТ». Данное ошибочное название закрепилось за ней из-за использования в одном из первых русскоязычных учебников по работе с IBM PC-совместимыми ПК, пользовавшемся популярностью в 1990-х годах — книге В. Э. Фигурнова «IBM PC для пользователя»[4].

Два варианта альтернативной кодировки — КОИ-8 Н1 (базовый набор кириллицы для русского языка) и КОИ-8 Н2 (рабочий набор кириллицы для русского, белорусского и украинского языков, включающий символы псевдографики) — определены в ГОСТ Р 34.303—92[5]. Несмотря на сходство названий, они не имеют отношения к кодировке КОИ-8 по ГОСТ 19768—74, в настоящее время не определённой ни в одном из действующих стандартов.

Remove ads

Кодовые таблицы

Суммиров вкратце
Перспектива

Нижние половины (позиции 0x000x7F) кодовых таблиц не показаны, поскольку они полностью совпадают с CP437 (ASCII). Числа под символами обозначают их шестнадцатеричный код в Юникоде.

Оригинальная кодировка

Подробнее .0, .1 ...

Производные кодировки

В данном разделе приведены только те строки кодовых таблиц, которые отличаются от оригинальной версии ВЦ АН СССР.

Наиболее распространённый вариант до появления CP866, называемый также «модифицированной альтернативной кодировкой»[4] (KOI8-R использует этот же набор символов):

Подробнее .0, .1 ...

То же, но без буквы Ё (отличается от CP437 только заменой символов в диапазонах 0x800xAF и 0xE00xEF на русские буквы):

Подробнее .0, .1 ...

CP866 — вариант альтернативной кодировки, зарегистрированный корпорацией IBM:

Подробнее .0, .1 ...

CP866LV — кодировка, использовавшаяся в Латвии (Латвийской ССР), часть стандартных символов заменена на буквы латышского алфавита:

Подробнее .0, .1 ...

CP1125 (CP866U, RUSCII) — вариант альтернативной кодировки с поддержкой букв украинского алфавита, стандартизованный в РСТ УССР 2018—91:

Подробнее .0, .1 ...

CP866.chuv — вариант кодировки CP866 с поддержкой букв чувашского алфавита:

Подробнее .0, .1 ...

КОИ-8 Н2 — кодировка, определённая в ГОСТ Р 34.303—92[5]:

Подробнее .0, .1 ...
Remove ads

Примечания

Ссылки

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads