Top Qs
Línea de tiempo
Chat
Contexto

Windows-1252

codificación de caracteres del alfabeto latino De Wikipedia, la enciclopedia libre

Windows-1252
Remove ads

Windows-1252 o CP-1252 es una codificación de caracteres del alfabeto latino, usada por defecto cuando Unicode no se usa en los componentes oficiales de Microsoft Windows en inglés y en algunos lenguajes occidentales. Es una versión en la que el código de páginas de Windows está en los paquetes de LaTeX, el cual se refiere como ansinew.

Thumb
Windows-1252. Los puntos azules significan códigos sin uso.
Remove ads

Detalles

Resumir
Contexto

Esta codificación es un superconjunto de ISO 8859-1, pero difiere de la ISO-8859-1 de IANA por el uso de caracteres no imprimibles en vez de caracteres de control en el rango 0x80 a 0x9F. Es conocido en Windows como el código de caracteres número 1252, y con el nombre de "windows-1252", aprobado por la IANA. Este código de caracteres también incluye todos los caracteres imprimibles de ISO 8859-15 (algunos mapeados a diferentes posiciones).

Es muy común confundir la codificación de caracteres Windows-1252 con la de ISO-8859-1. El resultado habitual era que todas las comillas y apóstrofos (producidos por las "comillas inteligentes" en software Microsoft) eran reemplazadas por signos de interrogación o por cajas en sistemas operativos no-Windows, haciendo que el texto resultara difícil de leer. La mayoría de los navegadores modernos y clientes de correo electrónico, tratan la codificación de caracteres de MIME ISO-8859-1 como Windows-1252 con el fin de paliar esta confusión. Este es uno de los estándares en las especificaciones de HTML 5, que requieren una interpretación de ISO-8859-1 en Windows-1252.[1]

Históricamente, el término "ANSI code page" (ACP) se usa en Windows para referirse a varias páginas de códigos consideradas como nativas. La intención era que la mayoría de estas fueran estándares ANSI como lo es el ISO-8859-1. Incluso, Windows-1252 fue la primera y de lejos la más popular página de códigos de los idiomas que soporta Microsoft Windows, y sin embargo jamás ha sido un estándar ANSI. Microsoft establece que "El término ANSI usado para indicar a los códigos de página Windows, es una referencia histórica, pero actualmente es un término equivocado que aún continua persistente en la comunidad de Windows."[2]

Remove ads

Diseño de la codificación de caracteres

Resumir
Contexto

La siguiente tabla muestra la codificación Windows-1252, con las diferencias con la codificación ISO-8859-1 marcadas con bordes gruesos y asteriscos(*). Cada carácter se muestra con su equivalente en Unicode y con su código en decimal.

Microsoft cita el mapeo de los caracteres con Unicode con el "mejor ajuste",[3] el cual incluye los cinco caracteres no mapeados, así como los caracteres mapeados al 1252 que están obsoletos.

Más información —0, —1 ...

Leyenda: las celdas amarillas son caracteres de control, las celdas azules son puntuación, las púrpuras son números, las verdes son letras ASCII, y las de color canela son letras internacionales.

Según la información de las webs de Microsoft y del Consorcio Unicode, las posiciones 81, 8D, 8F, 90, y 9D no se usan. Sin embargo, la llamada a la API de Windows que convierte de páginas de códigos a Unicode mapea estas a las correspondientes códigos de control C1. El símbolo del Euro en la posición 80 no estaba en versiones anteriores de esta página de códigos, ni tampoco las S y Z con carón (háček).

Remove ads

Enlaces externos

Referencias

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads