Top Qs
Línea de tiempo
Chat
Contexto
Windows-1252
codificación de caracteres del alfabeto latino De Wikipedia, la enciclopedia libre
Remove ads
Windows-1252 o CP-1252 es una codificación de caracteres del alfabeto latino, usada por defecto cuando Unicode no se usa en los componentes oficiales de Microsoft Windows en inglés y en algunos lenguajes occidentales. Es una versión en la que el código de páginas de Windows está en los paquetes de LaTeX, el cual se refiere como ansinew.

Remove ads
Detalles
Resumir
Contexto
Esta codificación es un superconjunto de ISO 8859-1, pero difiere de la ISO-8859-1 de IANA por el uso de caracteres no imprimibles en vez de caracteres de control en el rango 0x80 a 0x9F. Es conocido en Windows como el código de caracteres número 1252, y con el nombre de "windows-1252", aprobado por la IANA. Este código de caracteres también incluye todos los caracteres imprimibles de ISO 8859-15 (algunos mapeados a diferentes posiciones).
Es muy común confundir la codificación de caracteres Windows-1252 con la de ISO-8859-1. El resultado habitual era que todas las comillas y apóstrofos (producidos por las "comillas inteligentes" en software Microsoft) eran reemplazadas por signos de interrogación o por cajas en sistemas operativos no-Windows, haciendo que el texto resultara difícil de leer. La mayoría de los navegadores modernos y clientes de correo electrónico, tratan la codificación de caracteres de MIME ISO-8859-1 como Windows-1252 con el fin de paliar esta confusión. Este es uno de los estándares en las especificaciones de HTML 5, que requieren una interpretación de ISO-8859-1 en Windows-1252.[1]
Históricamente, el término "ANSI code page" (ACP) se usa en Windows para referirse a varias páginas de códigos consideradas como nativas. La intención era que la mayoría de estas fueran estándares ANSI como lo es el ISO-8859-1. Incluso, Windows-1252 fue la primera y de lejos la más popular página de códigos de los idiomas que soporta Microsoft Windows, y sin embargo jamás ha sido un estándar ANSI. Microsoft establece que "El término ANSI usado para indicar a los códigos de página Windows, es una referencia histórica, pero actualmente es un término equivocado que aún continua persistente en la comunidad de Windows."[2]
Remove ads
Diseño de la codificación de caracteres
Resumir
Contexto
La siguiente tabla muestra la codificación Windows-1252, con las diferencias con la codificación ISO-8859-1 marcadas con bordes gruesos y asteriscos(*). Cada carácter se muestra con su equivalente en Unicode y con su código en decimal.
Microsoft cita el mapeo de los caracteres con Unicode con el "mejor ajuste",[3] el cual incluye los cinco caracteres no mapeados, así como los caracteres mapeados al 1252 que están obsoletos.
Leyenda: las celdas amarillas son caracteres de control, las celdas azules son puntuación, las púrpuras son números, las verdes son letras ASCII, y las de color canela son letras internacionales.
Según la información de las webs de Microsoft y del Consorcio Unicode, las posiciones 81, 8D, 8F, 90, y 9D no se usan. Sin embargo, la llamada a la API de Windows que convierte de páginas de códigos a Unicode mapea estas a las correspondientes códigos de control C1. El símbolo del Euro en la posición 80 no estaba en versiones anteriores de esta página de códigos, ni tampoco las S y Z con carón (háček).
Remove ads
Enlaces externos
Referencias
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads