ISO 8859-2
From Wikipedia, the free encyclopedia
Remove ads
ISO 8859-2, formálně správně ISO/IEC 8859-2, je v informatice znaková sada známá rovněž jako Latin-2 (pozor na možnou záměnu použití pojmu Latin-2 v prostředí Microsoft Windows v prostředí MS DOS, viz CP852), nebo „středo-“ či „východoevropská“, která je druhou částí standardního kódování znaků definovaného organizací ISO. Obsahuje 191 znaků latinky kódovaných pomocí 8 bitů a poprvé byla publikována v roce 1987.
Remove ads
Pokrytí jazyků
Pomocí této znakové sady je možné zapisovat texty následujících jazycích: bosenština, chorvatština, čeština, maďarština, polština, rumunština, srbština (psaná v latinské transkripci), srbochorvatština, slovenština, slovinština, hornolužičtina, dolnolužičtina. Jako dodatkové jazyky lze použít angličtinu a němčinu, což má význam zvláště ve vícejazyčných dokumentech (pro tyto jazyky se normálně upřednostňuje ISO 8859-1).
Na rozdíl od ISO 8859-1 je tato sestava znaků použitelná i pro finštinu (kromě znaku „å“ používaného v některých švédsko-finských jménech) a němčinu. Sporné je zde použití pro rumunštinu, protože místo znaků Șș i Țț (S a T s čárkou) se musí použít znaky Şş i Ţţ (S a T s cedillou). Toto omezení se dostalo i do první verze unikódu, kde zobrazení s cedillou nebo tečkou bylo bráno jako výběr fontu a ne jako oddělené znaky. Unicode 3.0 již obsahuje správné rumunské znaky.
Remove ads
Latin 2
Tato kódová stránka bývá často nazývána Latin 2, nicméně stejné označení se používá v MS-DOSu pro CP852. Někdy tak dochází k omylům, kterým se lze vyhnout označováním ISO 8859-2 jako ISO Latin 2, zatímco CP852 lze nazývat PC Latin 2 nebo IBM Latin 2.
Podobnost s Windows-1250
Znakové sadě ISO 8859-2 se velmi podobá znaková sada Windows-1250, která vznikla později. Kódování Windows-1250 zavedené firmou Microsoft obsahuje všechny tisknutelné znaky ISO 8859-2, ale některé z nich na jiných místech. V češtině je tento rozdíl nejmarkantnější u písmen Š, Ť a Ž.
Tabulka znaků
Znak s kódem 0x20 je obyčejná mezera, 0xA0 je nezlomitelná mezera, znak 0xAD měkký rozdělovník.
Remove ads
Mapování do Unikódu
Kde „ŘZ“ označuje řídící znak.
Remove ads
Odkazy
Související články
Externí odkazy
- ISO 8859-2:1999
- Standard ECMA-94: 8-Bit Single Byte Coded Graphic Character Sets - Latin Alphabets No. 1 to No. 4 2nd edition (June 1986)
- ISO-IR 101 Right-Hand Part of Latin Alphabet No.2 (February 1, 1986)
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads