ISO 8859-2

From Wikipedia, the free encyclopedia

Remove ads

ISO 8859-2, formálně správně ISO/IEC 8859-2, je v informatice znaková sada známá rovněž jako Latin-2 (pozor na možnou záměnu použití pojmu Latin-2 v prostředí Microsoft Windows v prostředí MS DOS, viz CP852), nebo „středo-“ či „východoevropská“, která je druhou částí standardního kódování znaků definovaného organizací ISO. Obsahuje 191 znaků latinky kódovaných pomocí 8 bitů a poprvé byla publikována v roce 1987.

Remove ads

Pokrytí jazyků

Pomocí této znakové sady je možné zapisovat texty následujících jazycích: bosenština, chorvatština, čeština, maďarština, polština, rumunština, srbština (psaná v latinské transkripci), srbochorvatština, slovenština, slovinština, hornolužičtina, dolnolužičtina. Jako dodatkové jazyky lze použít angličtinu a němčinu, což má význam zvláště ve vícejazyčných dokumentech (pro tyto jazyky se normálně upřednostňuje ISO 8859-1).

Na rozdíl od ISO 8859-1 je tato sestava znaků použitelná i pro finštinu (kromě znaku „å“ používaného v některých švédsko-finských jménech) a němčinu. Sporné je zde použití pro rumunštinu, protože místo znaků Șș i Țț (S a T s čárkou) se musí použít znaky Şş i Ţţ (S a T s cedillou). Toto omezení se dostalo i do první verze unikódu, kde zobrazení s cedillou nebo tečkou bylo bráno jako výběr fontu a ne jako oddělené znaky. Unicode 3.0 již obsahuje správné rumunské znaky.

Remove ads

Latin 2

Tato kódová stránka bývá často nazývána Latin 2, nicméně stejné označení se používá v MS-DOSu pro CP852. Někdy tak dochází k omylům, kterým se lze vyhnout označováním ISO 8859-2 jako ISO Latin 2, zatímco CP852 lze nazývat PC Latin 2 nebo IBM Latin 2.

Podobnost s Windows-1250

Znakové sadě ISO 8859-2 se velmi podobá znaková sada Windows-1250, která vznikla později. Kódování Windows-1250 zavedené firmou Microsoft obsahuje všechny tisknutelné znaky ISO 8859-2, ale některé z nich na jiných místech. V češtině je tento rozdíl nejmarkantnější u písmen Š, Ť a Ž.

Tabulka znaků

Další informace 8859-2:1999, x0 ...

Znak s kódem 0x20 je obyčejná mezera, 0xA0 je nezlomitelná mezera, znak 0xAD měkký rozdělovník.

Remove ads

Mapování do Unikódu

Další informace 8859-2:1999, Hex ...

Kde „ŘZ“ označuje řídící znak.

Remove ads

Odkazy

Související články

Externí odkazy

  • ISO 8859-2:1999
  • Standard ECMA-94: 8-Bit Single Byte Coded Graphic Character Sets - Latin Alphabets No. 1 to No. 4 2nd edition (June 1986)
  • ISO-IR 101 Right-Hand Part of Latin Alphabet No.2 (February 1, 1986)
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads