Najlepsze pytania
Chronologia
Czat
Perspektywa
CP852
strona kodowa używana przez system operacyjny MS-DOS Z Wikipedii, wolnej encyklopedii
Remove ads
CP852 (Code page 852, CP 852, IBM 852, OEM 852, MS-DOS Latin 2, PC Latin 2, Slavic (Latin II)) – 8-bitowe kodowanie znaków stosowane w systemach operacyjnych MS-DOS, PC-DOS, DR-DOS i FreeDOS, w zamyśle mające zawierać znaki języków krajów Europy Wschodniej opartych na alfabecie łacińskim. Analogicznie jak w przypadku kodowania CP850, niektóre litery ze znakami diakrytycznymi zastąpiły niektóre istniejące w CP437 znaki semigrafiki i symbole matematyczne. Od czasu rozpowszechnienia się systemów operacyjnych Windows 3.x, a zwłaszcza Windows 95 i Windows NT 4.0, wykorzystujących kodowanie Windows-1250 i (w różnym stopniu) unikod, znaczenie kodowania CP852 zaczęło bardzo szybko maleć, choć nadal jest ono wykorzystywane w aplikacjach pisanych dla systemu operacyjnego DOS lub nieposiadających interfejsu graficznego (przeznaczonych do uruchamiania w oknie DOS względnie oknie konsoli), w tym programach księgowych, magazynowych itp.
Remove ads
Historia
Strona kodowa CP852 po raz pierwszy pojawiła się w systemie MS-DOS w wersji 5.0, wydanej we wrześniu 1991 r.
Zestaw znaków
Kodowanie CP852 zawiera litery ze znakami diakrytycznymi używane w następujących językach: albańskim, białoruskim (Łacinka), bośniackim, chorwackim, czeskim, irlandzkim, dolno- i górnołużyckim, niemieckim, polskim, rumuńskim (patrz poniżej), słowackim, słoweńskim, turkmeńskim i węgierskim.
Kodowanie to zostało zaprojektowane z myślą o możliwie najpełniejszym pokryciu języków dawnego bloku sowieckiego używających alfabetu łacińskiego. Wbrew jednej z nazw (kodowanie języków słowiańskich) zawiera litery używane w języku albańskim (należącym do grupy języków ilirskich), niemieckim (należącym do grupy języków germańskich), językiem rumuńskim (należącym do grupy języków romańskich) i węgierskim (należącym do grupy języków ugrofińskich), a nie pozwala na użycie z językami opartymi na cyrylicy. Nie zawiera wszystkich znaków używanych w poprawnej typografii języka rumuńskiego.
Remove ads
Braki znaków
Kodowanie CP852 nie zawiera cudzysłowów używanych w typografii języków obsługiwanych przez to kodowanie (np. stosowanych w Polsce «„» i «”»). Brak również czterech znaków używanych w języku rumuńskim, pisanych z przecinkiem pod spodem:
- 0x0218 LATIN CAPITAL LETTER S WITH COMMA BELOW
- 0x0219 LATIN SMALL LETTER S WITH COMMA BELOW
- 0x021A LATIN CAPITAL LETTER T WITH COMMA BELOW
- 0x021B LATIN SMALL LETTER T WITH COMMA BELOW.
Przyjęto, że będą stosowane analogiczne litery z cedillą:
- 0x015E LATIN CAPITAL LETTER S WITH CEDILLA
- 0x015F LATIN SMALL LETTER S WITH CEDILLA
- 0x0162 LATIN CAPITAL LETTER T WITH CEDILLA
- 0x0163 LATIN SMALL LETTER T WITH CEDILLA
W czasach projektowania kodowania CP852 uznawano, że przecinek pod spodem jest typograficzną odmianą cedilli, nie osobnym znakiem diakrytycznym.
Tablica kodów
znaki posiadają podwójną funkcję: mogą pełnić rolę znaków sterujących, ale również mogą reprezentować znaki graficzne
Remove ads
Mapowanie na unikod
Podsumowanie
Perspektywa
Poniższa tabela przedstawia kody Unicode znaków zawartych w stronie kodowej CP852. Tabela zawiera wyłącznie znaki z górnego zakresu (dolny zakres, czyli pozycje 0x00 ÷ 0x7F jest identyczny z ASCII. Wszystkie kody podane jako szesnastkowe.
Remove ads
Rozmieszczenie polskich znaków
Różnice między kodowaniami MS-DOS CP852 a IBM CP852
Objaśnienia:
- pozycje na fioletowym tle są znakami kontrolnymi
- NZ oznacza znak niezdefiniowany
Bibliografia
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads