상위 질문
타임라인
채팅
관점
ISO/IEC 8859
위키백과, 무료 백과사전
Remove ads
ISO/IEC 8859는 컴퓨터에서 8비트로 문자를 나타내기 위한 ISO와 IEC의 공동 표준이다. ISO/IEC 8859-1, ISO/IEC 8859-2 등의 세부 표준이 제안되어 있다.
ISO/IEC 8859 파트 1, 2, 3, 4는 원래 Ecma 인터내셔널 표준 ECMA-94이었다.
소개
ASCII에 포함된 95자의 인쇄 영역은 현대 영어로 정보를 표현하는 데 충분하다. 하지만 로마 문자를 쓰는 다른 언어에는 ASCII로 처리할 수 없는 추가적인 기호를 포함하고 있다. 예를 들면 ß(독일어), ñ(에스파냐어), å(스웨덴어와 북유럽 언어) 등이다. ISO 8859는 8비트로 구성된 바이트의 8번째 비트를 이용하여 128자의 추가적인 문자를 할당하여 이 문제를 처리하기 위해 제안되었다. 하지만 한 종류의 문자 집합만으로는 필요로 하는 모든 문자를 처리할 수 없어 여러 가지 매핑이 개발되었다.
ISO 8859-n 부호화는 인쇄 가능한 문자만을 포함한다. 문자가 대응되지 않은 곳은 제어 문자로 활용된다. IANA는 ISO/IEC 646에 정의된 C0 영역(0-31)과 ISO 6429에 정의된 C1 영역(127-159)을 제어 문자로 사용한다. 이 문자 집합 이름은 MIME 이름으로도 활용된다.
Remove ads
구성
요약
관점
ISO/IEC 8859는 다음 문자 집합으로 이루어져 있다.
- ISO/IEC 8859-3
- 라틴-3
남유럽 - 몰타어, 튀르키예어, 에스페란토. 터키어는 ISO/IEC 8859-9, 에스파란토는 유니코드로 대체되어가고 있다.
- 라틴-3
- ISO/IEC 8859-7
- 라틴/그리스
- 현대 그리스어를 지원한다. 문자 개혁 이전의 고전 그리스어(polytonic orthography)는 유니코드에서 지원한다.
- ISO/IEC 8859-8
- 라틴/히브리
- 이스라엘에서 쓰이는 현대 히브리어를 지원한다. 좌에서 우, 또는 우에서 좌 두가지 방향의 인코딩이 모두 존재한다.
- ISO/IEC 8859-10
- 라틴-6
노르딕 - 라틴-4의 문자를 재배열했다. 노르딕 언어의 표기에 더 적합하다. 발트 언어에게는 라틴-4가 더 편리하다.
- 라틴-6
- ISO/IEC 8859-11
- 라틴/타이
- 타이어 (언어):타이어에서 쓰이는 여러 문자를 추가했다.TIS 620과 동일하다.
- ISO/IEC 8859-13
- 라틴-7
발트 해 연안 - 라틴-4와 라틴-6에 빠진 발트 언어의 문자를 추가했다.
- 라틴-7
- ISO/IEC 8859-14
- 라틴-8
켈트 - 스코틀란드게일어나 브르타뉴어 등의 켈트어를 지원한다.
- 라틴-8
- 네덜란드어에서 쓰이는 IJ:*IJ/ij 문자가 빠졌으며, 로마 문자 IJ로 사용된다.
- 빠진 글자는 ISO 8859-15에 추가되었다.
- 1991년 우크라이나어에 재도입된 Ґ/ґ 문자가 빠져있다.
- 0xA0위치에는 NBSP(non breaking space) 문자가, 0xAD에는 대개 소프트 하이픈(soft hyphen) 문자가 놓여있다. 다른 빈 자리는 할당되지 않은 영역이거나 현재 사용자 시스템이 표시할 수 없는 글자이다.
- ISO/IEC 8859-7:2003과 ISO/IEC 8859-8:1999에서 새로 추가된 영역이 있다. LRM은 좌에서 우표시(U+200E), RLM은 우에서 좌 표시(U+200F)에 대응한다.
Remove ads
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads