Private Use Area

Der Unicode-Standard weist die im Folgenden beschriebenen drei Bereiche als für den eigenen Gebrauch der Nutzer bestimmt aus.

Private Use Zone

Die Private Use Zone^[1] liegt in der Ebene 0 (BMP, Basic Multilingual Plane) und umfasst den Bereich von U+E000 bis U+F8FF. Das sind 6400 Codepunkte.

Welche Zeichen eine Schriftart in der Private Use Zone definiert hat, kann mit der Vorlage:Private-Use-Area-Test ermittelt werden.

Private Use Planes

Die Unicode-Ebenen 15 und 16 enthalten nur die beiden Blöcke Supplementary Private Use Area-A bzw. -B. Anstatt von PUA-A und PUA-B ist daher teilweise auch zusammenfassend von Private Use Planes (PUP) die Rede.^[2]

Supplementary Private Use Area-A

Die Supplementary Private Use Area-A umfasst die komplette Ebene 15, also den Bereich von U+F0000 bis U+FFFFD. Das sind 65534 Codepunkte.

Welche Zeichen eine Schriftart in der Supplementary Private Use Area-A definiert hat, kann mit der Vorlage:Supplementary-Private-Use-Area-A-Test ermittelt werden.

Supplementary Private Use Area-B

Die Supplementary Private Use Area-B umfasst die komplette Ebene 16, also den Bereich von U+100000 bis U+10FFFD. Das sind 65534 Codepunkte.

Welche Zeichen eine Schriftart in der Supplementary Private Use Area-B definiert hat, kann mit der Vorlage:Supplementary-Private-Use-Area-B-Test ermittelt werden.

Die Zuordnung von Zeichen zu Codepoints wird in diesen Bereichen nicht vom Unicode-Konsortium reglementiert. Es existieren jedoch verschiedene Organisationen und Initiativen, die die Vergabe von Zeichencodes in diesen Bereichen koordinieren.

Medieval Unicode Font Initiative

Die Medieval Unicode Font Initiative (MUFI)^[3] koordiniert die Kodierung historischer Zeichen, Zeichenvarianten und Ligaturen und vergibt dafür Codepoints aus der Private Use Zone, vorwiegend aus dem Bereich U+E000 bis U+EFFF.

Verwendung unter Linux

Unter Linux wurde die Private Use Zone in zwei Bereiche geteilt:^[4]

U+E000 … U+EFFF : „End User Zone“
U+F000 … U+F8FF : „Linux Zone“
- U+F000 … U+F7FF : 1:1-Mapping auf die Zeichen des aktuellen Console-Fonts
- U+F800 … U+F8FF : linuxweit festgelegte Zeichen, die unter Linux benötigt/gewünscht sind, aber noch nicht in Unicode enthalten sind.

Die End User Zone steht für den Endanwender zur freien Verfügung. Die Linux Zone wird für betriebssysteminterne Zwecke reserviert. Dabei wird der Bereich von U+F000 bis U+F7FF genutzt, um ein 1:1-Mapping der verwendeten Bildschirmschriftart für die Console abzudecken. Das ermöglicht es Programmen wie consolechars, alle Zeichen der gerade verwendeten Bildschirmschriftart auch ohne Kenntnis ihrer Zeichenkodierungen darzustellen. Da die Textconsole von Linux maximal 512 Zeichen in einer Bildschirmschriftart unterstützt, ist dieser Bereich mehr als ausreichend. Der Bereich von U+F800 bis U+F8FF wird für Zeichen benutzt, die unter Linux benötigt oder gewünscht werden, die jedoch (noch) nicht im Unicode-Zeichensatz enthalten sind:

Weitere Informationen Codepoint, Zeichen ...

Codepoint	Zeichen	Bemerkung
U+F800	DEC VT GRAPHICS HORIZONTAL LINE SCAN 1	mit Aufnahme dieser Zeichen in Unicode 3.2 sind diese 4 Codepositionen veraltet („deprecated“).
U+F801	DEC VT GRAPHICS HORIZONTAL LINE SCAN 3
U+F803	DEC VT GRAPHICS HORIZONTAL LINE SCAN 7
U+F804	DEC VT GRAPHICS HORIZONTAL LINE SCAN 9
U+F810	KEYBOARD SYMBOL FLYING FLAG	Tastensymbol „wehende Flagge“ = Windowstaste
U+F811	KEYBOARD SYMBOL PULLDOWN MENU	Tastensymbol Menü
U+F812	KEYBOARD SYMBOL OPEN APPLE	Tastensymbol „leerer Apfel“
U+F813	KEYBOARD SYMBOL SOLID APPLE	Tastensymbol „ausgefüllter Apfel“
U+F8D0	Buchstaben und Zahlzeichen der fiktionalen Klingonischen Sprache
U+F8FF

Die Vergabe der Codepunkte in der „Linux Zone“ wird von der Linux Assigned Names and Numbers Authority (LANANA) koordiniert.

ConScript Unicode Registry

Dieses Freiwilligenprojekt^[5] koordiniert die Aufnahme fiktionaler Schriften, die in Romanen oder Filmen verwendet werden, wie den Sprachen aus der Mittelerde-Fantasiewelt von J. R. R. Tolkien. Sie vergibt Codepoints in allen 3 privaten Unicodeblöcken und koordiniert sich dabei mit der LANANA, nicht jedoch mit der MUFI.

Weitere Verwendungen

SIL PUA für Sonderbuchstaben diverser Minderheitensprachen weltweit^[6]
Languagegeek für indigene Sprachen Nordamerikas^[7]

Die Pseudo-Zeichenkodierung x-user-defined kann benutzt werden, um Binärdaten in eine Unicode-Zeichenkette zu kodieren: Es werden die Oktette mit den Werten 00_hex … 7F_hex als U+0000 … U+007F kodiert, und die Oktette 80_hex … FF_hex als Unicode-Zeichen U+F780 … U+F7FF.^[8]
Standard Music Font Layout (SMuFL) für die Notation in der Musik^[9]

Codebereiche

Private Use Zone

Private Use Planes

Supplementary Private Use Area-A

Supplementary Private Use Area-B

Verwendung

Medieval Unicode Font Initiative

Verwendung unter Linux

ConScript Unicode Registry

Weitere Verwendungen

Siehe auch

Einzelnachweise

Wikiwand - on