JIS X 0212 - JIS X 0212
Sprachen) | Soll zusammen mit JIS X 0208 für die japanische Unterstützung verwendet werden. Unterstützt keine Sprache für sich. |
---|---|
Standard | JIS X 0212: 1990 |
Aktueller Status | Unihan Quelle. Der codierte Zeichensatz selbst wird nicht so häufig unterstützt wie JIS X 0208 , wird jedoch manchmal in EUC-JP verwendet . |
Einstufung | Zusätzlicher Zeichensatz, ISO 2022 , DBCS , CJK-Codierung |
Erweitert | JIS X 0208 bei gemeinsamer Verwendung |
Codierungsformate |
EUC-JP ISO-2022-JP-1 |
gefolgt von | JIS X 0213 |
Andere verwandte Codierung (en) | KS X 1002 |
JIS X 0212 ist ein japanischer Industriestandard , der einen codierten Zeichensatz zum Codieren zusätzlicher Zeichen zur Verwendung in Japanisch definiert. Diese Norm soll JIS X 0208 (Code Seite 952) ergänzen . Es ist als IBM-Codepage mit 953 oder 5049 nummeriert (siehe unten).
Es ist einer der Quellstandards für Unicodes CJK Unified Ideographs .
Geschichte
1990 veröffentlichte die Japanese Standards Association (JSA) einen zusätzlichen Zeichensatzstandard: JIS X 0212-1990 Code des ergänzenden japanischen grafischen Zeichensatzes für den Informationsaustausch ((交換 用 漢字 符号 - 補助 漢字, Jōhō Kōkan'yō Kanji Fugō - Hojo Kanji ) . Dieser Standard sollte auf dem im JIS X 0208- Hauptzeichensatz verfügbaren Zeichenbereich aufbauen und Mängel bei der Abdeckung dieses Satzes beheben.
Eigenschaften
Der Standard spezifizierte 6.067 Zeichen, bestehend aus:
- 21 griechische Schriftzeichen mit diakritischen Zeichen
- 26 osteuropäische Schriftzeichen mit diakritischen Zeichen (meist kyrillisch)
- 198 alphabetische Zeichen mit diakritischen Zeichen
- 5.801 Kanji
Kodierungen
Die folgenden Codierungen oder Kapselungen werden verwendet, um die Verwendung von JIS X 0212-Zeichen in Dateien usw. zu ermöglichen.
- In EUC-JP werden Zeichen durch drei Bytes dargestellt, wobei das erste 0x8F und die folgenden zwei Byte im Bereich 0xA1 - 0xFE sind.
- In bestimmten Implementierungen der ISO 2022- basierten JIS-Codierung - einschließlich ISO-2022-JP-EXT , ISO-2022-JP-1 und ISO-2022-JP-2 - wird die Sequenz "ESC $ (D") verwendet, um JIS anzuzeigen X 0212 Zeichen.
Es ist keine Kapselung von JIS X 0212-Zeichen in der beliebten Shift JIS- Codierung möglich, da Shift JIS nicht über genügend nicht zugewiesenen Codebereich für die Zeichen verfügt.
Implementierungen
JIS X 0212 wird von IBM als Codepage 953 bezeichnet , die Herstellererweiterungen enthält. Die alternative CCSID 5049 schließt diese Erweiterungen aus.
Da JIS X 0212-Zeichen in Shift JIS, dem Codierungssystem, das traditionell die japanische Informationsverarbeitung dominiert hat, nicht codiert werden können, wurden nur wenige praktische Implementierungen des Zeichensatzes durchgeführt. Wie oben erwähnt, kann es in EUC-JP codiert werden, das üblicherweise in Unix / Linux-Systemen verwendet wird, und hier sind die meisten Implementierungen aufgetreten:
- Anfang der neunziger Jahre wurden grundlegende "BDF" -Schriftarten für die Verwendung im Unix X Window System kompiliert .
- Für das WNN-System wurde eine IME-Konvertierungsdatei kompiliert.
- Die kterm- Konsolenfensteranwendung wurde erweitert, um sie zu unterstützen.
- Die Redakteure von Emacs und jstevie wurden erweitert, um dies zu unterstützen.
Viele WWW-Browser wie die Netscape / Mozilla / Firefox- Familie, Opera usw. und verwandte Anwendungen wie Mozilla Thunderbird unterstützen die Anzeige von JIS X 0212-Zeichen in EUC-JP-Codierung, Internet Explorer unterstützt jedoch keine JIS X 0212-Zeichen. Moderne Terminalemulationspakete wie das GNOME-Terminal unterstützen auch JIS X 0212-Zeichen.
Zu den Anwendungen, die JIS X 0212 in der EUC-Codierung unterstützen, gehören:
- das xjdic- Wörterbuchprogramm für Unix / Linux;
- der japanische WWWJDIC- Wörterbuchserver (da Internet Explorer die JIS X 0212-Erweiterungen in EUC nicht unterstützt, sendet dieser Server Bit-Mapping-Grafiken für diese Zeichen, wenn er im EUC-JP-Modus eingestellt ist.)
JIS X 0212 und Unicode
Das Kanji in JIS X 0212 wurde als eine der Quellen für die Han-Vereinigung verwendet , die zu dem einheitlichen Satz von CJK- Zeichen im ursprünglichen ISO 10646 / Unicode- Standard führte. Alle 5.801 Kanji wurden eingearbeitet.
Die Zukunft
Abgesehen von den oben genannten Anwendungen ist der JIS X 0212-Standard praktisch tot. 2.743 Kanji davon wurden in den späteren JIS X 0213- Standard aufgenommen. Langfristig wird sein Beitrag wahrscheinlich die 5.801 Kanji sein, die in Unicode aufgenommen wurden .
Siehe auch
Verweise
- JIS X 0212-1990 1990 年 用 漢字 符号 - 補助 漢字, 日本 規格 協会, 東京 (1990 年 10 月 1 日 制定). (das japanische Standarddokument)
- Verständnis der japanischen Informationsverarbeitung, Ken Lunde, O'Reilly & Assoc. 1993
- CJKV Informationsverarbeitung, Ken Lunde, O'Reilly & Assoc. 1999, 2008.