GB2312 - GB 2312
MIME / IANA |
GB_2312-80 ( GB2312 für übliches EUC-Formular) |
---|---|
Alias(e) | iso-ir-58, chinesisch, csGB2312, csISO58GB231280 |
Sprachen) |
Vereinfachtes Chinesisch , Englisch Teilweise Unterstützung: Russisch , Griechisch , Japanisch |
Standard | GB/T 2312-1980 |
Einstufung | ISO-2022- kompatibles DBCS , CJK- Kodierung |
Erweiterungen | ISO-IR-165 |
Kodierungsformate |
EUC-CN ( GB2312 ), HZ-GB-2312 |
Vorangestellt | Chinesischer Telegrafencode |
gefolgt von | GBK , GB 18030 |
Andere verwandte Codierung(en) | JIS X 0208 , KS X 1001 |
GB/T 2312-1980 ist ein wichtiger offizieller Zeichensatz der Volksrepublik China , der für vereinfachte chinesische Schriftzeichen verwendet wird . GB2312 ist der registrierte Internetname für EUC-CN , was seine übliche codierte Form ist. GB bezieht sich auf die Guobiao-Standards (国家标准), während das T- Suffix (推荐; tuījiàn ; 'Empfehlung') einen nicht obligatorischen Standard bezeichnet.
GB/T 2312-1980 war ursprünglich ein verbindlicher nationaler Standard mit der Bezeichnung GB 2312-1980 . Nach einem National Standard Bulletin der Volksrepublik China im Jahr 2017 ist GB 2312 jedoch nicht mehr obligatorisch und sein Standardcode wird in GB/T 2312-1980 geändert . GB/T 2312-1980 wurde durch GBK und GB18030 ersetzt , die zusätzliche Zeichen enthalten, aber GB/T 2312 bleibt als Teilmenge dieser Codierungen weit verbreitet.
Im Oktober 2021 ist GB2312 die beliebteste deklarierte chinesisch-spezifische Codierung im Internet, wobei 7,4 % der Webseiten aus China und Gebieten, die es deklarieren, und 0,1 % aller Webseiten weltweit bereitgestellt werden, ein Rückgang gegenüber 3,5 % im Januar 2010 Beachten Sie jedoch, dass alle gängigen Webbrowser Dokumente decodieren, die zB mit "GB2312" oder " GB 2312 " (nicht alle für "GB_2312") gekennzeichnet sind, als ob sie mit " gbk " gekennzeichnet wären , was eine Obersatzkodierung ist, und GB 2312 und GBK hat einen gemeinsamen Anteil von 10,0 % (oder weniger als 0,2 % weltweit).
Es gibt einen analogen Zeichensatz, der als GB/T 12345 bekannt ist und eng mit GB/T 2312 verwandt ist, jedoch mit traditionellen Zeichenformen, die vereinfachte Formen ersetzen, und einigen zusätzlichen 62 zusätzlichen Zeichen. GB-codierte Schriftarten werden oft paarweise geliefert, einer mit dem Zeichensatz GB/T 2312 (vereinfacht) und der andere mit dem Zeichensatz GB/T 12345 (traditionell).
Zeichen
Während GB/T 2312 über 99,99% des zeitgenössischen chinesischen Textgebrauchs abdeckt, bleiben historische Texte und viele Namen außerhalb des Geltungsbereichs. Der alte GB 2312- Standard enthält 6.763 chinesische Zeichen (auf zwei Ebenen: die erste ist nach dem Lesen geordnet, die zweite nach dem Radikal und dann der Anzahl der Striche), zusammen mit Symbolen und Satzzeichen, japanischem Kana , dem griechischen und kyrillischen Alphabet , Zhuyin und einem Doppel -Byte-Satz von Pinyin- Buchstaben mit Tonmarkierungen . In der späteren Version GB/T 2312-1980 sind es 7.445 Buchstaben.
Zeichen in GB/T 2312 sind in einem 94x94-Raster angeordnet (wie in ISO 2022 ) und der Zwei-Byte-Codepunkt jedes Zeichens wird in der Form kuten (oder quwei) ausgedrückt, die eine Zeile (ku oder qu) angibt und die Position des Zeichens innerhalb der Zeile (cell, ten oder wei).
Die Zeilen (nummeriert von 1 bis 94) enthalten folgende Zeichen:
- 01–09, bestehend aus Satzzeichen und anderen Sonderzeichen; auch Hiragana , Katakana , Griechisch , Kyrillisch , Pinyin , Bopomofo
- 16–55, die erste Stufe der chinesischen Schriftzeichen , angeordnet nach Pinyin . (3755 Zeichen).
- 56–87, die zweite Ebene der chinesischen Schriftzeichen, geordnet nach Radikal und Strichen. (3008 Zeichen).
- 88–89, weitere chinesische Schriftzeichen. (103 Zeichen). Nur für GB/T 12345 definiert, nicht für GB/T 2312.
Die Zeilen 10–15 und 90–94 sind nicht belegt.
Für GB/T 2312-1980 enthält es 682 Zeichen und 6763 chinesische Zeichen.
Kodierungen von GB/T 2312
EUC-CN
EUC-CN wird häufig als Zeichenkodierung (dh für externe Speicherung) in Programmen verwendet, die mit GB/T 2312 umgehen, wodurch die Kompatibilität mit ASCII erhalten bleibt . Zwei Bytes werden verwendet, um jedes Zeichen darzustellen, das nicht in ASCII gefunden wird . Der Wert des ersten Bytes ist von 0xA1–0xF7 (161–247), während der Wert des zweiten Bytes von 0xA1–0xFE (161–254) reicht. Da alle diese Bereiche jenseits von ASCII liegen, wie UTF-8, kann bei Verwendung von EUC-CN überprüft werden, ob ein Byte Teil eines Multi-Byte-Konstrukts ist, nicht jedoch, ob ein Byte das erste oder letzte ist.
Im Vergleich zu UTF-8 ist GB2312 (ob nativ oder in EUC-CN kodiert) speichereffizienter: Während UTF-8 drei Bytes pro CJK-Ideogramm verwendet , verwendet GB2312 nur zwei. GB2312 deckt jedoch nicht so viele Ideogramme ab wie Unicode.
Um die Kuten-Codepunkte Bytes zuzuordnen, fügen Sie 160 (0xA0) zur Zeilennummer (ku, die 1000er und 100er Stelle) des Codepunktes hinzu, um das High-Byte zu bilden, und fügen Sie 160 zur Spaltennummer hinzu (zehn, die 10er und 1. Stelle) des Codepoints, um das Low-Byte zu bilden.
Wenn Sie beispielsweise den GB/T 2312-Codepunkt 4566 ("外", was Fremd bedeutet) haben, verwendet das High-Byte die Zeilennummer 45: 45+160=205=0xCD, und das Low-Byte kommt von der Spalte 66: 66+160=212=0xE2. Die vollständige Codierung ist also 0xCDE2.
HZ
HZ ist eine weitere Kodierung von GB 2312, die hauptsächlich für Usenet- Postings verwendet wird.
Codetabellen
In den folgenden Tabellen, in denen ein hexadezimales Zahlenpaar für ein Präfixbyte oder ein Kodierbyte angegeben ist, wird die kleinere (mit dem nicht gesetzten oder nicht verfügbaren achten Bit) verwendet, wenn über GL ( 0x 21-0x7E) kodiert wird , wie in ISO- 2022-CN oder HZ-GB-2312 , und der größere (mit dem achten Bitsatz) wird im typischeren Fall verwendet, in dem er über GR (0xA1-0xFE) codiert wird, wie in EUC-CN , GBK oder GB 18030 . Qūwèi- Zahlen werden dezimal angegeben.
Wenn GB/T 2312 über GR codiert wird, haben beide Bytes den achten Bitsatz (dh sind größer als 0x7F). GBK und GB 18030 verwenden auch Zwei-Byte-Codes, bei denen nur das erste Byte das achte Bit für Erweiterungszwecke gesetzt hat: Solche Codes liegen außerhalb der GB/T 2312-Ebene und werden hier nicht tabellarisch aufgeführt.
Leitbyte
Dieses Diagramm beschreibt das Gesamtlayout der Hauptebene des GB/T 2312-Zeichensatzes nach Leitbyte. Für Leitbytes , die für andere Zeichen als hanzi verwendet werden , werden auf dieser Seite Links zu Diagrammen bereitgestellt, in denen die unter diesem Leitbyte codierten Zeichen aufgeführt sind. Für für Hanzi verwendete Lead-Bytes werden Links zum entsprechenden Abschnitt des Hanzi-Index von Wiktionary bereitgestellt.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_/A_ |
SP 0020 |
Punkt. LEITUNG 1-_ |
Liste LEAD 2-_ |
Alnum. FÜHRUNG 3-_ |
Hiragana BLEI 4-_ |
Katakana LEAD 5-_ |
Griechischer LEAD 6-_ |
Kyrillisch LEAD 7-_ |
Telefon. BLEI 8-_ |
Kasten BLEI 9-_ |
10-_ |
11-_ |
12-_ |
13-_ |
14-_ |
fünfzehn-_ |
3_/B_ |
Hanzi L1 LEAD 16-_ |
Hanzi L1 LEAD 17-_ |
Hanzi L1 LEAD 18-_ |
Hanzi L1 LEAD 19-_ |
Hanzi L1 LEAD 20-_ |
Hanzi L1 LEAD 21-_ |
Hanzi L1 LEAD 22-_ |
Hanzi L1 LEAD 23-_ |
Hanzi L1 LEAD 24-_ |
Hanzi L1 LEAD 25-_ |
Hanzi L1 LEAD 26-_ |
Hanzi L1 LEAD 27-_ |
Hanzi L1 LEAD 28-_ |
Hanzi L1 LEAD 29-_ |
Hanzi L1 LEAD 30-_ |
Hanzi L1 LEAD 31-_ |
4_/C_ |
Hanzi L1 LEAD 32-_ |
Hanzi L1 LEAD 33-_ |
Hanzi L1 LEAD 34-_ |
Hanzi L1 LEAD 35-_ |
Hanzi L1 LEAD 36-_ |
Hanzi L1 LEAD 37-_ |
Hanzi L1 LEAD 38-_ |
Hanzi L1 LEAD 39-_ |
Hanzi L1 LEAD 40-_ |
Hanzi L1 LEAD 41-_ |
Hanzi L1 LEAD 42-_ |
Hanzi L1 LEAD 43-_ |
Hanzi L1 LEAD 44-_ |
Hanzi L1 LEAD 45-_ |
Hanzi L1 LEAD 46-_ |
Hanzi L1 LEAD 47-_ |
5_/D_ |
Hanzi L1 LEAD 48-_ |
Hanzi L1 LEAD 49-_ |
Hanzi L1 LEAD 50-_ |
Hanzi L1 LEAD 51-_ |
Hanzi L1 LEAD 52-_ |
Hanzi L1 LEAD 53-_ |
Hanzi L1 LEAD 54-_ |
Hanzi L1 LEAD 55-_ |
Hanzi L2 LEAD 56-_ |
Hanzi L2 LEAD 57-_ |
Hanzi L2 LEAD 58-_ |
Hanzi L2 LEAD 59-_ |
Hanzi L2 LEAD 60-_ |
Hanzi L2 LEAD 61-_ |
Hanzi L2 LEAD 62-_ |
Hanzi L2 LEAD 63-_ |
6_/E_ |
Hanzi L2 LEAD 64-_ |
Hanzi L2 LEAD 65-_ |
Hanzi L2 LEAD 66-_ |
Hanzi L2 LEAD 67-_ |
Hanzi L2 LEAD 68-_ |
Hanzi L2 LEAD 69-_ |
Hanzi L2 LEAD 70-_ |
Hanzi L2 LEAD 71-_ |
Hanzi L2 LEAD 72-_ |
Hanzi L2 LEAD 73-_ |
Hanzi L2 LEAD 74-_ |
Hanzi L2 LEAD 75-_ |
Hanzi L2 LEAD 76-_ |
Hanzi L2 LEAD 77-_ |
Hanzi L2 LEAD 78-_ |
Hanzi L2 LEAD 79-_ |
7_/F_ |
Hanzi L2 LEAD 80-_ |
Hanzi L2 LEAD 81-_ |
Hanzi L2 LEAD 82-_ |
Hanzi L2 LEAD 83-_ |
Hanzi L2 LEAD 84-_ |
Hanzi L2 LEAD 85-_ |
Hanzi L2 LEAD 86-_ |
Hanzi L2 LEAD 87-_ |
88-_ |
89-_ |
90-_ |
91-_ |
92-_ |
93-_ |
94-_ |
DEL 007F |
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
Nicht-Hanzi-Reihen
In den folgenden Tabellen sind die Nicht- Hanzi- Zeichen aufgeführt, die in GB/T 2312, in GB/T 12345 und in der Doppelbyte -Region 1 von GB 18030 verfügbar sind (was ungefähr der Nicht-Hanzi-Region von GB/T 2312 entspricht). Wo diese sich unterscheiden und wo GB 6345.1 und ISO-IR-165 davon abweichen, werden Hinweise gemacht . Zum Vergleich werden Querverweise auf Artikel zu anderen nationalen CJK-Zeichensätzen hergestellt.
Zwei Implementierungen von GB2312
EUC-CN | GBK/GB18030-Untergruppe | GB2312.TXT | Charaktername |
---|---|---|---|
A1A4 | U+00B7 · MITTLERER PUNKT | U+30FB ・ KATAKANA MITTLERER DOT | 间隔点; ' Trennpunkt ' |
A1AA | U+2014 — EM DASH | U+2015 ― HORIZONTALER BAR | 破折号; ' em Strich ' |
Unicode-Zuordnungen des Interpunkts ( Chinesisch :间隔点; wörtlich 'Trennpunkt') und des Bindestrichs ( Chinesisch :破折号) in der Untermenge von GBK und GB 18030 entsprechend GB/T 2312 ( U+00B7 · MIDDLE DOT und U+ 2014 — EM DASH ) unterscheiden sich von denen, die in GB2312.TXT ( U+30FB ・ KATAKANA MIDDLE DOT und U+2015 ― HORIZONTAL BAR ) aufgeführt sind, eine Datendatei , die zuvor vom Unicode-Konsortium bereitgestellt wurde , obwohl sie wurde seit August 2011 als veraltet eingestuft und wird seit September 2016 nicht mehr gehostet.
Ab 2015 folgt Microsoft .Net Framework den GB 18030-Zuordnungen bei der Zuordnung dieser beiden Zeichen in Daten mit der Bezeichnung gb2312
, während ICU , iconv-1.14, php-5.6, ActivePerl-5.20, Java 1.7 und Python 3.4 GB2312.TXT als Reaktion auf die gb2312
Bezeichnung folgen . Ruby 2.2 ist mit beiden Implementierungen kompatibel; es konvertiert intern die widersprüchlichen Zeichen in die GB 18030-Untermenge. Die technische Empfehlung des W3C / WHATWG für die Verwendung mit HTML5 spezifiziert eine GBK-Codierung, die für Streams mit der Bezeichnung abgeleitet wird gb2312
, die wiederum einen GB18030-Decoder verwendet.
Andere unterschiedliche Zuordnungen wurden von einzelnen Anbietern definiert und verwendet, darunter eine von Apple .
Zeichensatz 0x21/0xA1 (Zeile 1: Satzzeichen und Symbole)
Diese Zeile enthält Satzzeichen, mathematische Operatoren und andere Symbole. Die folgende Tabelle zeigt zuerst die GB 18030-Zuordnungen für diese GB/T 2312-Zeichen, gefolgt von allen anderen dokumentierten Zuordnungen.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_/A_ |
IDSP 3000 1-1 |
, 3001 1-2 |
. 3002 1-3 |
· /・ 00B7/30FB 1-4 |
ˉ 02C9 1-5 |
02C7 1-6 |
¨ 00A8 1-7 |
〃 3003 1-8 |
々 3005 1-9 |
— / ― 2014/2015 1-10 |
\ / \ FF5E / 301C 1-11 |
‖ / ∥ 2016/2225 1-12 |
… / ⋯ 2026/22EF 1-13 |
' 2018 1-14 |
' 2019 1-15 |
|
3_/B_ |
„ 201C 1-16“ |
” 201D 1-17 |
〔 3014 1-18 |
〕 3015 1-19 |
< 3008 1-20 |
> 3009 1-21 |
" 300A 1-22 |
" 300B 23.01 |
「 300C 1-24 |
」 300D 1-25 |
『 300E 1-26 |
』 300F 1-27 |
〖 3016 1-28 |
〗 3017 1-29 |
【 3010 1-30 |
】 3011 1-31 |
4_/C_ |
± 00B1 1-32 |
× 00D7 1-33 |
÷ 00F7 1-34 |
: 2236 1-35 |
∧ 2227 1-36 |
∨ 2228 1-37 |
Σ 2211 1-38 |
Π 220F 1-39 |
∪ 222A 1-40 |
∩ 2229 1-41 |
∈ 2208 1-42 |
∷ 2237 1-43 |
√ 221A 1-44 |
⊥ 22A5 1-45 |
∥ 2225 1-46 |
∠ 2220 1-47 |
5_/D_ |
⌒ 2312 1-48 |
⊙ 2299 1-49 |
∫ 222B 1-50 |
∮ 222E 1-51 |
≡ 2261 1-52 |
≌ 224C 1-53 |
≈ 2248 1-54 |
∽ 223D 1-55 |
Α 221D 1-56 |
≠ 2260 1-57 |
≮ 226E 1-58 |
≯ 226F 1-59 |
≤ 2264 1-60 |
≥ 2265 1-61 |
∞ 221E 1-62 |
∵ 2235 1-63 |
6_/E_ |
∴ 2234 1-64 |
♂ 2642 1-65 |
♀ 2640 1-66 |
° 00B0 1-67 |
' 2032 1-68 |
" 2033 1-69 |
℃ 2103 1-70 |
$ FF04 1-71 |
¤ 00A4 1-72 |
¢ / ¢ FFE0 / 00A2 1-73 |
£ / £ FFE1 / 00A3 1-74 |
‰ 2030 1-75 |
§ 00A7 1-76 |
№ 2116 1-77 |
☆ 2606 1-78 |
★ 2605 1-79 |
7_/F_ |
○ 25 KB 1-80 |
● 25CF 1-81 |
◎ 25CE 1-82 |
◇ 25C7 1-83 |
◆ 25C6 1-84 |
□ 25A1 1-85 |
■ 25A0 1-86 |
△ 25b3 1-87 |
▲ 25b2 1-88 |
※ 203B 1-89 |
→ 2192 1-90 |
← 2190 1-91 |
↑ 2191 1-92 |
↓ 2193 1-93 |
〓 3013 1-94 |
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
Zeichensatz 0x22/0xA2 (Zeile 2: Listenmarker)
Diese Zeile enthält verschiedene Arten von Listenmarkierungen. Kleinbuchstaben der römischen Ziffern waren weder in der ursprünglichen GB/T 2312 noch in GB/T 12345 enthalten, sondern sowohl in der Windows-Codepage 936 als auch in der GB 18030 enthalten . Ein Eurozeichen wurde auch von GB 18030 hinzugefügt.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_/A_ |
Ⅰ 2170 2-1 |
Ⅱ 2171 2-2 |
Ⅲ 2172 2-3 |
Ⅳ 2173 2-4 |
Ⅴ 2174 2-5 |
Ⅵ 2175 2-6 |
Ⅶ 2176 2-7 |
Ⅷ 2177 2-8 |
Ⅸ 2178 2-9 |
Ⅹ 2179 2-10 |
2-11 |
2-12 |
2-13 |
2-14 |
2-15 |
|
3_/B_ |
2-16 |
⒈ 2488 2-17 |
⒉ 2489 2-18 |
⒊ 248A 2-19 |
⒋ 248B 20.02 |
⒌ 248C 2-21 |
⒍ 248D 2-22 |
⒎ 248e 2-23 |
⒏ 248F 2-24 |
⒐ 2490 2-25 |
⒑ 2491 2-26 |
⒒ 2492 2-27 |
⒓ 2493 2-28 |
⒔ 2494 2-29 |
⒕ 2495 2-30 |
⒖ 2496 2-31 |
4_/C_ |
⒗ 2497 2-32 |
⒘ 2498 2-33 |
⒙ 2499 2-34 |
⒚ 249A 2-35 |
⒛ 249B 2-36 |
⑴ 2474 2-37 |
⑵ 2475 2-38 |
⑶ 2476 2-39 |
⑷ 2477 2-40 |
⑸ 2478 2-41 |
⑹ 2479 2-42 |
⑺ 247A 2-43 |
⑻ 247B 2-44 |
⑼ 247C 2-45 |
⑽ 247d 2-46 |
⑾ 247E 2-47 |
5_/D_ |
⑿ Hot 247 ° F-Todesfalle Sauna 2-48 |
⒀ 2480 2-49 |
⒁ 2481 2-50 |
⒂ 2482 2-51 |
⒃ 2483 2-52 |
⒄ 2484 2-53 |
⒅ 2485 2-54 |
⒆ 2486 2-55 |
⒇ 2487 2-56 |
① 2460 2-57 |
② 2461 2-58 |
③ 2462 2-59 |
④ 2463 2-60 |
⑤ 2464 2-61 |
⑥ 2465 2-62 |
⑦ 2466 2-63 |
6_/E_ |
⑧ 2467 2-64 |
⑨ 2468 2-65 |
⑩ 2469 2-66 |
€ 20AC 2-67 |
2-68 |
㈠ 3220 2-69 |
㈡ 3221 2-70 |
㈢ 3222 2-71 |
㈣ 3223 2-72 |
㈤ 3224 2-73 |
㈥ 3225 2-74 |
㈦ 3226 2-75 |
㈧ 3227 2-76 |
㈨ 3228 2-77 |
㈩ 3229 2-78 |
2-79 |
7_/F_ |
2-80 |
Ⅰ 2160 2-81 |
Ⅱ 2161 2-82 |
Ⅲ 2162 2-83 |
Ⅳ 2163 2-84 |
Ⅴ 2164 2-85 |
Ⅵ 2165 2-86 |
Ⅶ 2166 2-87 |
Ⅷ 2167 2-88 |
Ⅸ 2168 2-89 |
Ⅹ 2169 2-90 |
Ⅺ 216A 2-91 |
Ⅻ 216B 2-92 |
2-93 |
2-94 |
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
Zeichensatz 0x23/0xA3 (Zeile 3: ISO 646-CN)
Diese Zeile enthält ISO 646-CN (GB/T 1988-80), ein nationales Gegenstück zu ASCII . Vergleichen Sie Zeile 3 von KS X 1001 , die dasselbe mit der südkoreanischen ISO 646-Version macht, und Zeile 3 von JIS X 0208 und von KPS 9566 , die nur die alphanumerische Teilmenge enthalten, jedoch im gleichen Layout. Die folgende Tabelle listet ISO 646-CN auf.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_/A_ |
|
! 0021 3-1 |
" 0022 3-2 |
# 0023 3-3 |
¥ 00A5 3-4 |
% 0025 3-5 |
& 0026 3-6 |
' 0027 3-7 |
( 0028 3-8 |
) 0029 3-9 |
* 002A 3-10 |
+ 002B 3-11 |
, 002C 3-12 |
- 002D 3-13 |
. 002E 3-14 |
/ 002F 3-15 |
3_/B_ |
0 0030 3-16 |
1 0031 3-17 |
2 0032 3-18 |
3 0033 3-19 |
4 0034 3-20 |
5 0035 3-21 |
6 0036 3-22 |
7 0037 3-23 |
8 0038 3-24 |
9 0039 3-25 |
: 003A 3-26 |
; 003B 3-27 |
< 003C 3-28 |
= 003D 3-29 |
> 003E 3-30 |
? 003F 3-31 |
4_/C_ |
@ 0040 3-32 |
A 0041 3-33 |
B 0042 3-34 |
C 0043 3-35 |
D 0044 3-36 |
E 0045 3-37 |
F 0046 3-38 |
G 0047 3-39 |
H 0048 3-40 |
Ich 0049 3-41 |
J 004A 3-42 |
K 004B 3-43 |
L 004C 3-44 |
M 004D 3-45 |
N 004E 3-46 |
O 004F 3-47 |
5_/D_ |
P 0050 3-48 |
Q 0051 3-49 |
R 0052 3-50 |
S 0053 3-51 |
T 0054 3-52 |
U 0055 3-53 |
V 0056 3-54 |
W 0057 3-55 |
X 0058 3-56 |
Y 0059 3-57 |
Z 005A 3-58 |
[ 005B 3-59 |
\ 005C 3-60 |
] 005D 3-61 |
^ 005E 3-62 |
_ 005F 3-63 |
6_/E_ |
` 0060 3-64 |
a 0061 3-65 |
b 0062 3-66 |
c 0063 3-67 |
d 0064 3-68 |
e 0065 3-69 |
f 0066 3-70 |
g 0067 3-71 |
h 0068 3-72 |
ich 0069 3-73 |
j 006A 3-74 |
k 006B 3-75 |
l 006C 3-76 |
m 006D 3-77 |
n 006E 3-78 |
o 006F 3-79 |
7_/F_ |
S. 0070 3-80 |
q 0071 3-81 |
r 0072 3-82 |
s 0073 3-83 |
t 0074 3-84 |
u 0075 3-85 |
v 0076 3-86 |
w 0077 3-87 |
x 0078 3-88 |
y 0079 3-89 |
z 007A 3-90 |
{ 007B 3-91 |
| 007C 3-92 |
} 007D 3-93 |
~ 203E 3-94 |
|
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
Bei Verwendung in einer Codierung, die eine Kombination mit ASCII wie EUC-CN (und seiner Obermenge GB 18030 ) ermöglicht, werden diese Zeichen normalerweise als Zeichen voller Breite implementiert , daher werden Zuordnungen zu den Halbbreiten- und Vollbreiten-Formularblöcken wie unten gezeigt verwendet. GB 6345.1 behandelt diese Zeile auch als volle Breite und fügt die Halbbreitenformen (wie oben) als Zeile 10 hinzu. Apple ordnet diese Zeile hauptsächlich Codepunkten voller Breite wie unten zu, verwendet jedoch Zuordnungen ohne volle Breite für die Überstriche und das Yuan-Zeichen wie oben.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_/A_ |
! FF01 3-1 |
" FF02 3-2 |
# FF03 3-3 |
¥ FFE5 3-4 |
% FF05 3-5 |
& FF06 3-6 |
' FF07 3-7 |
( FF08 3-8 |
) FF09 3-9 |
* FF0A 3-10 |
+ FF0B 3-11 |
, FF0C 3-12 |
- FF0D 3-13 |
Ich FF0E 3-14 |
/ FF0F 3-15 |
|
3_/B_ |
0 FF10 16.03 |
1 FF11 3-17 |
2 FF12 3-18 |
3 FF13 3-19 |
4 FF14 3-20 |
5 FF15 21.03 |
6 FF16 3-22 |
7 FF17 3-23 |
8 FF18 3-24 |
9 FF19 3-25 |
: FF1A 3-26 |
; FF1b 3-27 |
< FF1C 3-28 |
= FF1D 3-29 |
> FF1E 3-30 |
? FF1F 3-31 |
4_/C_ |
@ FF20 3-32 |
Ein FF21 3-33 |
B FF22 3-34 |
C FF23 3-35 |
D FF24 3-36 |
E FF25 3-37 |
F FF26 3-38 |
G FF27 3-39 |
H FF28 3-40 |
Ich FF29 3-41 |
J FF2a 3-42 |
K FF2b 3-43 |
L FF2C 3-44 |
M FF2D 3-45 |
N FF2E 3-46 |
O FF2F 3-47 |
5_/D_ |
P FF30 3-48 |
Q FF31 3-49 |
R FF32 3-50 |
S FF33 3-51 |
T FF34 3-52 |
U FF35 3-53 |
V FF36 3-54 |
W FF37 3-55 |
X FF38 3-56 |
Y FF39 3-57 |
Z FF3A 3-58 |
[ FF3B 3-59 |
\ FF3C 3-60 |
] FF3D 3-61 |
^ FF3E 3-62 |
_ FF3F 3-63 |
6_/E_ |
` FF40 3-64 |
ein FF41 3-65 |
b FF42 3-66 |
c FF43 3-67 |
d FF44 3-68 |
e FF45 3-69 |
f FF46 3-70 |
g / ɡ FF47 / 0261 3-71 |
h FF48 3-72 |
i FF49 3-73 |
j FF4A 3-74 |
k FF4B 3-75 |
l FF4C 3-76 |
m FF4D 3-77 |
n FF4E 3-78 |
o FF4F 3-79 |
7_/F_ |
p FF50 3-80 |
q FF51 3-81 |
r FF52 3-82 |
s FF53 3-83 |
t FF54 3-84 |
u FF55 3-85 |
v FF56 3-86 |
w FF57 3-87 |
x FF58 3-88 |
y FF59 3-89 |
z FF5A 3-90 |
{ FF5B 3-91 |
| FF5C 3-92 |
} FF5D 3-93 |
¯ FFE3 3-94 |
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
Zeichensatz 0x24/0xA4 (Zeile 4: Hiragana)
Dieses Set enthält Hiragana zum Schreiben der japanischen Sprache .
Vergleichen Sie mit Zeile 4 von JIS X 0208 , der diese Zeile entspricht, und mit Zeile 10 von KS X 1001 und von KPS 9566 , die dasselbe Layout verwenden, jedoch in einer anderen Zeile.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_/A_ |
ぁ 3041 4-1 |
あ 3042 4-2 |
ぃ 3043 4-3 |
い 3044 4-4 |
ぅ 3045 4-5 |
う 3046 4-6 |
ぇ 3047 4-7 |
え 3048 4-8 |
ぉ 3049 4-9 |
お 304A 4-10 |
か 304B 11.04 |
が 304C 4-12 |
き 304D 4-13 |
ぎ 304E 14.04 |
く 304F 4-15 |
|
3_/B_ |
ぐ 3050 4-16 |
け 3051 4-17 |
げ 3052 4-18 |
こ 3053 4-19 |
ご 3054 4-20 |
さ 3055 4-21 |
ざ 3056 4-22 |
し 3057 4-23 |
じ 3058 4-24 |
す 3059 4-25 |
ず 305A 4-26 |
せ 305B 27.04 |
ぜ 305C 4-28 |
そ 305D 4-29 |
ぞ 305E 30.04 |
た 305F 4-31 |
4_/C_ |
だ 3060 4-32 |
ち 3061 4-33 |
ぢ 3062 4-34 |
っ 3063 4-35 |
つ 3064 4-36 |
づ 3065 4-37 |
て 3066 4-38 |
で 3067 4-39 |
と 3068 4-40 |
ど 3069 4-41 |
な 306A 4-42 |
に 306B 4-43 |
ぬ 306C 4-44 |
ね 306D 4-45 |
の 306E 4-46 |
は 306F 4-47 |
5_/D_ |
ば 3070 4-48 |
ぱ 3071 4-49 |
ひ 3072 4-50 |
び 3073 4-51 |
ぴ 3074 4-52 |
ふ 3075 4-53 |
ぶ 3076 4-54 |
ぷ 3077 4-55 |
へ 3078 4-56 |
べ 3079 4-57 |
ぺ 307A 4-58 |
ほ 307B 4-59 |
ぼ 307C 4-60 |
ぽ 307D 4-61 |
ま 307E 4-62 |
み 307f 4-63 |
6_/E_ |
む 3080 4-64 |
め 3081 4-65 |
も 3082 4-66 |
ゃ 3083 4-67 |
や 3084 4-68 |
ゅ 3085 4-69 |
ゆ 3086 4-70 |
ょ 3087 4-71 |
よ 3088 4-72 |
ら 3089 4-73 |
り 308A 4-74 |
る 308B 4-75 |
れ 308C 4-76 |
ろ 308D 4-77 |
ゎ 308E 4-78 |
わ 308F 4-79 |
7_/F_ |
ゐ 3090 4-80 |
ゑ 3091 4-81 |
を 3092 4-82 |
ん 3093 4-83 |
4-84 |
4-85 |
4-86 |
4-87 |
4-88 |
4-89 |
4-90 |
4-91 |
4-92 |
4-93 |
4-94 |
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
Zeichensatz 0x25/0xA5 (Zeile 5: Katakana)
Dieses Set enthält Katakana zum Schreiben der japanischen Sprache . Das japanische Langvokalzeichen , das im Katakana-Text verwendet wird und in Zeile 1 von JIS X 0208 enthalten ist , ist jedoch nicht in GB/T 2312 enthalten, obwohl es in GBK und GB 18030 außerhalb des Haupt-GB/T 2312 hinzugefügt wird Ebene, bei 0xA960.
Vergleichen Sie mit Zeile 5 von JIS X 0208 , der diese Zeile entspricht, und mit Zeile 11 von KS X 1001 und von KPS 9566 , die dasselbe Layout verwenden, jedoch in einer anderen Zeile.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_/A_ |
ァ 30A1 5-1 |
ア 30A2 5-2 |
ィ 30A3 5-3 |
イ 30A4 5-4 |
ゥ 30A5 5-5 |
ウ 30A6 5-6 |
ェ 30A7 5-7 |
エ 30A8 5-8 |
ォ 30A9 5-9 |
オ 30AA 5-10 |
カ 30AB 5-11 |
ガ 30AC 5-12 |
キ 30 n. Chr. 5-13 |
ギ 30AE 5-14 |
ク 30AF 5-15 |
|
3_/B_ |
グ 30B0 5-16 |
ケ 30B1 5-17 |
ゲ 30B2 5-18 |
コ 30B3 5-19 |
ゴ 30B4 5-20 |
サ 30b5 5-21 |
ザ 30B6 5-22 |
シ 30B7 5-23 |
ジ 30B8 5-24 |
ス 30B9 5-25 |
ズ 30ba 5-26 |
セ 30BB 5-27 |
ゼ 30 v. Chr. 5-28 |
ソ 30BD 5-29 |
ゾ 30BE 5-30 |
タ 30BF 5-31 |
4_/C_ |
ダ 30C0 5-32 |
チ 30C1 5-33 |
ヂ 30C2 5-34 |
ッ 30C3 5-35 |
ツ 30c4 5-36 |
ヅ 30C5 5-37 |
テ 30C6 5-38 |
デ 30C7 5-39 |
ト 30C8 5-40 |
ド 30C9 5-41 |
ナ 30CA 5-42 |
ニ 30CB 5-43 |
ヌ 30CC 5-44 |
ネ 30CD 5-45 |
ノ 30CE 5-46 |
ハ 30CF 5-47 |
5_/D_ |
バ 30D0 5-48 |
パ 30D1 5-49 |
ヒ 30D2 5-50 |
ビ 30D3 5-51 |
ピ 30D4 5-52 |
フ 30D5 5-53 |
ブ 30D6 5-54 |
プ 30D7 5-55 |
ヘ 30D8 5-56 |
ベ 30D9 5-57 |
ペ 30DA 5-58 |
ホ 30DB 5-59 |
ボ 30DC 5-60 |
ポ 30DD 5-61 |
マ 30DE 5-62 |
ミ 30DF 5-63 |
6_/E_ |
ム 30E0 5-64 |
メ 30E1 5-65 |
モ 30E2 5-66 |
ャ 30E3 5-67 |
ヤ 30E4 5-68 |
ュ 30E5 5-69 |
ユ 30E6 5-70 |
ョ 30E7 5-71 |
ヨ 30E8 5-72 |
ラ 30E9 5-73 |
リ 30EA 5-74 |
ル 30EB 5-75 |
レ 30EC 5-76 |
ロ 30ED 5-77 |
ヮ 30EE 5-78 |
ワ 30EF 5-79 |
7_/F_ |
ヰ 30F0 5-80 |
ヱ 30F1 5-81 |
ヲ 30F2 5-82 |
ン 30F3 5-83 |
ヴ 30F4 5-84 |
ヵ 30F5 5-85 |
ヶ 30F6 5-86 |
5-87 |
5-88 |
5-89 |
5-90 |
5-91 |
5-92 |
5-93 |
5-94 |
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
Zeichensatz 0x26/0xA6 (Zeile 6: Griechische und vertikale Erweiterungen)
Diese Zeile enthält grundlegende Unterstützung für das neugriechische Alphabet , ohne diakritische Zeichen oder das abschließende Sigma .
Die eingerahmten Zeichen sind Präsentationsformen von Satzzeichen für vertikales Schreiben und sind nicht in GB/T 2312 enthalten, aber in dieser Zeile von GB/T 12345, Mac OS Simplified Chinese und GB 18030 enthalten. Sie werden als " Standarderweiterungen zu GB 2312". Umgekehrt enthält ISO-IR-165 in dieser Zeile gemusterte halbgraphische Zeichen (meist ohne exakte Entsprechungen in Unicode), die mit den für die vertikalen Erweiterungen verwendeten Codepositionen kollidieren.
Vergleichen Sie mit Zeile 6 von JIS X 0208 , der diese Zeile entspricht, wenn die vertikalen Formen nicht enthalten sind, und mit Zeile 6 von KPS 9566 , die dieselben griechischen Buchstaben im selben Layout enthält, aber römische Ziffern anstelle von vertikalen Formen hinzufügt. Kontrastreihe 5 von KS X 1001 , die die griechischen Buchstaben versetzt, um die römischen Ziffern zuerst einzuschließen.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_/A_ |
Α 0391 6-1 |
Β 0392 6-2 |
Γ 0393 6-3 |
Δ 0394 6-4 |
Ε 0395 6-5 |
Ζ 0396 6-6 |
Η 0397 6-7 |
Θ 0398 6-8 |
Ι 0399 6-9 |
Κ 039A 6-10 |
Λ 039B 11.06 |
Μ 039C 6-12 |
Ν 039D 6-13 |
Ξ 039E 14.06 |
Ο 039F 6-15 |
|
3_/B_ |
Π 03A0 6-16 |
Ρ 03A1 6-17 |
Σ 03A3 6-18 |
Τ 03A4 6-19 |
Υ 03A5 6-20 |
Φ 03A6 6-21 |
Χ 03A7 6-22 |
Ψ 03A8 6-23 |
Ω 03A9 6-24 |
6-25 |
6-26 |
6-27 |
6-28 |
6-29 |
6-30 |
6-31 |
4_/C_ |
6-32 |
α 03B1 6-33 |
β 03B2 6-34 |
γ 03B3 6-35 |
δ 03B4 6-36 |
ε 03B5 6-37 |
ζ 03B6 6-38 |
η 03B7 6-39 |
θ 03B8 6-40 |
ι 03B9 6-41 |
κ 03BA 6-42 |
λ 03BB 6-43 |
μ 03BC 6-44 |
ν 03BD 6-45 |
ξ 03BE 6-46 |
ο 03BF 6-47 |
5_/D_ |
π 03C0 6-48 |
ρ 03C1 6-49 |
σ 03C3 6-50 |
τ 03C4 6-51 |
υ 03C5 6-52 |
φ 03C6 6-53 |
χ 03C7 6-54 |
ψ 03C8 6-55 |
ω 03C9 6-56 |
︐ FE10 6-57 |
︒ FE12 6-58 |
︑ FE11 6-59 |
︓ FE13 6-60 |
︔ FE14 6-61 |
︕ FE15 6-62 |
︖ FE16 6-63 |
6_/E_ |
( FE35 6-64 |
) FE36 6-65 |
︹ FE39 6-66 |
︺ FE3A 6-67 |
︿ FE3F 6-68 |
﹀ FE40 6-69 |
︽ FE3D 6-70 |
︾ FE3E 6-71 |
﹁ FE41 6-72 |
﹂ FE42 6-73 |
﹃ FE43 6-74 |
﹄ FE44 6-75 |
︗ FE17 6-76 |
︘ FE18 6-77 |
︻ FE3B 6-78 |
︼ Fe3C 6-79 |
7_/F_ |
{ FE37 6-80 |
} FE38 6-81 |
︱ FE31 6-82 |
︙ FE19 6-83 |
_ FE33 6-84 |
︴ FE34 6-85 |
6-86 |
6-87 |
6-88 |
6-89 |
6-90 |
6-91 |
6-92 |
6-93 |
6-94 |
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
Zeichensatz 0x27/0xA7 (Zeile 7: Kyrillisch)
Dieses Set enthält beide Fälle von 33 Buchstaben der kyrillischen Schrift , ausreichend, um das moderne russische Alphabet und das bulgarische Alphabet zu schreiben , obwohl andere Formen des Kyrillischen zusätzliche Buchstaben erfordern.
Vergleichen Sie mit Zeile 7 von JIS X 0208 , der diese Zeile entspricht, und mit Zeile 12 von KS X 1001 und Zeile 5 von KPS 9566 , die das gleiche Layout verwenden, aber in anderen Zeilen.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_/A_ |
А 0410 7-1 |
Б 0411 7-2 |
В 0412 7-3 |
Г 0413 7-4 |
Д 0414 7-5 |
Е 0415 7-6 |
Ё 0401 7-7 |
Ж 0416 7-8 |
З 0417 7-9 |
И 0418 7-10 |
Й 0419 7-11 |
К 041A 7-12 |
Л 041B 13.07 |
М 041C 7-14 |
Н 041D 7-15 |
|
3_/B_ |
О 041E 16.07 |
П 041F 7-17 |
Р 0420 7-18 |
С 0421 7-19 |
Т 0422 7-20 |
У 0423 7-21 |
Ф 0424 7-22 |
Х 0425 7-23 |
Ц 0426 7-24 |
Ч 0427 7-25 |
Ш 0428 7-26 |
Щ 0429 7-27 |
Ъ 042A 7-28 |
Ы 042B 29.07 |
Ь 042C 7-30 |
Э 042D 7-31 |
4_/C_ |
Ю 042E 7-32 |
Я 042F 7-33 |
7-34 |
7-35 |
7-36 |
7-37 |
7-38 |
7-39 |
7-40 |
7-41 |
7-42 |
7-43 |
7-44 |
7-45 |
7-46 |
7-47 |
5_/D_ |
7-48 |
а 0430 7-49 |
б 0431 7-50 |
в 0432 7-51 |
г 0433 7-52 |
д 0434 7-53 |
е 0435 7-54 |
ё 0451 7-55 |
ж 0436 7-56 |
з 0437 7-57 |
и 0438 7-58 |
© 0439 7-59 |
к 043A 7-60 |
л 043B 7-61 |
м 043C 7-62 |
н 043D 7-63 |
6_/E_ |
о 043E 7-64 |
п 043F 7-65 |
р 0440 7-66 |
с 0441 7-67 |
т 0442 7-68 |
у 0443 7-69 |
ф 0444 7-70 |
х 0445 7-71 |
ц 0446 7-72 |
ч 0447 7-73 |
ш 0448 7-74 |
щ 0449 7-75 |
ъ 044A 7-76 |
ы 044B 7-77 |
ь 044C 7-78 |
э 044D 7-79 |
7_/F_ |
ю 044E 7-80 |
я 044F 7-81 |
7-82 |
7-83 |
7-84 |
7-85 |
7-86 |
7-87 |
7-88 |
7-89 |
7-90 |
7-91 |
7-92 |
7-93 |
7-94 |
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
Zeichensatz 0x28/0xA8 (Zeile 8: Zhuyin und Nicht-ASCII-Pinyin)
Diese Zeile enthält Bopomofo- und Pinyin- Zeichen, ausgenommen ASCII-Buchstaben (die sich in Zeile 3 befinden). Eingerahmte Zeichen sind nicht im Basissatz von GB 2312 enthalten, werden jedoch von GB 6345.1 hinzugefügt und sind auch in GB/T 12345, Mac OS Simplified Chinese und GB 18030 enthalten. Sie werden als "Standarderweiterungen zu GB 2312" angesehen.
GB 6345.1 behandelt das Pinyin in dieser Reihe als volle Breite und enthält Gegenstücke halber Breite als Reihe 11; GB 18030 tut dies nicht.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_/A_ |
à 0101 8-1 |
á 00E1 8-2 |
ǎ 01CE 8-3 |
à 00E0 8-4 |
ç 0113 8-5 |
é 00E9 8-6 |
ě 011B 8-7 |
è 00E8 8-8 |
ï 012B 8-9 |
í 00ED 8-10 |
Ǐ 01D0 8-11 |
ì 00EC 8-12 |
ō 014D 8-13 |
ó 00F3 8-14 |
ǒ 01D2 8-15 |
|
3_/B_ |
ò 00F2 8-16 |
û 016B 17.08 |
ú 00FA 8-18 |
ǔ 01D4 8-19 |
ù 00F9 8-20 |
ǖ 01D6 8-21 |
Ǘ 01D8 8-22 |
ǚ 01DA 23.08 |
ǜ 01DC 8-24 |
ü 00FC 8-25 |
ê 00EA 8-26 |
ɑ 0251 8-27 |
M 1E3F 8-28 |
ń 0144 8-29 |
ò 0148 8-30 |
ǹ 01F9 8-31 |
4_/C_ |
ɡ / g 0261 / FF47 8-32 |
8-33 |
8-34 |
8-35 |
8-36 |
ㄅ 3105 8-37 |
ㄆ 3106 8-38 |
ㄇ 3107 8-39 |
ㄈ 3108 8-40 |
ㄉ 3109 8-41 |
ㄊ 310A 8-42 |
ㄋ 310B 8-43 |
ㄌ 310C 8-44 |
ㄍ 310D 8-45 |
ㄎ 310E 8-46 |
ㄏ 310F 8-47 |
5_/D_ |
ㄐ 3110 8-48 |
ㄑ 3111 8-49 |
ㄒ 3112 8-50 |
ㄓ 3113 8-51 |
ㄔ 3114 8-52 |
ㄕ 3115 8-53 |
ㄖ 3116 8-54 |
ㄗ 3117 8-55 |
ㄘ 3118 8-56 |
ㄙ 3119 8-57 |
ㄚ 311A 8-58 |
ㄛ 311B 8-59 |
ㄜ 311C 8-60 |
ㄝ 311D 8-61 |
ㄞ 311E 8-62 |
ㄟ 311F 8-63 |
6_/E_ |
ㄠ 3120 8-64 |
ㄡ 3121 8-65 |
ㄢ 3122 8-66 |
ㄣ 3123 8-67 |
ㄤ 3124 8-68 |
ㄥ 3125 8-69 |
ㄦ 3126 8-70 |
ㄧ 3127 8-71 |
ㄨ 3128 8-72 |
ㄩ 3129 8-73 |
8-74 |
8-75 |
8-76 |
8-77 |
8-78 |
8-79 |
7_/F_ |
8-80 |
8-81 |
8-82 |
8-83 |
8-84 |
8-85 |
8-86 |
8-87 |
8-88 |
8-89 |
8-90 |
8-91 |
8-92 |
8-93 |
8-94 |
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
Zeichensatz 0x29/0xA9 (Zeile 9: Boxzeichnung)
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_/A_ |
9-1 |
9-2 |
9-3 |
─ 2500 9-4 |
━ 2501 9-5 |
│ 2502 9-6 |
┃ 2503 9-7 |
┄ 2504 9-8 |
┅ 2505 9-9 |
┆ 2506 9-10 |
┇ 2507 9-11 |
┈ 2508 9-12 |
┉ 2509 9-13 |
┊ 250A 9-14 |
┋ 250B 15.09 |
|
3_/B_ |
┌ 250C 9-16 |
┍ 250D 9-17 |
┎ 250E 18.09 |
┏ 250F 9-19 |
┐ 2510 9-20 |
┑ 2511 9-21 |
┒ 2512 9-22 |
┓ 2513 9-23 |
└ 2514 9-24 |
┕ 2515 9-25 |
┖ 2516 9-26 |
┗ 2517 9-27 |
┘ 2518 9-28 |
┙ 2519 9-29 |
┚ 251A 9-30 |
┛ 251B 31.09 |
4_/C_ |
├ 251C 9-32 |
┝ 251D 9-33 |
┞ 251E 9-34 |
┟ Spitzen 251F 9-35 |
┠ 2520 9-36 |
┡ 2521 9-37 |
┢ 2522 9-38 |
┣ 2523 9-39 |
┤ 2524 9-40 |
┥ 2525 9-41 |
┦ 2526 9-42 |
┧ 2527 9-43 |
┨ 2528 9-44 |
┩ 2529 9-45 |
┪ 252A 9-46 |
┫ 252B 9-47 |
5_/D_ |
┬ 252C 9-48 |
┭ 252D 9-49 |
┮ 252E 9-50 |
┯ 252F 9-51 |
┰ 2530 9-52 |
┱ 2531 9-53 |
┲ 2532 9-54 |
┳ 2533 9-55 |
┴ 2534 9-56 |
┵ 2535 9-57 |
┶ 2536 9-58 |
┷ 2537 9-59 |
┸ 2538 9-60 |
┹ 2539 9-61 |
┺ 253A 9-62 |
┻ 253B 9-63 |
6_/E_ |
┼ 253C 9-64 |
┽ 253D 9-65 |
┾ 253E 9-66 |
┿ 253F 9-67 |
╀ 2540 9-68 |
╁ 2541 9-69 |
╂ 2542 9-70 |
╃ 2543 9-71 |
╄ 2544 9-72 |
╅ 2545 9-73 |
╆ 2546 9-74 |
╇ 2547 9-75 |
╈ 2548 9-76 |
╉ 2549 9-77 |
╊ 254A 9-78 |
╋ 254B 9-79 |
7_/F_ |
9-80 |
9-81 |
9-82 |
9-83 |
9-84 |
9-85 |
9-86 |
9-87 |
9-88 |
9-89 |
9-90 |
9-91 |
9-92 |
9-93 |
9-94 |
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
Hanzi-Reihen
Aufnahme von nicht standardmäßigen vereinfachten chinesischen Schriftzeichen und traditionellen chinesischen Schriftzeichen
GB/T 2312 enthalten 2 nicht standardmäßige vereinfachte chinesische Zeichen :
- 渖(68–41): Vereinfacht von „审[審] “, aber die vollständige Liste der vereinfachten Zeichen ( Chinesisch :简化字总表; Pinyin : Jiǎnhuà Zì Zǒng Biǎo ) hat „瀋“ mit „沈“ verschmolzen . Alte Versionen von Xinhua Zidian ( Chinesisch :新华字典; Pinyin : Xīnhuá Zìdiǎn ) hatten dieses Wort aufgenommen und als Saft ( Chinesisch :汁; pinyin : zhì ) notiert , neue Versionen haben dies gestrichen und „渖“ mit „沈“ verschmolzen .
- 镟(79–64): Vereinfacht von „钅[釒] “, aber die vollständige Liste der vereinfachten Zeichen hat „鏇“ mit „旋“ verschmolzen .
GB/T 2312 enthält auch 3 traditionelle chinesische Schriftzeichen :
- 鍾(79–81): Das Originaldokument verwendete das Zeichen „鍾“ mit traditionellem Teil, aber die vollständige Liste der vereinfachten Zeichen hat „鍾“ mit „鐘“ zusammengeführt und zu „钟“ vereinfacht , spätere Vorlagen änderten das Wort in „锺“.
- 後(65–65): Das Zeichen wurde mit „后“ (26-83) in der vollständigen Liste der vereinfachten Zeichen zusammengeführt und enthielt keine Hinweise auf unklare Verwendung, aber GB/T 2312 hatte dieses Zeichen aufgenommen.
- 麴(84–80): Im Originaldokument wurde das Zeichen „麴“ mit traditionellem Teil verwendet, aber die vollständige Liste der vereinfachten Zeichen hat angegeben, dass „麥“ zu „麦“ vereinfacht werden sollte ; das entsprechende vereinfachte chinesische Schriftzeichen „麹“ wurde von Japan als Shinjitai „麹“ an Unicode übermittelt . Tabelle der allgemeinen chinesischen Standardzeichen enthielt „麹“ auf 2013:7748.
Korrekturen
GB 5007.1-85 24x24 Bitmap Font Set of Chinese Characters for Information Exchange ( Chinesisch :信息交换用汉字 24x24 点阵字模集), eine Schriftvorlage basierend auf GB/T 2312, enthält einige Korrekturen, darunter:
- Ändern der Glyphenform des lateinischen Alphabets "g"
- Hinzufügen von 6 Hanyu Pinyin- Zeichen: ɑ , ḿ , ń , ň , ǹ , ɡ
- „鍾“ in „锺“ geändert
- enthalten 94 Glyphen halber Breite in Reihe 10 (halbe Breite von Reihe 3, entspricht GB 1988–80
- enthaltene Form halber Breite von 32 Hanyu Pinyin-Zeichen aus Reihe 8 in Reihe 11.
GB/T 2312 hatte keine Korrekturen, aber diese Korrekturen sind in Schriftvorlagen enthalten, die auf GB/T 2312 einschließlich GB/T 12345 basieren; seine Obersätze GBK und GB 18030 enthielten auch diese Korrekturen. GB/T 2312 wird auch in ISO-IR-165 verwendet .
Siehe auch
- Guobiao-Code
- CJK
- Chinesische Zeichenkodierung
- Unicode
- Big5 – Standard in Taiwan und Hongkong
- GB 18030 , das GB/T 2312-1980 abgelöst hat
- GB/T 12345-1990, traditionelles Gegenstück zu GB/T 2312-1980, ersetzt durch GB18030
Verweise
Anmerkungen
Weiterlesen
- Lunde, Ken (2009). „Chinesische Zeichensatzstandards – China“ . CJKV Informationsverarbeitung (2. Aufl.). O'Reilly. ISBN 978-0-596-51447-1.
Externe Links
- Grafische Ansicht von GB2312 im Converter Explorer von ICU
- Unicode zu GB2312 oder GBK-Tabelle
- Chinesische Zeichencodes
- Entwicklung von GBK und GB2312 zu GB18030
- GB2312 Zeichensatz für chinesische Schriftzeichen
- Codierter chinesischer Grafikzeichensatz für den Informationsaustausch ISO-IR 58
- C-Code generiert 6763 Grundzeichen mit Ausgabe
- GB2312-80-Standard auf China-Language.gov.cn