Windows-1258 - Windows-1258
MIME / IANA | Windows-1258 |
---|---|
Alias(e) | cp1258 ( Codepage 1258) |
Sprachen) | Vietnamesisch , Englisch , Französisch |
Erstellt von | Microsoft |
Standard | WHATWG- Kodierungsstandard |
Einstufung | erweitertes ASCII , Windows-125x |
Beyogen auf | Windows-1252 |
Windows-1258 ist eine Codepage, die in Microsoft Windows verwendet wird , um vietnamesische Texte darzustellen . Es verwendet die Kombination diakritischer Zeichen .
Windows-1258 ist weder mit dem vietnamesischen Standard ( TCVN 5712 / VSCII ) noch mit den verschiedenen anderen in der Praxis gebräuchlichen Codierungen ( VISCII , VNI , VPS ) kompatibel . Vielmehr ist es Windows-1252 sehr ähnlich , mit dem Unterschied, dass s-caron und z-caron (die später zu Windows-1252 hinzugefügt wurden) fehlen, fünf der Buchstaben mit diakritischen Zeichen wurden durch die Kombination von diakritischen Zeichen für Vietnamesisch ersetzt Tonzeichen , eine wurde durch das Zeichen đông ersetzt , und acht andere (vier pro Fall) wurden in vier ansonsten nicht unterstützte vietnamesische Buchstaben geändert .
Die Verwendung von kombinierten diakritischen Zeichen bedeutet, dass Windows-1258 die große Anzahl von Kombinationen von Buchstaben und Tonzeichen in Vietnamesisch abdecken kann, ohne die Abdeckung von Steuercodes oder Symbolen zu beeinträchtigen. Dies bedeutet jedoch auch, dass die Software bei der Konvertierung in/aus anderen Codierungen darauf achten muss, Konvertierungen zwischen vorkomponierten Zeichen und die richtige Kombination von Sequenzen zu handhaben, und erschwert die Bestimmung der für den Benutzer sichtbaren Länge einer Zeichenfolge.
IBM verwendet Codepage 1258 ( CCSID 1258 und Eurozeichen- erweiterte CCSID 5354) für Windows-1258.
UTF-8 ist die bevorzugte Kodierung für Vietnamesisch in modernen Anwendungen. Windows-1258 kann nicht immer Round-Trip - Unicode codiert Vietnamesisch aufgrund von Änderungen verursacht durch Unicode - Normalisierung . Kombinierende diakritische Zeichen werden sowohl in Windows-1258 als auch in Unicode (wie VNI , im Gegensatz zu ANSEL ) nach dem Buchstaben codiert .
Zeichensatz
Die folgende Tabelle zeigt Windows-1258. Jedes Zeichen wird mit seinem Unicode- Äquivalent angezeigt .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
NUL 0000 |
SOH 0001 |
STX 0002 |
ETX 0003 |
EOT 0004 |
ENQ 0005 |
ACK 0006 |
BEL 0007 |
BS 0008 |
HT 0009 |
LF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
1_ 16 |
DLE 0010 |
DC1 0011 |
DC2 0012 |
DC3 0013 |
DC4 0014 |
NAK 0015 |
SYN 0016 |
ETB 0017 |
CAN 0018 |
EM 0019 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
RS 001E |
US 001F |
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Ich 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
ein 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
ich 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
w 0077 |
x 0078 |
y 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
DEL 007F |
8_ 128 |
€ 20AC |
‚ 201A |
ƒ 0192 |
„ 201E |
… 2026 |
† 2020 |
‡ 2021 |
02C6 |
‰ 2030 |
< 2039 |
Œ 0152 |
|||||
9_ 144 |
' 2018 |
' 2019 |
“ 201C |
” 201D |
• 2022 |
– 2013 |
— 2014 |
~ 02DC |
™ 2122 |
› 203A |
– 0153 |
Ÿ 0178 |
||||
A_ 160 |
NBSP 00A0 |
¡ 00A1 |
¢ 00A2 |
£ 00A3 |
¤ 00A4 |
¥ 00A5 |
| 00A6 |
§ 00A7 |
¨ 00A8 |
© 00A9 |
ª 00AA |
« 00AB |
¬ 00AC |
SCHÜCHTERN 00AD |
® 00AE |
¯ 00AF |
B_ 176 |
° 00B0 |
± 00B1 |
² 00B2 |
³ 00B3 |
´ 00B4 |
µ 00B5 |
¶ 00B6 |
· 00B7 |
¸ 00b8 |
¹ 00B9 |
º 00BA |
» 00BB |
¼ 00 v. Chr. |
½ 00BD |
¾ 00BE |
¿ 00BF |
C_ 192 |
À 00C0 |
Á 00C1 |
 00C2 |
Ă 0102 |
Ä 00C4 |
Å 00C5 |
Æ 00C6 |
Ç 00C7 |
È 00C8 |
É 00C9 |
Ê 00CA |
Ë 00CB |
0300 |
Í 00CD |
Î 00CE |
Ï 00CF |
D_ 208 |
Đ 0110 |
Ñ 00D1 |
̉ 0309 |
Ó 00D3 |
Ô 00D4 |
Ó 01A0 |
Ö 00D6 |
× 00D7 |
Ø 00D8 |
Ù 00D9 |
Ú 00DA |
Û 00DB |
Ü 00DC |
ù 01AF |
0303 |
ß 00DF |
E_ 224 |
à 00E0 |
á 00E1 |
â 00E2 |
ă 0103 |
ä 00E4 |
å 00E5 |
æ 00E6 |
ç 00E7 |
è 00E8 |
é 00E9 |
ê 00EA |
ë 00EB |
0301 |
í 00ED |
î 00EE |
ï 00EF |
F_ 240 |
đ 0111 |
ñ 00F1 |
̣ 0323 |
ó 00F3 |
ô 00F4 |
Ó 01A1 |
ö 00F6 |
÷ 00F7 |
ø 00F8 |
ù 00F9 |
ú 00FA |
û 00FB |
ü 00FC |
ù 01B0 |
₫ 20AB |
ÿ 00FF |
Brief Nummer Interpunktion Symbol Andere Nicht definiert Unterschiede zu Windows-1252
Codeseite 1129
Die Codepage 1129 von IBM ( CCSID 1129 und Eurozeichen- erweiterte CCSID 1163) ähnelt der Codepage 1258, jedoch mit den folgenden Unterschieden:
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ 128 |
||||||||||||||||
9_ 144 |
||||||||||||||||
A_ 160 |
NBSP 00A0 |
¡ 00A1 |
¢ 00A2 |
£ 00A3 |
¤ 00A4 |
¥ 00A5 |
| 00A6 |
§ 00A7 |
– 0153 |
© 00A9 |
ª 00AA |
« 00AB |
¬ 00AC |
SCHÜCHTERN 00AD |
® 00AE |
¯ 00AF |
B_ 176 |
° 00B0 |
± 00B1 |
² 00B2 |
³ 00B3 |
Ÿ 0178 |
µ 00B5 |
¶ 00B6 |
· 00B7 |
Œ 0152 |
¹ 00B9 |
º 00BA |
» 00BB |
¼ 00 v. Chr. |
½ 00BD |
¾ 00BE |
¿ 00BF |
Brief Nummer Interpunktion Symbol Andere Nicht definiert Unterschiede zu Windows-1258