ISO/IEC 8859-2 - ISO/IEC 8859-2
MIME / IANA | ISO-8859-2 |
---|---|
Alias(e) | iso-ir-101, csISOLatin2, latin2, l2, IBM1111 |
Sprachen) | (siehe unten) |
Standard | ECMA-94 : 1986, ISO/IEC 8859 |
Einstufung | Erweitertes ASCII , ISO 8859 |
Erweitert | US-ASCII |
Beyogen auf | ISO-8859-1 |
Andere verwandte Codierung(en) | Windows-1250 |
ISO / IEC 8859-2: 1999 , Informationstechnik - 8-Bit - Single-Byte - codierte Schriftzeichensätze - Teil 2: lateinische Alphabet No. 2 ist Teil der ISO / IEC 8859 - Serie von ASCII-basierten Standard - Zeichencodierungen , zuerst Auflage 1987 veröffentlicht. Sie wird informell als "Latin-2" bezeichnet. Es ist im Allgemeinen für mittel- oder "osteuropäische" Sprachen gedacht, die in lateinischer Schrift geschrieben sind. Beachten Sie, dass sich ISO/IEC 8859-2 stark von der Codepage 852 (MS-DOS Latin 2, PC Latin 2) unterscheidet, die in tschechischen und slowakischen Regionen auch als "Latin-2" bezeichnet wird. Codepage 912 ist eine Erweiterung.
ISO-8859-2 ist der von der IANA bevorzugte Zeichensatzname für diesen Standard, wenn er durch die C0- und C1-Steuercodes von ISO/IEC 6429 ergänzt wird . 0,1% aller Webseiten verwenden im Dezember 2018 ISO 8859-2. Microsoft hat die Codepage 28592 alias Windows-28592 der ISO-8859-2 in Windows zugewiesen . IBM hat die Codepage 1111 ISO 8859-2 zugewiesen .
Windows-1250 ähnelt ISO-8859-2 und verfügt über alle druckbaren Zeichen und mehr. Einige von ihnen sind jedoch neu angeordnet (im Gegensatz zu Windows-1252 , das alle druckbaren Zeichen von ISO-8859-1 an derselben Stelle hält).
Sprachabdeckung
Diese Codewerte können für die folgenden Sprachen verwendet werden:
Es kann auch für Rumänisch verwendet werden , aber es ist für diese Sprache nicht gut geeignet, da die Buchstaben s und t mit Kommas darunter fehlen, obwohl es s und t mit ähnlich aussehenden Cedillen versehen . Diese Buchstaben wurden in den ersten Versionen des Unicode- Standards vereinheitlicht, was bedeutet, dass die Darstellung mit Cedille oder mit einem Komma als Glyphenauswahl und nicht als separate Zeichen behandelt wurde; Schriftarten, die mit Rumänisch verwendet werden sollen, sollten daher theoretisch an diesen Codepunkten Zeichen mit einem Komma darunter enthalten.
Microsoft hat solche Schriftarten nicht wirklich für in Rumänien verkaufte Computer bereitgestellt. Dennoch wurden ISO/IEC 8859-2 und Windows-1250 (mit dem gleichen Problem) stark für Rumänisch verwendet. Unicode hat in der Folge die Komma-Varianten von den Cedilla-Varianten getrennt und ist seither führend für Webseiten, die aber ohnehin oft s und t mit cedilla haben. Unicode stellt seit 2014 fest, dass das Trennen der Buchstaben mit Komma unten ein Fehler war, der zu einer Beschädigung rumänischer Daten führte: Bereits vorhandene Daten und Eingabemethoden enthielten immer noch die älteren Cedilla-Codepunkte, was die Textsuche erschwerte.
Codepage-Layout
In der folgenden Tabelle werden Zeichen zusammen mit ihren entsprechenden Unicode- Codepunkten angezeigt . Unterschiede zu ISO-8859-1 werden mit dunkleren Schattierungen über den Legendenfarben angezeigt.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
||||||||||||||||
1_ 16 |
||||||||||||||||
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Ich 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
ein 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
ich 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
w 0077 |
x 0078 |
y 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
|
8_ 128 |
||||||||||||||||
9_ 144 |
||||||||||||||||
A_ 160 |
NBSP 00A0 |
Ą 0104 |
˘ 02D8 |
Ł 0141 |
¤ 00A4 |
Ľ 013D |
Œ 015A |
§ 00A7 |
¨ 00A8 |
Š 0160 |
Þ 015E |
Ť 0164 |
Ź 0179 |
SCHÜCHTERN 00AD |
Ž 017D |
Ż 017B |
B_ 176 |
° 00B0 |
± 0105 |
˛ 02DB |
ł 0142 |
´ 00B4 |
ľ 013E |
ś 015B |
02C7 |
¸ 00b8 |
š 0161 |
ş 015F |
ť 0165 |
Ÿ 017A |
˝ 02DD |
ž 017E |
ż 017C |
C_ 192 |
Ŕ 0154 |
Á 00C1 |
 00C2 |
Ă 0102 |
Ä 00C4 |
Ĺ 0139 |
Ć 0106 |
Ç 00C7 |
È 010C |
É 00C9 |
Ę 0118 |
Ë 00CB |
Ě 011A |
Í 00CD |
Î 00CE |
Ď 010E |
D_ 208 |
Đ 0110 |
Ñ 0143 |
Ň 0147 |
Ó 00D3 |
Ô 00D4 |
Ő 0150 |
Ö 00D6 |
× 00D7 |
Ř 0158 |
Ů 016E |
Ú 00DA |
Ű 0170 |
Ü 00DC |
Ý 00DD |
Ţ 0162 |
ß 00DF |
E_ 224 |
ŕ 0155 |
á 00E1 |
â 00E2 |
ă 0103 |
ä 00E4 |
ĺ 013A |
ć 0107 |
ç 00E7 |
č 010D |
é 00E9 |
ê 0119 |
ë 00EB |
ě 011B |
í 00ED |
î 00EE |
ï 010F |
F_ 240 |
đ 0111 |
ń 0144 |
ò 0148 |
ó 00F3 |
ô 00F4 |
ő 0151 |
ö 00F6 |
÷ 00F7 |
ř 0159 |
ù 016F |
ú 00FA |
ű 0171 |
ü 00FC |
ý 00FD |
ţ 0163 |
˙ 02D9 |
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
Siehe auch
Verweise
Externe Links
- ISO 8859-2: 1999
- Standard ECMA-94 : 8-Bit-Single-Byte-codierte Grafikzeichensätze - Lateinische Alphabete Nr. 1 bis Nr. 4 2. Ausgabe (Juni 1986)
- ISO-IR 101 Rechter Teil des lateinischen Alphabets Nr. 2 (1. Februar 1986)
- ISO 8859-2 (Latein 2) Ressourcen