VSCII - VSCII
Alias(e) | x-viet-tcvn5712 |
---|---|
Sprachen) | Vietnamesisch , Englisch |
Erstellt von | TCVN /TC1 |
Standard | TCVN 5712:1993 |
Einstufung | 8-Bit- SBCS ; Erweitertes ASCII (VSCII-2/-3) |
VSCII ( Vietnamese Standard Code for Information Interchange ), auch bekannt als TCVN 5712 , ISO-IR -180 , .VN , ABC oder einfach das TCVN Codierungen , ist ein Satz von drei eng verwandten Vietnamesisch nationalen Standard Zeichencodierungen für mit der vietnamesischen Sprache mit Computer , entwickelt vom TCVN Technical Committee on Information Technology (TCVN/TC1) und erstmals 1993 angenommen (als TCVN 5712:1993).
Es sollte nicht mit der ähnlich benannten inoffiziellen VISCII- Codierung verwechselt werden , die manchmal von vietnamesischen Sprechern im Ausland verwendet wurde. VISCII sollte auch für Vietnamese Standard Code for Information Interchange stehen , ist aber nicht mit VSCII verwandt.
VSCII (TCVN) wurde im Norden Vietnams ausgiebig verwendet, während VNI im Süden beliebt war. Unicode und die Windows-1258 -Codepage werden jetzt für praktisch alle vietnamesischen Computerdaten verwendet, aber ältere Dateien oder archivierte Nachrichten müssen möglicherweise konvertiert werden.
Kodierungen
Alle drei Formen von VSCII behalten die 95 druckbaren ASCII-Zeichen unverändert bei.
VSCII-3 , auch bekannt als TCVN 5712-3, VN3 oder einfach TCVN3, enthält die wenigsten Zuordnungen. Es ist ein erweitertes ASCII , da alle 128 ASCII-Codes unverändert bleiben. Er weist keinen der Steuercodes C0 und C1 neu zu . Im Vergleich zu ASCII fügt es 75 Zeichen hinzu:
- 67 Kleinbuchstaben, die volle Unterstützung für Kleinbuchstaben ermöglichen.
- 7 Großbuchstaben, wodurch Großbuchstaben für die 29 Grundbuchstaben ohne Tonmarkierungen unterstützt werden.
- Der geschützte Raum .
Tonmarkierungen auf Großbuchstaben werden in TCVN3 durch Umschalten auf eine Großbuchstabenschrift erreicht.
VSCII-2 , auch bekannt als TCVN 5712-2 und VN2, ist eine Obermenge von VSCII-3. Es ist ein erweitertes ASCII , da alle 128 ASCII-Codes unverändert bleiben. Es weist keinen der C0- und C1-Steuercodes neu zu , wodurch es mit ISO 2022 als 96-Satz konform ist . Im Vergleich zu VSCII-3 fügt es hinzu (für insgesamt 96 Nicht-ASCII-Zeichen):
- 16 weitere Großbuchstaben mit vorgefertigten Tonmarkierungen (für insgesamt 23 Nicht-ASCII-Großbuchstaben)
- 5 Kombinieren von diakritischen Zeichen für Tonzeichen , wodurch andere Kombinationen von Großbuchstaben und Tonzeichen dargestellt werden können. Kombinationszeichen folgen dem Basisbuchstaben wie in VNI (anstatt ihnen wie in ANSEL voranzustellen ).
VSCII-1 , auch bekannt als TCVN 5712-1 und VN1, ist eine Erweiterung von VSCII-2 und ein modifiziertes ASCII, da es 12 der 33 Steuerzeichen durch vorgefertigte Zeichen ersetzt. Im Vergleich zu VSCII-2 (für insgesamt 140 Nicht-ASCII-Zeichen):
- Fügt 44 weitere vorgefertigte Großbuchstaben hinzu und bringt sie auf die gleiche Anzahl wie die Kleinbuchstaben
- Dies geschieht durch Ersetzen von 12 ASCII-Steuerzeichen und Zuweisen von 32 grafischen Zeichen zum C1-Steuerbereich, wodurch die ISO 2022-Kompatibilität verletzt wird
Eine Konvertierung von VSCII-3 in VSCII-2 oder VSCII-1 und eine Konvertierung von VSCII-2 in VSCII-1 sind nicht erforderlich, können jedoch zu kleineren Dateien führen.
Die Konvertierung von VSCII-1 in VSCII-2 oder VSCII-3 und die Konvertierung von VSCII-2 in VSCII-3 erfordern die Erweiterung einiger vorgefertigter Zeichen.
Zeichensatz
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
NUL 0000 |
Ú 00DA |
ù 1EE4 |
ETX 0003 |
Ừ 1EEA |
Ử 1EWG |
Ữ 1EEE |
BEL 0007 |
BS 0008 |
HT 0009 |
LF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
1_ 16 |
DLE 0010 |
ù 1EE8 |
ù 1EF0 |
Ỳ 1EF2 |
ÿ 1EF6 |
ÿ 1EF8 |
Ý 00DD |
ÿ 1EF4 |
CAN 0018 |
EM 0019 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
RS 001E |
US 001F |
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Ich 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
ein 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
ich 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
w 0077 |
x 0078 |
y 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
DEL 007F |
8_ 128 |
À 00C0 |
Á 1EA2 |
à 00C3 |
Á 00C1 |
Á 1EA0 |
Á 1EB6 |
Ậ 1EAC |
È 00C8 |
Ẻ 1EBA |
é 1EBC |
É 00C9 |
é 1EB8 |
é 1EC6 |
Ì 00CC |
í 1EC8 |
Ĩ 0128 |
9_ 144 |
Í 00CD |
í 1ECA |
Ò 00D2 |
Ó 1ECE |
Õ 00D5 |
Ó 00D3 |
Ọ 1ECC |
Ó 1ED8 |
Ờ 1EDC |
Ó 1EDE |
Ỡ 1EE0 |
Ớ 1EDA |
Ó 1EE2 |
Ù 00D9 |
ù 1EE6 |
Ũ 0168 |
A_ 160 |
NBSP 00A0 |
Ă 0102 |
 00C2 |
Ê 00CA |
Ô 00D4 |
Ó 01A0 |
ù 01AF |
Đ 0110 |
ă 0103 |
â 00E2 |
ê 00EA |
ô 00F4 |
Ó 01A1 |
ù 01B0 |
đ 0111 |
Á 1EB0 |
B_ 176 |
0300 |
̉ 0309 |
0303 |
0301 |
̣ 0323 |
à 00E0 |
Á 1EA3 |
ã 00E3 |
á 00E1 |
Á 1EA1 |
Á 1EB2 |
Á 1EB1 |
Á 1EB3 |
Á 1EB5 |
ắ 1EAF |
Á 1EB4 |
C_ 192 |
Ắ 1EAE |
Á 1EA6 |
Á 1EA8 |
Ẫ 1EAA |
Á 1EA4 |
é 1EC0 |
Á 1EB7 |
Á 1EA7 |
Á 1EA9 |
Á 1EAB |
Á 1EA5 |
Á 1EAD |
è 00E8 |
é 1EC2 |
é 1EBB |
é 1EBD |
D_ 208 |
é 00E9 |
é 1EB9 |
é 1EC1 |
é 1EC3 |
é 1EC5 |
é 1EBF |
é 1EC7 |
ì 00EC |
í 1EC9 |
é 1EC4 |
é 1EBE |
Ó 1ED2 |
ĩ 0129 |
í 00ED |
ị 1EZB |
ò 00F2 |
E_ 224 |
Ó 1ED4 |
ỏ 1ECF |
õ 00F5 |
ó 00F3 |
ọ 1ECD |
Ó 1ED3 |
Ó 1ED5 |
Ó 1ED7 |
Ó 1ED1 |
Ó 1ED9 |
ờ 1EDD |
ở 1EDF |
Ó 1EE1 |
ớ 1EDB |
Ó 1EE3 |
ù 00F9 |
F_ 240 |
Ó 1ED6 |
ù 1EE7 |
ũ 0169 |
ú 00FA |
ù 1EE5 |
ù 1EEB |
ù 1EED |
ữ 1EEF |
ù 1EE9 |
ự 1EF1 |
ÿ 1EF3 |
ÿ 1EF7 |
ỹ 1EF9 |
ý 00FD |
ÿ 1EF5 |
Ó 1ED0 |
Buchstabe Nummer Interpunktion Symbol Sonstiges Nicht definiert
Schachbrettschattierung weist auf Zeichen hin, die nicht in VSCII-3 enthalten sind. Die schattierten Zeichen in den Zeilen 0_, 1_, 8_ und 9_ sind nicht in VSCII-2 oder VSCII-3.