Tags (Unicode-Block) - Tags (Unicode block)

Stichworte
Bereich U+E0000..U+E007F
(128 Codepunkte)
Ebene SSP
Skripte Verbreitet
Zugewiesen 97 Codepunkte
Ungebraucht 31 reservierte Codepunkte
1 veraltet
Unicode-Versionsverlauf
3.1 (2001) 97 (+97)
Hinweis :

Tags ist ein Unicode-Block , der Formatierungs-Tag-Zeichen enthält. Der Block soll ASCII spiegeln . Es war ursprünglich für Sprach-Tags gedacht, wurde aber jetzt als Emoji-Modifikatoren speziell für Regionsflaggen umfunktioniert.

Legacy-Nutzung

U+E0001, U+E0020–U+E007F waren ursprünglich für das unsichtbare Markieren von Texten nach Sprache gedacht, aber diese Verwendung wird nicht mehr empfohlen. Alle diese Zeichen waren in Unicode 5.1 veraltet.

Mit der Veröffentlichung von Unicode 8.0 sind U+E0020–U+E007E keine veralteten Zeichen mehr. Die Änderung wurde vorgenommen, "um den Weg für die potenzielle zukünftige Verwendung von Tag-Zeichen für einen anderen Zweck als die Darstellung von Sprach-Tags zu ebnen". Unicode besagt, dass "die Verwendung von Tag-Zeichen zur Darstellung von Sprach-Tags in einem Klartext-Stream immer noch ein veralteter Mechanismus zur Übermittlung von Sprachinformationen über Text ist".

Derzeitiger Gebrauch

Mit der Veröffentlichung von Unicode 9.0 ist U+E007F kein veraltetes Zeichen mehr. (U+E0001 LANGUAGE TAG bleibt veraltet.) Die Veröffentlichung von Emoji 5.0 im Mai 2017 betrachtet diese Zeichen als Emoji zur Verwendung als Modifikatoren in speziellen Sequenzen.

Die einzige angegebene Verwendung ist die Darstellung der Flaggen von Regionen, neben der Verwendung von Regionalindikatorsymbolen für Nationalflaggen. Diese Sequenzen bestehen aus U+1F3F4 WAVING BLACK FLAG, gefolgt von einer Sequenz von Tags, die der in der CLDR kodierten Region entsprechen , dann U+E007F CANCEL TAG . Zum Beispiel führt die Verwendung der Tags für "gbeng" (🏴󠁧󠁢󠁥󠁮󠁧󠁿) dazu, dass einige Systeme die Flagge von England anzeigen , diejenigen für "gbsct" (🏴󠁧󠁢󠁳󠁣󠁴󠁿) die Flagge von Schottland und diejenigen für "gbwls" (🏴󠁧󠁢󠁷󠁬󠁳󠁿) die Flagge von Wales .

Die Tag - Sequenzen sind von abgeleiteten ISO 3166-2 , sondern Sequenzen darstellen , anderen subnational Flags (zum Beispiel US - Staaten ) sind auch möglich , diesen Mechanismus verwenden, aber als die Unicode - Version 12.0 nur die drei Flag - Sequenzen oben aufgeführt sind „Empfohlen für Allgemeine Interchange“ vom Unicode-Konsortium, was bedeutet, dass sie "höchstwahrscheinlich auf mehreren Plattformen umfassend unterstützt werden".

Unicode-Block

Tags
Offizielle Codetabelle des Unicode-Konsortiums (PDF)
  0 1 2 3 4 5 6 7 8 9 EIN B C D E F
U+E000x  START 
U+E001x
U+E002x   SP     !     "     #     $     %     &     '     (     )     *     +     ,     -     .     /  
U+E003x   0     1     2     3     4     5     6     7     8     9     :     ;     <     =     >     ?  
U+E004x   @     EIN     B     C     D     E     F     g     h     ich     J     K     L     m     n     Ö  
U+E005x   P     Q     R     S     T     U     V     W     x     Ja     Z     [     \     ]     ^     _  
U+E006x   `     ein     B     C     D     e     F     g     h     ich     J     k     l     m     n     Ö  
U+E007x   P     Q     R     S     T     du     v     w     x     ja     z     {     |     }     ~    ENDE 
Anmerkungen
1. ^ Ab Unicode-Version 13.0
2. ^ Graue Bereiche zeigen nicht zugewiesene Codepunkte an
3. ^ Unicode-Codepunkte U+E0001 und U+E0020 bis U+E007F wurden mit Unicode-Version 5.1 veraltet, aber ab Unicode-Version 9.0 bleibt nur U+E0001 veraltet

Geschichte

Die folgenden Unicode-bezogenen Dokumente dokumentieren den Zweck und den Prozess der Definition bestimmter Zeichen im Tags-Block:

Ausführung Endgültige Codepunkte Zählen L2-  ID WG2-  ID Dokumentieren
3.1 U+E0001 1 L2/97-203 Pfeifer, Ken; Adams, Glenn (1997-08-05), Ebene 14 Zeichen für generische Tags
L2/97-171R2 Whistler, Ken (1997-09-18), Plane 14 Characters for Generic Tags
L2/97-256 Allouche, Mati (1997-10-20), Kommentare zu Plane 14 Position Paper
L2/97-255R Aliprand, Joan (1997-12-03), "3.B. Lightweight language tagging", Genehmigte Protokolle - UTC #73 & L2 #170 gemeinsames Treffen, Palo Alto, CA - 4.-5. August 1997
L2/98-027 N1670 Ebene 14 Zeichen für Sprach-Tags , 1997-12-12
L2/98-039 Alirand, Joan; Winkler, Arnold (1998-02-24), "2.C REVISED PROPOSALS", Vorläufiges Protokoll - UTC #74 & L2 #171, Mountain View, CA - 5. Dezember 1997
L2/98-286 N1703 Umamaheswaran, VS; Ksar, Mike (1998-07-02), "7.4", Unbestätigte Sitzungsprotokolle, WG 2 Sitzung #34, Redmond, WA, USA; 1998-03-16--20
L2/98-281R (pdf , html ) Aliprand, Joan (1998-07-31), "IETF and W3C Issues (VI)", Unbestätigte Protokolle - UTC #77 & NCITS Subgroup L2 # 174 JOINT MEETING, Redmond, WA -- 29.-31. Juli 1998
L2/00-010 N2103 Umamaheswaran, VS (2000-01-05), "9.1", Protokoll der Sitzung der WG 2 37, Kopenhagen, Dänemark: 1999-09-13--16
L2/01-301 Whistler, Ken (2001-08-01), "Tag Characters", Analyse der Zeichenverschlechterung im Unicode-Standard
L2/02-166R2 Moore, Lisa (2002-08-09), "Character Deprecation", UTC #91 Minuten
U+E0020..E007F 96 L2/16-042 Schriftarten, Augustin; Pournader, Roozbeh (2015-01-26), Klarstellungen für "Vollständige Emoji-Daten" und Emoji-Flags angefordert
L2/15-145R Edberg, Peter (2015-05-07), Vorschlag für zusätzliche regionale Indikatorsymbole
L2/15-107 Moore, Lisa (2015-05-12), "E.1.3 Vorschlag für zusätzliche regionale Indikatorsymbole", UTC #143 Minutes
L2/15-190 Edberg, Peter (2015-06-29), PRI #299 Hintergrund: Darstellung zusätzlicher Flaggentypen
L2/15-206 Davis, Mark (2015-07-25), Gültigkeit der Region / Unterteilung für Flaggen
L2/16-180R Burge, Jeremy ; Williams, Owen (2016-07-07), Vorschlag zur Aufnahme von Emoji-Flaggen für England, Schottland und Wales
L2/17-016 Moore, Lisa (2017-02-08), "Action item 150-A59", UTC #150 Minutes , Fügen Sie die drei Sequenzen für Flags, die in L2/16-180R dokumentiert sind, zu emoji-sequences.txt für emoji 5.0 hinzu.
L2/17-048 Pournader, Roozbeh (2017-01-24), Feedback zu PRI 343 (Unicode Emoji 5.0)
L2/17-086 Burge, Jeremy; et al. (2017-03-27), ZWJ, VS-16, Tastenkappen & Tags zu Emoji_Component hinzufügen
L2/17-103 Moore, Lisa (2017-05-18), "E.1.7 ZWJ, VS-16, Tastenkappen und Tags zu Emoji_Component hinzufügen", UTC #151 Minuten

Verweise