15.08.
2009

Unicode

Unicode gibt jedem Zeichen seine eigene Nummer, systemunabhängig, programmunabhängig, sprachunabhängig.

So zumindest definiert das Unicode-Konsortium selbst ihr Format. Es handelt sich dabei um einen internationalen Standard, dessen Ziel es ist jedem sinntragendem Zeichen bzw. Textelementen einem Code zuzuordnen. Dabei sollen alle Schriftkulturen und alle bisherigen Zeichensätze berücksichtigt werden.

Anfänglich bestand Unicode gerade mal aus 65.536 Zeichen (16Bit), mittlerweile wurde auf 32Bit aufgestockt.

Anmerkungen

  • Der Zeichenbereich U+0000 bis U+007F (hexadezimale Angabe) entspricht dem ASCII-Code.
  • Version 5.0.0 des Unicode-Standards beinhaltet über 99.000 Zeichen.
  • Mit ISO/IEC 10646, auch Universal Character Set (UCS) genannt, existiert eine zum Unicode praktisch identische Zeichenkodierung.

Unicdoe anwenden

Beispiele für den Einsatz von Unicode anhand der Zeichen U+0041 (A), U+2211 (∑) und U+4E57 (乗):
Sollten Sie hier nicht den Buchstaben A, das Summenzeichen und ein chinesisches Zeichen dargestellt bekommen, so unterstützt ihr Betriebssystem/Browser leider kein Unicode.

Unicode in HTML

A ∑ 乗

Unicode in Java mit Hilfe des println-Befehls

System.out.println("\u0041 \u2211 \u4E57");

Web-Links / Literatur
[1] http://www.unicode.org
[2] http://www.sql-und-xml.de/unicode-database
[3] http://de.selfhtml.org/inter/unicode.htm
[4] http://de.wikipedia.org/wiki/Unicode
[5] http://www.decodeunicode.org/de

Kein Kommentar

Kommentieren

Dein Kommentar

Wir benutzen Cookies um die Nutzerfreundlichkeit der Webseite zu verbessen. Durch Deinen Besuch stimmst Du dem zu.