HomeSonderzeichenUmwandlung von 8-bit-ZeichenSilbentrennung
Handbuch UDO > Die UDO-Syntax > Sonderzeichen Index

Universeller Zeichensatz

Falls ein Zielformat Unicode nicht unterstützt, ist es mit UDO trotzdem möglich, Quelltexte auch mit 8-Bit-Zeichen systemweit weiterzugeben.

UDO bietet einen universellen Zeichensatz an. Es handelt sich hierbei nicht wirklich um einen vollständigen Zeichensatz wie z.B. Unicode, sondern vielmehr um eine Möglichkeit, 8-Bit-Zeichen durch Folgen mehrere 7-Bit-Zeichen zu emulieren.

Da die nötigen Abfragen und Umwandlungen Mehraufwand bedeuten, müssen Sie UDO mitteilen, dass die folgenden Zeilen universelle Zeichen enthalten. Dies geschieht durch den Einsatz des Schalters !universal_charset.

Nach der Angabe von !universal_charset [on] betrachtet UDO jede einzelne Zeile und wandelt enthaltene universelle Zeichen in 8-Bit-Zeichen um. Die folgende Tabelle zeigt, welche Zeichen wie umgewandelt werden:

Platzhalter x aus Beispiel Ergebnis
(!"x) AEIOUaeiosuy (!"a) = (!"a)
(!'x) AEIOUYaeiouy (!'e) = (!'e)
(!`x) AEIOUaeiou (!`i) = (!`i)
(!^x) AEIOUaeiou (!^o) = (!^o)
(!&x) AE, OE, ae, oe (!&AE) = (!&AE)
(!~x) ANOano (!~n) = (~n)
(!,x) Cc (!,C) = (!,C)
(!.x) Aa (!.A) = (!.A)
(!_x) ao (!_a) = (!_a)
(!_x) !? (!_?) = (!_?)
(!\x) Oo (!\O) = (!\O)
(!/x) Oo (!/o) = (!o)
(!#x) PS (!#S) = (!#S)

Das deutsche (!"s) wird durch den Platzhalter (!"s) erzeugt. Kennt das Zielformat ein Zeichen nicht, wird das naheliegendste Zeichen benutzt, z.B. a statt (!^a).

Mit !universal_charset [off] wird die Wandlung dieser Zeichen wieder abgeschaltet.


Copyright © www.udo-open-source.org (Kontakt)
Letzte Aktualisierung am 19. Mai 2014

HomeSonderzeichenUmwandlung von 8-bit-ZeichenSilbentrennung