Betriebssysteme > Solaris/x86 und OpenSolaris
Wer/Was definiert File-Types ?
Hexxer:
OK. Gerade mal geschaut, zumindest unter Standard-Solaris gibts kein Recode. Wie gesagt, nicht weiter tragisch, ich hab alles was ich brauche.
Ist an sich ja wohl auch ein eher seltener Zufall.
MFG
Fleedwood:
ist ein GNU tool.
Thomas.
Ten Little Indyans:
Entsprechendes Solaris-Bordmittel ist iconv.
Ich hatte zwar schon obskure Fälle die nicht liefen, aber mit UTF-16 kann bereits Solaris 8 umgehen. (Die Datei habe ich mit Windows Notepad erzeugt und als "Unicode" gespeichert.
--- Code: ---$uname -rsp
SunOS 5.8 sparc
$cat unitest.txt
��Dies ist ein Test
$od -c unitest.txt
0000000 377 376 D \0 i \0 e \0 s \0 \0 i \0 s \0
0000020 t \0 \0 e \0 i \0 n \0 \0 T \0 e \0
0000040 s \0 t \0 \r \0 \n \0
0000050
$grep Test unitest.txt
$iconv -f UTF-16 -t UTF-8 unitest.txt | grep Test
Dies ist ein Test
$iconv -f UTF-16 -t 8859-1 unitest.txt | grep ein
Dies ist ein Test
--- Ende Code ---
Die beiden Sonderzeichen am Anfang der Datei sind das BOM (Byte Order Mark) mit dem die Datei als Little-endian identifiziert werden kann.
Bei der Konvertierung von UTF-16 wird das BOM automatisch entsorgt. Gibt man explizit UTF-16LE an so wird offenbar versucht es mit zu konvertieren... ???
--- Code: ---$iconv -f UTF-16 -t 8859-1 unitest.txt | od -c
0000000 D i e s i s t e i n T e s
0000020 t \r \n
0000023
$iconv -f UTF-16LE -t 8859-1 unitest.txt | od -c
0000000 ? D i e s i s t e i n T e
0000020 s t \r \n
0000024
--- Ende Code ---
Navigation
[0] Themen-Index
[*] Vorherige Sete
Zur normalen Ansicht wechseln