sonnenblen.de - Das unabhängige Sun User Forum

Betriebssysteme => Solaris/x86 und OpenSolaris => Thema gestartet von: Hexxer am 22. September 2010, 14:23:18

Titel: Wer/Was definiert File-Types ?
Beitrag von: Hexxer am 22. September 2010, 14:23:18: Hi,

ich wusste nicht wo ich die Frage mal stellen kann. Das unten angesprochene Grep geht auch auf Linux nicht.

Eine Frage. Wo/wer oder was bestimmt was für ein File ich habe ?
Beispiel unter Solaris "file abcd.....Ausgabe Aciii Text" oder Commands Text usw..

Hintergrund: Ich hab eine Textfile aus Windows was ich unter Solaris problemlos lesen kann (Klartext). Allerdings funktioniert kein Grep. cat abcd | grep test gibt kein Ergebnis zurück, keine Fehler, kein nichts.
File sagt "Commands text".

Vermutet wird das es ein Binärfile ist oder zumindest so definiert ist. Daraus ergibt sich die durchaus spannende Frage für mich: Wo ist definiert oder wer erkennt was ein File ist ?
Titel: Re: Wer/Was definiert File-Types ?
Beitrag von: oreissig am 22. September 2010, 14:52:34: Es gibt unter Unix keinen Dateityp in dem Sinne, file wendet ausschließlich Heuristiken an und schätzt dann, was wohl in der datei sein könnte.

Meine Vermutung ist bisher die, dass da wohl beim kopieren was schiefgelaufen ist.
Wenn du nur cat $DATEINAME machst, siehst du denn dann auch das gleiche, wie an der windows-kiste?
Titel: Re: Wer/Was definiert File-Types ?
Beitrag von: escimo am 22. September 2010, 16:00:53: "file" liest (auch) den Header der jeweils angegebene Datei aus, z.B. bei PDF:

$ file sparc-t3-chip-ds-173097.pdf
sparc-t3-chip-ds-173097.pdf: PDF document, version 1.5

@Hexxer: Was passiert, wenn du dos2unix <deine_Datei> und anschließend ein grep drauf machst?
Titel: Re: Wer/Was definiert File-Types ?
Beitrag von: Ebbi am 22. September 2010, 16:13:12: Das steht in der /etc/magic:
http://publib.boulder.ibm.com/infocenter/aix/v6r1/index.jsp?topic=/com.ibm.aix.files/doc/aixfiles/magic.htm

Wenn in der Datei abcd der String test nicht vorkommt, wird auch nichts zurückgegeben.

Guck doch mal mit od -c abcd nach.
Titel: Re: Wer/Was definiert File-Types ?
Beitrag von: escimo am 22. September 2010, 16:28:59: Wenn ich in meine /etc/magic unter Linux (Ubuntu 8.10), sehe ich nur einen Kommentar drin:
Code: [Auswählen]
# Magic local data for file(1) command. # Insert here your local magic data. Format is described in magic(5).Das ist bei Ubuntu (8.10) in einem anderen Pfad untergebracht: /usr/share/file/magic

... auch nachzulesen unter:
$ man 5 magic

Kann also locker erweitert werden.
Titel: Re: Wer/Was definiert File-Types ?
Beitrag von: Hexxer am 22. September 2010, 18:44:57: Hi,

die Datei ist ein Log des Windows-Zeitdienstes. Kann man tatsächlich ganz normal in jedem Editor lesen, cat geht, more geht, vi unter Solaris scheinbar auch.
Ein Kollege hat unter Linux bei der Datei nur Unsinn stehen, nicht human readable.

dos2unix - geht nicht
cat datei > neue Datei - geht nicht
tail -100 datei > neue datei - geht nicht

geht nicht bedeutet das man die neue Datei ansehen kann (und auch lesen geht), aber das grep läuft wieder nicht.
Zitat
od -c abcd
Hab ich gesehen weil ein Kollege das vorgeschlagen hat. Octetdump, OK. Aber was sollte der anzeigen ? Hab das einmal vor Jahren ausgeführt und da lief nur na Matrix-ähnliche schlange über den Screen.

Alles in allem reichlich Mysteriös. Nicht kriegsentscheidend, aber mysteriös :D
Titel: Re: Wer/Was definiert File-Types ?
Beitrag von: Hexxer am 22. September 2010, 19:08:59: Hi,

so, ich hab das ganze mal @Home nachgestellt. Allerdings auf nem win7 Hosts. Windows.Zeit Debugger eingeschaltet (Google w32time debug), ein Log schreiben lassen.
Hab Linux hier, das zeigt es als "Data" an, wenngleich der Inhalt per cat lesbar ist und grep nicht geht. Hab kein Solaris hier, aber sol10/sparc hat sowas @work als Text gesehen.

Im Anhang das File. Hab es als "w32time.log" erstellen lassen, damit ich es hier reinhängen kann hab ich das .txt hinten dran gehängt.

MFG
Titel: Re: Wer/Was definiert File-Types ?
Beitrag von: Fleedwood am 22. September 2010, 21:21:13: das sind wide character, womit dann viele 0 bytes drin sind, was den grep zu bemerkung binary file hinreißt und letztendlich ein simples
greppen nach abcd zum scheitern verurteilt

recode -f UTF-16LE < <file>

wirft schon ganz schön viel zum greppen aus...

Thomas.
Titel: Re: Wer/Was definiert File-Types ?
Beitrag von: Hexxer am 23. September 2010, 05:31:33: OK, was auch immer wide Charakters sind. Da musst du ja auch ersteinmal drauf kommen. Wäre ich nie, sonst hätte ich nicht gefragt. Gerade bei nem Standard-Logfile. Nunja, MS hat Standards ja eh gerne selbst definiert ;9 :D
Titel: Re: Wer/Was definiert File-Types ?
Beitrag von: Fleedwood am 23. September 2010, 08:51:52: Zitat von: Hexxer am 23. September 2010, 05:31:33
OK, was auch immer wide Charakters sind. Da musst du ja auch ersteinmal drauf kommen. Wäre ich nie, sonst hätte ich nicht gefragt. Gerade bei nem Standard-Logfile. Nunja, MS hat Standards ja eh gerne selbst definiert ;9 :D

naja wirklich Standard hat das M$ nicht gemacht, ist halt eine 16Bit Codierung von Unicode. Aber anstatt den zwar zum Teil auch etwas häßlichern Einsatz von UTF-8
war M$ IMHO idiotischerweise der Meinung 16 Bit Charcter einzuführen...

Thomas.
Titel: Re: Wer/Was definiert File-Types ?
Beitrag von: Hexxer am 23. September 2010, 09:11:37: OK. Gerade mal geschaut, zumindest unter Standard-Solaris gibts kein Recode. Wie gesagt, nicht weiter tragisch, ich hab alles was ich brauche.
Ist an sich ja wohl auch ein eher seltener Zufall.

MFG
Titel: Re: Wer/Was definiert File-Types ?
Beitrag von: Fleedwood am 23. September 2010, 09:25:14: ist ein GNU tool.

Thomas.
Titel: Re: Wer/Was definiert File-Types ?
Beitrag von: Ten Little Indyans am 23. September 2010, 10:58:09: Entsprechendes Solaris-Bordmittel ist iconv.

Ich hatte zwar schon obskure Fälle die nicht liefen, aber mit UTF-16 kann bereits Solaris 8 umgehen. (Die Datei habe ich mit Windows Notepad erzeugt und als "Unicode" gespeichert.

Code: [Auswählen]
$uname -rsp SunOS 5.8 sparc $cat unitest.txt ��Dies ist ein Test $od -c unitest.txt 0000000 377 376 D \0 i \0 e \0 s \0 \0 i \0 s \0 0000020 t \0 \0 e \0 i \0 n \0 \0 T \0 e \0 0000040 s \0 t \0 \r \0 \n \0 0000050 $grep Test unitest.txt $iconv -f UTF-16 -t UTF-8 unitest.txt | grep Test Dies ist ein Test $iconv -f UTF-16 -t 8859-1 unitest.txt | grep ein Dies ist ein Test
Die beiden Sonderzeichen am Anfang der Datei sind das BOM (Byte Order Mark (http://de.wikipedia.org/wiki/Byte_Order_Mark)) mit dem die Datei als Little-endian identifiziert werden kann.

Bei der Konvertierung von UTF-16 wird das BOM automatisch entsorgt. Gibt man explizit UTF-16LE an so wird offenbar versucht es mit zu konvertieren... ???

Code: [Auswählen]
$iconv -f UTF-16 -t 8859-1 unitest.txt | od -c 0000000 D i e s i s t e i n T e s 0000020 t \r \n 0000023 $iconv -f UTF-16LE -t 8859-1 unitest.txt | od -c 0000000 ? D i e s i s t e i n T e 0000020 s t \r \n 0000024