Betriebssysteme > Solaris/x86 und OpenSolaris

ACHTUNG! SIL3114 hat Software RAID zerschossen

<< < (2/3) > >>

meti:

--- Zitat von: Tschokko am 06. März 2007, 10:01:34 ---
--- Zitat von: meti am 06. März 2007, 07:47:32 ---SATA und Software-RAID funktionieren zusammen wohl generell nicht unter starker Belastung.

--- Ende Zitat ---
Von welchem Software-RAID sprechen wir hier? Von der RAID Funktionalität die der Controller anbietet und über die Treibersoftware abwickelt oder etwa von einem Software-RAID das durch den Sun Volume Manager angelegt wurde oder gar von einem ZFS Mirror???

Gruß Tschokko

--- Ende Zitat ---

Sowohl als auch. Diese Fake-RAID Versionen, bei denen ein BIOS einen RAID-Controller vorgaukelt bei dem aber die gesamte Rechenarbeit von der CPU des Systems erbracht werden muß sind ja nichts anderes als Software-RAID.

Es geht nix über ein echtes Hardware-RAID ...

Tschokko:

--- Zitat von: meti am 06. März 2007, 15:28:30 ---Sowohl als auch. Diese Fake-RAID Versionen, bei denen ein BIOS einen RAID-Controller vorgaukelt bei dem aber die gesamte Rechenarbeit von der CPU des Systems erbracht werden muß sind ja nichts anderes als Software-RAID.
--- Ende Zitat ---
Damit behauptest du also auch, dass ein SVM Mirror unter hoher Last unter Umständen genauso unsicher wird wie oben genanntes Beispiel mit dem SIL3114/3112 Treiber?

Unter welchen Bedingungen ist obiges System überhaupt abgeschmiert? Wieivel Leute waren da grad auf dem Server unterwegs? Kann man diesen Zustand vielleicht irgendwie simulieren? Ich würde nämlich gerne wissen ob mir der SVM Mirror hier auch die Maschine lahm legt und Datenschrott produziert. Immerhin ist das für meinen zukünftigen Webserver geplant gewesen. Nen teuren Hardware RAID Controller mit Solaris Support nach zu rüsten könnte sich als echtes und vor allem kostspieliges Problem erweisen...

Gruß Tschokko

llothar:

--- Zitat von: meti am 06. März 2007, 15:28:30 ---Sowohl als auch. Diese Fake-RAID Versionen, bei denen ein BIOS einen RAID-Controller vorgaukelt bei dem aber die gesamte Rechenarbeit von der CPU des Systems erbracht werden muß sind ja nichts anderes als Software-RAID.

--- Ende Zitat ---

Was hast du für Links um diese AUssage zu belegen?

Ich hatte mal länger vor für meine Workstation einen Software RAID Stapel aufzusetzten und dabei etwas gegoogelt. Nirgendwo hatte ich so eine Aussage gehört, nein bei Linux gabs (im Gegensatz zu Solaris) eigentlich immer die Auffassung das Software RAID besser ist als Hardware RAID. Wegen den ganzen Problemen falls dein Kontroller mal abschmiert.

Das mit hoher Last halte ich für "urban legend" wenn ich sehe wie manche Webserver bei preiswerten Hostern gequält werden.

mj:

--- Zitat ---SATA und Software-RAID funktionieren zusammen wohl generell nicht unter starker Belastung.
--- Ende Zitat ---
Das kann ich keinesfalls bestätigen - weder aus der Theorie heraus, noch aus der Praxis. Ich selber habe mit Software RAIDs und S-ATA Platten unter Linux bisher keine schlechten Erfahrungen gemacht - sie waren zwar Dateisystembedingt nicht immer so schnell, wie sie hätten sein können, aber wenigstens gab es bisher noch nie Datenverlust auf einer oder gar beiden Platten. Und heutzutage ist ein Software RAID im übrigen kein bißchen langsamer als ein Hardware RAID, ganz im Gegenteil sogar. Unser alter SCSI Hardware RAID-Controller (ein ICP Vortex) war so lahm, dass die Festplatten an einem Adaptec-Controller einzeln schneller sind als sie im RAID1 Verbund an diesem Controller jemals waren (sowohl lesend, als auch schreibend).
Mich würde also sehr interessieren, worauf du deine Aussage stützt ;)




--- Zitat ---Unter welchen Bedingungen ist obiges System überhaupt abgeschmiert? Wieivel Leute waren da grad auf dem Server unterwegs? Kann man diesen Zustand vielleicht irgendwie simulieren? Ich würde nämlich gerne wissen ob mir der SVM Mirror hier auch die Maschine lahm legt und Datenschrott produziert. Immerhin ist das für meinen zukünftigen Webserver geplant gewesen. Nen teuren Hardware RAID Controller mit Solaris Support nach zu rüsten könnte sich als echtes und vor allem kostspieliges Problem erweisen...
--- Ende Zitat ---
Zur Zeit des Absturz müssten relativ wenige User online gewesen sein, es war schließlich gegen 13:00 Uhr Nachmittag an einem Wochentag. Zu Stoßzeiten sind im vBulletin-Forum etwa 4.000 User gleichzeitig über mehrere Stunden hinweg unterwegs, weitere 6.000 - 10.000 gleichzeitig auf der Startseite und in den Artikeln. Diese Stoßzeiten sind so von ca. 19:30 Uhr bis grob 01:30 Uhr. Die Last ist also hoch, aber nicht zu hoch - vor allem, weil die Last auf die S-ATA Platten bei egal welcher Webseitenlast exakt Null war - auf den S-ATAs war ausschließlich das Betriebssystem, sonst nichts. Unser wwwroot liegt auf einem ZFS Mirror auf zwei 10.000rpm SCSI-Platten, unsere MySQL auf einem ZFS Mirror auf zwei 15.000rpm SCSI-Platten. Folglich werden nur diese beiden RAID-Sets belastet, das S-ATA System-RAID ist dauerhaft völlig unterfordert gewesen. Und selbst wenn die Last auf den S-ATA Platten hoch gewesen wäre, dann darf der keinen Müll auf die Platten schreiben.




--- Zitat ---Nirgendwo hatte ich so eine Aussage gehört, nein bei Linux gabs (im Gegensatz zu Solaris) eigentlich immer die Auffassung das Software RAID besser ist als Hardware RAID. Wegen den ganzen Problemen falls dein Kontroller mal abschmiert.
--- Ende Zitat ---
Das deckt sich auch mit meiner Erfahrung. Vor allem ist der größte Vorteil, dass man ein Software RAID völlig problemlos von einem System auf ein anderes umziehen kann. Deshalb haben wir uns auch für ein Software RAID entschieden, da mit Sicherheit irgendwann mal die nächste Stufe ansteht, und das Board ausgetauscht wird gegen ein besseres.


Und im übrigen korrekt erkannt, es handelt sich hier um den Server von Planet 3DNow!

meik:

--- Zitat von: mj am 05. März 2007, 10:04:55 ---Wie dem auch sei – Donnerstag gegen 13:15 Uhr ist unser Solaris eingefroren und hat nur noch im Single User Mode gebootet. Im RZ selber mussten wir dann feststellen, dass auf beiden RAID1 S-ATA Platten nur noch Datenmüll vorzufinden war. Vereinzelt auch noch korrekte Dateien aber größtenteils unbrauchbar und zerstört. Wir wissen nicht genau woran es lag, aber definitiv nicht an den S-ATA Platten selber – haben wir mittlerweile getestet und sind einwandfrei. Die beiden SCSI-RAIDs waren davon nicht betroffen, die sind in Ordnung und nicht kompromittiert – es waren wirklich ausschließlich die beiden S-ATA am SIL3114 von dem Problem betroffen. Jetzt gibt es theoretisch nur drei Möglichkeiten:

--- Ende Zitat ---

Was macht euch so sicher, dass es ein Hardware-nahes Problem war? Zwei Platten so zu schrotten wie du es beschreibst, dauert seine Zeit. Auch wird auf Bootplatten nicht sonderlich viel geschrieben. Mir fällt es schwer zu glauben, dass es da keine Vorwarnungen (z.B. Lesefehler) gegeben hat. Oder dass so ein Problem eine Kernel-Panic auslöst. Was würde z.B. einen Einbrecher ausschließen, der die Bootplatten mit /dev/random überschreiben wollte?

Navigation

[0] Themen-Index

[#] Nächste Seite

[*] Vorherige Sete

Zur normalen Ansicht wechseln