Betriebssysteme > Solaris/x86 und OpenSolaris

Kernel-Panic mit Solaris

(1/8) > >>

mj:
Nachdem es uns letztens das S-ATA RAID zerschossen hat und wir jetzt darauf verzichtet haben, gibt es die nächste Probleme. Das System kriegt alle paar Tage einen Kernel Panic:

dasboot2 ^Mpanic[cpu0]/thread=fffffe80000adc80:
dasboot2 genunix: [ID 920532 kern.notice] page_unlock: page fffffffffa8c8ac8 is not locked
dasboot2 unix: [ID 100000 kern.notice]
--
dasboot2 savecore: [ID 570001 auth.error] reboot after panic: page_unlock: page fffffffffa8c8ac8 is not locked
dasboot2 savecore: [ID 748169 auth.error] saving system crash dump in /var/crash/dasboot2/*.0
dasboot2 scsi: [ID 193665 kern.info] sd3 at ata0: target 0 lun 0

Eine Dumpanalyse bringt folgendes:

bash-3.00# cd /var/crash/dasboot2/ ; echo '$c' | adb -k unix.0 vmcore.0
physmem fb78e
vpanic()
0xfffffffffb8404c9()
segmap_unlock+0xe5()
segmap_fault+0x2db()
snf_smap_desbfree+0x76()
dblk_lastfree_desb+0x17()
dblk_decref+0x66()
freeb+0x7b()
tcp_rput_data+0x1986()
tcp_input+0x38()
squeue_enter_chain+0x16e()
ip_input+0x18c()
i_dls_link_ether_rx+0x153()
mac_rx+0x46()
bge_receive+0x98()
bge_intr+0xaf()
av_dispatch_autovect+0x78()
intr_thread+0x50()

Was könnte das Problem sein? Weiß hier jemand Bescheid bevor wir negative PR für Sun betreiben und den Rotz wieder runterhauen? Den neuesten Patch, der eigentlich genau dieses Problem beheben soll, haben wir vorgestern installiert. Trotzdem gab es heute wieder einen Kernel Panic.

c0t0d0s0:
Hallo,

auf welcher Hardware?
Welcher Ausgangsversion von Solaris?
Auf welchem Patchstand habt ihr Solaris gebracht?
Stehen sämtliche Komponenten in der Sun Hardware Compatibility List  http://www.sun.com/bigadmin/hcl/ ?
Korrelliert das Problem zu irgendwelchen bekannten Aktitiväten im System ?

Nebenbei gefragt: Habt ihr einen Supportplan für das Solaris? Klar koennt Ihr das auch ohne betreiben, aber da das für euch businesskritisch ist, lohnt sich das immer. Man kann da für kleines Geld wirklich extrem guten Support kaufen. Ihr koenntet da dann einen Case aufmachen, Dump einschicken, und dann kümmert sich da jemand drum. Und das schöne ist: Man hat einen Hals zum Würgen :) http://www.sun.com/service/subscriptions/index.xml

Gruesse
 Joerg

Freud-Schiller:

--- Zitat von: c0t0d0s0 am 18. März 2007, 05:55:03 ---Und das schöne ist: Man hat einen Hals zum Würgen :)
--- Ende Zitat ---
Oder zum Küssen!

mj:
Einen Business Plan nur um einen Crash Dump zu analyiseren? Dann lieber eine weitere Downtime von einem Tag und wir installieren wieder Linux auf dem Teil - das lief nämlich wenigstens und hat keine Zicken gemacht.

Patchstand ist der neueste, smpatch analyze bringt nichts mehr. Kernel Generic_125101-03. Sämtliche Komponenten stehen auf der HCL, alle sind sogar certified. Das System lief bisher mit Linux über ein Jahr lang stabil und ohne Probleme, seit Solaris macht es Streß. Zusätzlich zur System Neuinstallation haben wir noch die Prozessoren getauscht (zwei Opteron 246 gegen zwei Opteron 290) sowie den RAID-Controller (ICP Vortex) aus dem System geschmissen, da er von Solaris nicht unterstützt wird.

Das ganze läuft auf einem Tyan S2882D, zwei Opteron 290, 4GB DDR400 Registered ECC, ein Adaptec 29320, zwei 10.000rpm 140GB SCSI-Platten (System, Apache, Logs), zwei 15.000rpm 36GB SCSI-Platten (MySQL), zwei 120GB P-ATA Platten (Backup, Daten). Als Ethernet-Schnittstelle kommt der Broadcom BCM5704 zum Einsatz, der zweite BCM5704 sowie der 100-MBit Intel Ethernet sind im BIOS deaktiviert. BIOS-Setup ist das neueste drauf, Probleme mit der Hardware können wir ausschließen - sie lief schließlich problemlos bis Solaris installiert wurde, seitdem gibt's Ärger.

c0t0d0s0:
So .... CeBIT ist vorbei ...

also  damit man halbwegs etwas sieht, bitte ich dich mal einen anständigen Debugger zu nutzen, adb ist doch schon so alt, das ist doch schon garnicht mehr wahr ;)

also:
mdb -k unix.0 vmcore.0

zunächstmal bitte folgende Infos:
::showrev
::showstatus
$C

Gruesse
 Joerg

Navigation

[0] Themen-Index

[#] Nächste Seite

Zur normalen Ansicht wechseln