sonnenblen.de - Das unabhängige Sun User Forum

Hardware => Sun => Thema gestartet von: Joshi am 24. August 2003, 13:57:19

Titel: Sparc 20 Bus Error - Core Dump
Beitrag von: Joshi am 24. August 2003, 13:57:19
Hallo,

ich versuche auf einer SS20 mit einer Seagate ST31200WC (Target 3) und einem externen CD-ROM (war vorher an einer Axil 311) (Target 6) NetBSD zu installieren. Die Installation läuft gut an. Festplatte läßt sich partitionieren und die Dateissysteme werden angelegt. Was aber nicht zu Ende läuft ist die Installation. An nicht reproduzierbaren Stellen in der Installation, aber immer beim Wechsel des Paketes (z.B. von base nach comp) bleibt die Installation mit der Fehlermeldung "Bus Error - Core dump" stehen.

Kann es sein, dass dieses CD-ROM nicht 100% kompatibel mit der SS 20 ist? Eigentlich ist das Blödsinn, weil es sich doch um ein SCSI-Device handelt, oder? Jedoch habe ich versucht das CD-ROM an einem Standard 2940 am PC zu betreiben und dort wollt es auch nicht.

Jemand eine Idee? Kann es auch die Platte sein oder die Terminierung?

Gruß,

Jörg.
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Sparky am 24. August 2003, 15:21:45
Poste doch mal die Config von der SS20.
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: TheBambi am 24. August 2003, 19:16:35
Hallo,

welche NetBSD Version versuchst Du zu installieren. Ich meine mit der 1.6 gabe es da irgendwelche Probleme. Die sollten mit der 1.6.1 behoben sein.

Ciao, Jens
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Joshi am 24. August 2003, 20:52:56
Hallo,

@TheBambi: Ich versuche 1.6.1 zu installieren.

Ich hab's jetzt mal per FTP versucht - also nur von CD booten und die sets von /mnt/usr/INSTALL installieren. Auch da kommt die Fehlermeldung, so dass es dann ja wohl nicht am CD-ROM liegen kann. Bleiben ja nur noch drei Möglichkeiten:

1. Festplatte (Jumperung / Terminierung)
2. SCSI-Controller oder
3. Verkabelung.

Einen Hardware-Defekt des Controllers oder ein Problem der Verkabelung schliesse ich einfach mal aus, da sonst wohl garnichts geht. Ich tippe jetzt einfach mal auf die Festplatte (defekt oder Jumper). Werde mir mal Doku dazu besorgen und probieren.

@Sparky:

ok probe-scsi-all
/iommu@f,e0000000/sbus@f,e0001000/espdma@f,400000/esp@f,800000
Target 3
 Unit 0   Disk     SEAGATE ST31200W SUN1.05946200077641
                   Copyright (c) 1996 Seagate
                   All rights reserved 0000
Target 6
 Unit 0   Removable Read Only device     SONY    RacTech CD-ROM  3.1a

cd0 at scsibus0 target 6 lun 0: <SONY, RacTech CD-ROM, 3.1a> SCSI2 5/cdrom remoe
cd0: async, 8-bit transfers

ok printenv
Parameter Name        Value                          Default Value

tpe-link-test?        true                           true
output-device         screen                         screen
input-device          keyboard                       keyboard
keyboard-click?       false                          false
keymap
ttyb-rts-dtr-off      false                          false
ttyb-ignore-cd        true                           true
ttya-rts-dtr-off      false                          false
ttya-ignore-cd        true                           true
ttyb-mode             9600,8,n,1,-                   9600,8,n,1,-
ttya-mode             9600,8,n,1,-                   9600,8,n,1,-
fcode-debug?          false                          false
local-mac-address?    false                          false
screen-#columns       80                             80
screen-#rows          34                             34
selftest-#megs        16                             1
scsi-initiator-id     7                              7
sbus-probe-list       fe0123                         fe0123
auto-boot?            false                          true
watchdog-reboot?      false                          false
diag-file
diag-device           /iommu@f,e0000000/sbus@f ...   net
boot-file
boot-device           /iommu@f,e0000000/sbus@f ...   disk net
silent-mode?          false                          false
use-nvramrc?          false                          false
nvramrc
sunmon-compat?        false                          false
security-mode         none                           none
security-password
security-#badlogins   0                              <no default>
oem-logo                                             <no default>
oem-logo?             false                          false
oem-banner                                           <no default>
oem-banner?           false                          false
hardware-revision                                    <no default>
last-hardware-update                                 <no default>
testarea              255                            0
mfg-switch?           false                          false
diag-switch?          false                          false

ok module-info
MBus  :  50 MHz
SBus  :  25 MHz
CPU#0 :  75 MHz SuperSPARC-II / SuperCache  4.x

Ich hoffe, das reicht erstmal als Information zur Config. Wenn Du noch was brauchst, dann lass' es mich wissen.

Gruß,

Jörg.
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Sparky am 24. August 2003, 21:36:16
Probiere mal folgende Einträge aus :

auto-boot?             true                        true
watchdog-reboot?      false                          false
diag-file
diag-device            net                       net
boot-file
boot-device            disk                  disk net
silent-mode?          false                          false
use-nvramrc?          false                          false
nvramrc
sunmon-compat?        false                          false
security-mode         none                           none
security-password
security-#badlogins    100                    <no default>
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Joshi am 24. August 2003, 23:18:13
Hallo Jürgen,

werde ich nächste Woche machen müssen, da ich jetzt bis Donnerstag nicht mehr an den Rechner komme.

Kannst Du mir (oder auch jemand anders) sagen, welche Platten ich an den SCA anschliessen kann und welche nicht. Es gibt ja diverse SCA-Platten (SCSI-1, U-SCSI-1, U-SCSI-2, LVD/SE, W, UW, und was noch alles) und ich blicke da echt nicht durch. Vielleicht kann mir auch jemand das ein oder andere Modell für eine SS 20 empfehlen.

Gruß,

Jörg.
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Sparky am 24. August 2003, 23:37:34
Diese Antwort bekommst Du bei SunSolve:
http://sunsolve.sun.com/handbook_pub/Devices/Disk/DISK_TOC.html

und hier auch mal einen Blick drauf  :
http://sunsolve.sun.com/handbook_pub/Systems/SS20/SS20.html
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Joshi am 25. August 2003, 16:41:31
Hallo,

das ist die Antwort vom Seagate TechSupport auf meine Frage, wie die Platte zu jumpern und terminieren ist:

Joerg,
The drive ID is set by the backplane it is plugged into, and this drive
cannot terminate.

Jimmie P.
Seagate Technical Support

Wenn also die Platte nicht zu terminieren ist drängt sich mir der Verdacht auf, dass der Fehler dort liegt, oder?

Jörg.
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Sparky am 25. August 2003, 20:11:18
Warum sollte am SCA-Backplane ein Fehler sein ?
Installiere doch bitte mal Solaris.
Wenn das einwandfrei funktioniert, dann sehe ich das Problem woanders.
Was sind da z.Bsp. für Speicherriegel drinn ?
In welcher Reihenfolge stecken diese in den Slot´s ?

Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Joshi am 25. August 2003, 20:46:25
Solaris installieren kann ich nächstes WE mal ausprobieren. Da sind 4 * 16 MB Speicherriegel drin. Die waren anfangs alle nebeneinander gesteckt und ich habe die dann entsprechend der Anleitung von sunsolve.sun.com umgesteckt.

Ich habe nicht gesagt, dass der Fehler am Backplane liegt. Ich kenne das bei SCSI nur so, dass das letzte Gerät am Bus terminiert sein muss. Wenn aber die Seagate-Platte nicht zu terminieren ist, dann ist doch der Bus wohl am Ende offen, oder erkennt das SCA-Backplane das? Ich kenn' mich SCA nicht so aus.

Jörg.
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Sparky am 25. August 2003, 20:56:02
Was sagt das SS20 Handbuch dazu ?
Den Link habe ich nicht zum Spass gepostet.
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Joshi am 25. August 2003, 21:18:06
Ach so, ich dachte das wäre nur eine Formatierung des Textes  ;D. Im Handbuch steht halt nur, dass der untere SCA-Anschluss Target 3 und der obere Target 1 ist und dass man halt bei externen Laufwerken mit der ID aufpassen muss. Zur Terminierung oder ähnlichem sagt das Handbuch nix.

Hmm, kann denn noch von woanders ein Bus Error herkommen (Speicherbus, SBUS, MBUS)?

Ich werde am Donnerstag mal die verschiedenen Hinweise probieren (config-Änderung, Solaris installieren) und schauen was dabei rauskommt. Über die Ergebnisse werde ich dann berichten.

Jörg.
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: msalfer am 27. August 2003, 03:48:04
Ein Buserror ist eigentlich nur eine Speicherverletzung - Allgemeine Schutzverletzung *g*
Also einfach ein Programmfehler, die Pointer zeigen mal wieder ins Nirvana. Kann natürlich durch fehlerhafte Hardware ausgelöst werden, Hardware kann auch nur sehr sporadisch Fehler machen.

Zur Terminierung: Da SCA immer nur mit Backplanes aufgebaut ist, ist klar wo der Bus aus ist. Deshalb kann die Terminierung auch immer fest auf dem Bus sitzen und die Devices selbst haben damit dann nichts zu tun.

Extern ist eine extra Terminierung zwingend, ohne kann alles mögliche passieren.
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Joshi am 28. August 2003, 23:17:05
Hallo,

@Sparky: Ich habe Deine Änderungen der config eingebaut.
@All: Weiterhin habe ich auch die Woche über recherchiert und gelesen, dass auf einer SCA Platte an einer Backplane in einer Sparc nicht ein Jumper gesteckt sein darf. Also habe ich das heute als allererstes überprüft und siehe da, auf dem ID-Jumper 1 steckte ein Jumper. Den habe ich dann direkt mal runtergepiddelt.

Also habe ich erneut versucht NetBSD 1.6.1 zu installieren. Gleiches Ergebnis: Beim Wechsel des Sets auf comp.tgz erscheint wieder die Fehlermeldung "Bus Error - Core dump". Mittlerweile habe ich auch alles sonstigen, auf sunsolve.sum.com verfügbaren Handbücher durch und weiß nicht weiter. Den Sitz der Speicherbausteine habe ich auch schon mehrfach überprüft und auch Speichertests durchlaufen lassen.

Zur Zeit installiere ich mal Solaris 8 (wie mir Sparky geraten hat) und werde mal sehen, was dabei raus kommt.

Gruß,

Jörg.
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Joshi am 29. August 2003, 19:44:40
F'up:

Ich habe in einem anderen Thread auch den Hinweis gefunden mal mit

boot cdrom -s
format

die Platte zu überprüfen. Alles mehrfach gemacht. Auch das dd if=/dev/rdsk/... of=/dev/null brachte keinen Fehler zu Tage.

Ich hab' jetzt echt keine Ahnung mehr woran es liegen kann. Ich installiere jetzt mal Solaris 8 (jetzt aber wirklich) und schau was passiert.

Jörg
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Joshi am 31. August 2003, 15:40:35
Hallo,

ich habe jetzt vom gleichen CD-ROM-Laufwerk Solaris 8 installiert und es hat alles gut funktioniert. In der GNATS Datenbank ist kein PR dazu zu finden - also mache ich dann mal einen auf.

Gruß,

Jörg
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Sparky am 31. August 2003, 16:32:00
Dann liegt es also nicht an der Hardware.
Der Fehler ist in der Distribution zu suchen.
Titel: Re: Sparc 20 Bus Error - Core Dump
Beitrag von: Joshi am 05. September 2003, 23:59:39
Tja,

mittlerweile sind die beiden 9 GB IBM SCA-Platten da und ich habe diese eingebaut. Auf den 9 GB-Platten lies sich NetBSD ohne Probleme installieren, so dass ich daraus den Schluss ziehen muss, dass es sich wohl um eine Inkompatibilität zwischen NetBSD und der 1 GB Seagate Platte handelt.

Warum, das weiß nur der liebe Gott - und selbst da bin ich mir nicht ganz sicher :-).

Gruß,

Jörg.