Autor Thema: GELÖST: Enterprise 3000, NVRAM Problem  (Gelesen 6186 mal)

Offline Django2

  • Sobl Bachelor
  • ***
  • Beiträge: 104
GELÖST: Enterprise 3000, NVRAM Problem
« am: 15. September 2009, 08:15:53 »
Hi,

Eine Enterprise 3000 spuckt folgendes aus beim booten und braucht auch 5 min dazu:

íHardware Power ON
3,0>ERROR: TEST=NVRAM Devices,SUBTEST=M48T59 (TOD) Init ID=8.1
3,0>Component under test: Board 16 Firehose Bus
3,0>TODC battery is low bit set
3,0>ERROR: TEST=NVRAM Devices,SUBTEST=M48T59 (TOD) Init ID=8.1
3,0>Component under test: Board 16 Firehose Bus
3,0>TODC battery is low bit set
3,0>ERROR: TEST=NVRAM Devices,SUBTEST=M48T59 (TOD) Init ID=8.1
3,0>Component under test: Board 1 Firehose Bus
3,0>TODC battery is low bit set
Clock board TOD does not match TOD on any IO board.
Clock board TOD does not match TOD on any IO board.

4-slot Sun Enterprise 3000, No Keyboard
OpenBoot 3.2.29, 2048 MB memory installed, Serial #8509291.
Copyright 2001 Sun Microsystems, Inc.  All rights reserved
Ethernet address 8:0:20:81:d7:6b, Host ID: 8081d76b.


{6} ok

Will ich von CD-ROM booten passiert folgendes:

{6} ok boot cdrom
Boot device: /sbus@3,0/SUNW,fas@3,8800000/sd@6,0:f  File and args:
SunOS Release 5.10 Version Generic_139555-08 64-bit
Copyright 1983-2009 Sun Microsystems, Inc.  All rights reserved.
Use is subject to license terms.
WARNING: status 'fail' for '/central@1f,0/fhc@0,f8800000/eeprom@0,908000'
WARNING: status 'fail' for '/fhc@2,f8800000/eeprom@0,300000' on board 1
(Can't load tod module) Program terminated
{6} ok

Eine kleine Recherche hat ergeben das ich das neu synchroniseren soll mit copy-clock-tod-to-io-boards das bricht aber leider mit einer Fehlermeldung ab das er auf das TOD nicht zugreifen kann.

Kann da ein NVRAM Baustein vielleicht kaputt sein? Es befindet sich einer auf dem Clock Board und ein anderer auf dem I/O Board in Slot1.
Seltsamerweise speichert das Teil aber noch alles was ich so im OBP mit setenv eingebe.

Gruss

P.S: eigentlich wollte ich den Thread unter SPARC posten, vielleicht kann ein Mod ihn noch dahin verschieben. Danke.
« Letzte Änderung: 16. September 2009, 16:02:40 von Django2 »

sonnenblen.de - Das unabhängige Sun User Forum

GELÖST: Enterprise 3000, NVRAM Problem
« am: 15. September 2009, 08:15:53 »

linuxdomination

  • Gast
Re: Enterprise 3000, NVRAM Problem?
« Antwort #1 am: 15. September 2009, 08:39:47 »

muss jetzt nicht unbedingt ein hardwareproblem sein schon mal ein älteres solaris release versucht bzw, bist du sicher das diese E3000 Solaris10 kann? habe dieses verhalten schon mal im zusammenhang mit willkürlich eingespielten kernel patches gesehen.

Offline Django2

  • Sobl Bachelor
  • ***
  • Beiträge: 104
Re: Enterprise 3000, NVRAM Problem?
« Antwort #2 am: 15. September 2009, 08:44:03 »
Da ist noch gar kein OS installiert, die Fehlermeldung kommt direkt nach dem Einschalten noch bevor ich überhaupt von CD starten will. Ich kann zwar mal heute mittag probieren Sol9 zu booten, die Fehlermeldung an der er 5 Minuten lang rumrödelt beim Einschalten wird aber bestimmt noch weiterbestehen.

linuxdomination

  • Gast
Re: Enterprise 3000, NVRAM Problem?
« Antwort #3 am: 15. September 2009, 09:39:05 »
im zweifelsfall würde ich empfehlen mal alle s-bus cards aus dem i/o board zu entfernen und mit diag-max starten......

Offline Django2

  • Sobl Bachelor
  • ***
  • Beiträge: 104
Re: Enterprise 3000, NVRAM Problem?
« Antwort #4 am: 15. September 2009, 09:57:47 »
Schon probiert, da war eh nur die 13W3 Karte drin welche ich nicht brauche. Ein diag-level auf max und diag-switch auf true läuft so ca. 15 min, sieht auch OK aus, bis auf den Schluss wo er ein TOD Modul nicht laden kann und der Spruch "Clock board TOD does not match TOD on any IO board."
Die komplette Ausgabe poste ich mal heute mittag. Den ersten Anschein nach, tippe ich auf ein defektes NVRAM, frage aber lieber hier nach bevor ich die Kiste auseinander nehme.

Offline dominik

  • Sobl Bachelor
  • ***
  • Beiträge: 182
  • Me, myself & I
    • Meine Heimseite
Re: Enterprise 3000, NVRAM Problem?
« Antwort #5 am: 15. September 2009, 13:25:31 »
Die Meldung

Zitat
WARNING: status 'fail' for '/central@1f,0/fhc@0,f8800000/eeprom@0,908000'

deutet schon mal auf ein Problem mit dem NVRAM hin. Allerdings hat doch die E3000 nur ein einziges (austauschbares) NVRAM, oder? Der Rest wäre ein festverlöteter Baustein auf dem IO Board. Oder erinner ich mich da falsch?

copy-clock-tod-to-io-boards ist jedenfalls das richtige Kommando, um die Time of Day zu synchronisieren. Allerdings ist das nicht zwingend notwendig, wenn die Meldung

Zitat
Clock board TOD does not match TOD on any IO board.

kommt. Solaris bootet auch so.

Probieren könntest Du auch mal show-post-results

Ganz hilfreich auch dieser Link

Gruss
Dominik

Offline Django2

  • Sobl Bachelor
  • ***
  • Beiträge: 104
Re: Enterprise 3000, NVRAM Problem?
« Antwort #6 am: 15. September 2009, 16:37:00 »
Zitat
deutet schon mal auf ein Problem mit dem NVRAM hin. Allerdings hat doch die E3000 nur ein einziges (austauschbares) NVRAM, oder? Der Rest wäre ein festverlöteter Baustein auf dem IO Board. Oder erinner ich mich da falsch?

Drin sind 1 mal Clockboard (rechts) und 1 mal I/O Board (2. von rechts, Slot1) mit jeweils einem gesockelten NVRAM. In Slot 3, 5 und 7 steckt je ein Systemboard aber ohne NVRAM

show-post-results:
{6} ok show-post-results

Slot  1 - Status=Fail, Type: I/O Type 1

Sysio0=P   Sysio1=P     FEPS=P   FEPSFC=0      SOC=P
 Sbus0=P    Sbus1=P    Sbus2=P
    AC=P      FHC=P     SRAM=P    FPROM=P   LabCon=Not Ovtemp=Not
  TODC=***   JTAG=P   CntrPl=P       DC=ff


Slot  3 - Status=Okay, Type: CPU/Memory

    Cpu0=P    Cpu0-OK=P   FailCode=0       Cpu1=P    Cpu1-OK=P   FailCode=0
      AC=P        FHC=P       SRAM=P      FPROM=P     LabCon=Not   Ovtemp=Not
   Bank0=0      Bank1=0      DTag0=P      DTag1=P       JTAG=P     CntrPl=P
   Bank0=Not    Bank1=P         DC=ff


Slot  5 - Status=Okay, Type: CPU/Memory

    Cpu0=P    Cpu0-OK=P   FailCode=0       Cpu1=P    Cpu1-OK=P   FailCode=0
      AC=P        FHC=P       SRAM=P      FPROM=P     LabCon=Not   Ovtemp=Not
   Bank0=0      Bank1=0      DTag0=P      DTag1=P       JTAG=P     CntrPl=P
   Bank0=Not    Bank1=P         DC=ff



Slot  7 - Status=Okay, Type: CPU/Memory

    Cpu0=P    Cpu0-OK=P   FailCode=0       Cpu1=P    Cpu1-OK=P   FailCode=0
      AC=P        FHC=P       SRAM=P      FPROM=P     LabCon=Not   Ovtemp=Not
   Bank0=0      Bank1=0      DTag0=P      DTag1=P       JTAG=P     CntrPl=P
   Bank0=Not    Bank1=Not       DC=ff


Slot 16 - Status=Fail, Type: Clock

 Clock=P   Serial=P   KbdMse=P   PPS-DC=P   DCReg0=P   DCReg1=P
    AC=P    ACFan=P   KeyFan=P   PSFail=0   Ovtemp=Not   TODC=***
  V5-P=P    V12-P=P   V5-Aux=P   V5P-PC=P   V12-PC=P    V3-PC=P    V5-PC=P
RckFan=P     3.3V=P     5.0V=P   Triger=P   Coolng=P   AC-REV=P


P        = Present or Passed
***      = Failed Component
Not      = Not present

{6} ok

Er zeigt den TODC Fehler im I/O Board 1 und im Clockboard 16 an. Seltsamerweise speichert das Teil aber noch alles was ich so im OBP mit setenv eingebe. Genau das selbe zeigt er bei diag-switch? true auch an:

3,0> Slot   Board Status     Board Type      Failures
3,0>-----------------------------------------------------------------
3,0>  0  | Not installed  |             |
3,0>  1  | Online/failure | IO Type 1   | TODC
3,0>  2  | Not installed  |             |
3,0>  3  | Normal         | CPU/Memory  |
3,0>  4  | Not installed  |             |
3,0>  5  | Normal         | CPU/Memory  |
3,0>  6  | Not installed  |             |
3,0>  7  | Normal         | CPU/Memory  |
3,0> 16  | Online/failure | Clock Board | TODC
3,0>-----------------------------------------------------------------
3,0>
3,0>    CPU Module Status
3,0>-----------------------------------------------------------------
3,0> MID  OK  Cache  Speed   Version
3,0>-----------------------------------------------------------------
3,0>  6 | y | 1024  |  248  | 00170011.11000507
3,0>  7 | y | 1024  |  248  | 00170011.11000507
3,0> 10 | y | 1024  |  248  | 00170011.11000507
3,0> 11 | y | 1024  |  248  | 00170011.11000507
3,0> 14 | y | 1024  |  248  | 00170011.11000507
3,0> 15 | y | 1024  |  248  | 00170011.11000507
3,0>-----------------------------------------------------------------
3,0>System Frequency (MHz),fcpu=248, fmod=124, fsys=82, fgen=496
3,0>    Populated Memory Bank Status
3,0>            bd #    Size    Address Way     Status
3,0>            3       1024    0       2       Normal
3,0>            5       1024    1       2       Normal
3,0>
3,0>
        POST COMPLETE
3,0>Entering OBP

TOD synchronisieren geht warscheinlich deshalb auch nicht:
{6} ok copy-clock-tod-to-io-boards
Failed TOD on board in slot 1  Copy aborted.
{6} ok

Zur Zeit ist kein OS drauf aber so wie es jetzt ist bekomm ich nix installiert und genau die selbe Fehlermeldung wie bei Sol.10 wenn ich booten will, hier mal Sol9 CD single user modus:

{6} ok boot cdrom -s
Boot device: /sbus@3,0/SUNW,fas@3,8800000/sd@6,0:f  File and args: -s
Loading ufs-file-system package 1.4 04 Aug 1995 13:02:54.
FCode UFS Reader 1.12 00/07/17 15:48:16.
Redirected to slice: 1
Loading: /platform/SUNW,Ultra-Enterprise/ufsboot
Loading: /platform/sun4u/ufsboot
SunOS Release 5.9 Version Generic_118558-34 64-bit
Copyright 1983-2003 Sun Microsystems, Inc.  All rights reserved.
Use is subject to license terms.
WARNING: status 'fail' for '/central@1f,0/fhc@0,f8800000/eeprom@0,908000'
WARNING: status 'fail' for '/fhc@2,f8800000/eeprom@0,300000' on board 1
(Can't load tod module) Program terminated
{6} ok

Kann man eigentlich NVRAMs aus andere Sun Kisten wie die Ultra1 auch verwenden dafür oder sind das jeweils Eigene?

Gruss
« Letzte Änderung: 15. September 2009, 16:39:00 von Django2 »

Offline vab

  • Global Moderator
  • Sobl Guru
  • *****
  • Beiträge: 514
Re: Enterprise 3000, NVRAM Problem?
« Antwort #7 am: 15. September 2009, 16:47:19 »
Es kann durchaus sein, daß noch OBP-Variablen im NVRAM abgespeichert werden können, die Batterieleistung aber nicht mehr für den Oszillator ausreicht und das NVRAM beim HPOST angemeckert wird.

Ja, es passen alle NVRAMs ab Ultra1 aufwärts.   Neu sind die Dinger schwer zu bekommen.  Wenn genug Bedarf wäre, würd ich mich mal drum kümmern.


Gruß -- Volker
Diese Nachricht enthält ausschließlich meine persönliche private Meinung....

Offline Django2

  • Sobl Bachelor
  • ***
  • Beiträge: 104
Re: Enterprise 3000, NVRAM Problem?
« Antwort #8 am: 15. September 2009, 17:02:55 »
Zitat
Ja, es passen alle NVRAMs ab Ultra1 aufwärts

Also ich hab hier noch 2 funktionierende Sun Ultra1, die hatten bisher noch nie irgendwelche TOD Probleme.
Reicht es einfach die Host ID und ethernet ID umzuschreiben, danach in die Enterprise stecken und es läuft oder sollte ich sie eher direkt in die Enterprise stecken und dort konfigurieren?

Danke und Gruss

 

Offline vab

  • Global Moderator
  • Sobl Guru
  • *****
  • Beiträge: 514
Re: Enterprise 3000, NVRAM Problem?
« Antwort #9 am: 15. September 2009, 22:31:36 »
Reicht es einfach die Host ID und ethernet ID umzuschreiben, danach in die Enterprise stecken und es läuft oder sollte ich sie eher direkt in die Enterprise stecken und dort konfigurieren?

Sollte beides gehen... ich persönlich würde sie erst umbauen und dann laut NVRAM FAQ die IDs ändern.  Das entscheidende ist das auf dem Clock Board,
das I/O-Board wird dann mit dem schon zitierten copy-clock-tod-to-io-boards kopiert.


Gruß -- Volker
Diese Nachricht enthält ausschließlich meine persönliche private Meinung....

sonnenblen.de - Das unabhängige Sun User Forum

Re: Enterprise 3000, NVRAM Problem?
« Antwort #9 am: 15. September 2009, 22:31:36 »

Offline Django2

  • Sobl Bachelor
  • ***
  • Beiträge: 104
Re: Enterprise 3000, NVRAM Problem?
« Antwort #10 am: 16. September 2009, 16:01:37 »
Hat geklappt

Zuerst hab ich in das Clockboard ein NVRAM aus einer Ultra1 reingemacht und die Fehlermeldung beim booten war schon kürzer, nur noch I/O Board1 und nicht mehr Clockboard 16:
3,0>ERROR: TEST=NVRAM Devices,SUBTEST=M48T59 (TOD) Init ID=8.1
3,0>Component under test: Board 1 Firehose Bus
3,0>TODC battery is low bit set

Danach die IDs rein:
4-slot Sun Enterprise 3000, No Keyboard
OpenBoot 3.2.29, 2048 MB memory installed, Serial #8166743.
Copyright 2001 Sun Microsystems, Inc.  All rights reserved
Ethernet address 8:0:20:7c:9d:57, Host ID: 807c9d57.
{6} ok
{6} ok 17 0 mkp
{6} ok 8 0 20 81 d7 6b 8081d76b mkpl
{6} ok banner
4-slot Sun Enterprise 3000, No Keyboard
OpenBoot 3.2.29, 2048 MB memory installed, Serial #8509291.
Copyright 2001 Sun Microsystems, Inc.  All rights reserved
Ethernet address 8:0:20:81:d7:6b, Host ID: 8081d76b

Jetzt copy-clock-tod-to-io-boards probiert, bricht immer noch mit der selben Fehlermeldung ab. Also das NVRAM auf dem I/O Board ebenfalls gegen das einer Ultra1 getauscht. Nachdem jetzt beide NVRAMs getauscht sind, erscheinen keine Fehlermeldungen mehr von wegen Board kaputt sondern nur noch:
Clock board TOD does not match TOD on any IO board.
Liess sich aber beheben mit der Eingabe von:
{6} ok copy-clock-tod-to-io-boards
{6} ok

Jetzt bootet die Kiste endlich sauber:
Hardware Power ON

4-slot Sun Enterprise 3000, No Keyboard
OpenBoot 3.2.29, 2048 MB memory installed, Serial #8509291.
Copyright 2001 Sun Microsystems, Inc.  All rights reserved
Ethernet address 8:0:20:81:d7:6b, Host ID: 8081d76b.



Boot device: disk  File and args:
The file just loaded does not appear to be executable.
{6} ok show-post-results

Slot  1 - Status=Okay, Type: I/O Type 1

Sysio0=P   Sysio1=P     FEPS=P   FEPSFC=0      SOC=P
 Sbus0=P    Sbus1=P    Sbus2=P
    AC=P      FHC=P     SRAM=P    FPROM=P   LabCon=Not Ovtemp=Not
  TODC=P     JTAG=P   CntrPl=P       DC=ff


Slot  3 - Status=Okay, Type: CPU/Memory

    Cpu0=P    Cpu0-OK=P   FailCode=0       Cpu1=P    Cpu1-OK=P   FailCode=0
      AC=P        FHC=P       SRAM=P      FPROM=P     LabCon=Not   Ovtemp=Not
   Bank0=0      Bank1=0      DTag0=P      DTag1=P       JTAG=P     CntrPl=P
   Bank0=Not    Bank1=P         DC=ff


Slot  5 - Status=Okay, Type: CPU/Memory

    Cpu0=P    Cpu0-OK=P   FailCode=0       Cpu1=P    Cpu1-OK=P   FailCode=0
      AC=P        FHC=P       SRAM=P      FPROM=P     LabCon=Not   Ovtemp=Not
   Bank0=0      Bank1=0      DTag0=P      DTag1=P       JTAG=P     CntrPl=P
   Bank0=Not    Bank1=P         DC=ff



Slot  7 - Status=Okay, Type: CPU/Memory

    Cpu0=P    Cpu0-OK=P   FailCode=0       Cpu1=P    Cpu1-OK=P   FailCode=0
      AC=P        FHC=P       SRAM=P      FPROM=P     LabCon=Not   Ovtemp=Not
   Bank0=0      Bank1=0      DTag0=P      DTag1=P       JTAG=P     CntrPl=P
   Bank0=Not    Bank1=Not       DC=ff


Slot 16 - Status=Okay, Type: Clock

 Clock=P   Serial=P   KbdMse=P   PPS-DC=P   DCReg0=P   DCReg1=P
    AC=P    ACFan=P   KeyFan=P   PSFail=0   Ovtemp=Not   TODC=P
  V5-P=P    V12-P=P   V5-Aux=P   V5P-PC=P   V12-PC=P    V3-PC=P    V5-PC=P
RckFan=P     3.3V=P     5.0V=P   Triger=P   Coolng=P   AC-REV=P


P        = Present or Passed
***      = Failed Component
Not      = Not present

{6} ok

Danke nochmal an alle für die Tips

Gruss