Tilläggsinformation för Solaris 10

Kapitel 4 Systemspecifika problem

I det här kapitlet beskrivs problem som gäller mellan- och högklassiga Sun-servrar. Dagens Sun-servrar tillhör systemfamiljen Sun Fire. Äldre servrar tillhör systemfamiljen Sun Enterprise.


Obs! –

Tilläggsinformationen för Sun Validation Test Suite finns nu som ett separat dokument på http://sun.com.



Obs! –

En del av problemen och felen i det här kapitlet har åtgärdats i senare Solaris 10-versioner. Om du har uppgraderat Solaris-programvaran kan det hända att vissa problem och fel som beskrivs i det här kapitlet inte längre är aktuella. Du kan se vilka problem och fel som inte längre är aktuella för din specifika Solaris 10-programvara i Bilaga A, Tabell över integrerade fel i operativsystemet Solaris 10.


Dynamisk omkonfiguration (DR) på högklassiga Sun Fire-system

I det här avsnittet beskrivs större DR-fel på domänsidan för följande högklassiga Sun Fire-system som körs på Solaris 10:

Information om DR-fel i Sun Management Services finns i SMS Release Notes för den SMS-version som körs på ditt system.

Kända program- och maskinvarufel

Följande program- och maskinvarufel gäller högklassiga Sun Fire-system.

Det går inte att ta bort en nätverksenhet då ett program håller enheten öppen (5054195)

Om en process håller en nätverksenhet öppen misslyckas alla DR-åtgärder som inkluderar denna enhet. Bakgrundsprogram och processer som gör referenssammanräkningar hindrar DR-åtgärder från att slutföras.

Åtgärd: Utför följande steg som superanvändare:

  1. Ta bort eller byt namn på katalogen /rplboot.

  2. Stäng av NFS-tjänsterna.


    # sh /etc/init.d/nfs.server stop
    
  3. Stäng av startservertjänsterna.


    # sh /etc/init.d/boot.server stop
    
  4. Koppla bort DR.

  5. Starta om NFS-tjänsterna.


    # sh /etc/init.d/nfs.server start
    
  6. Starta om startservertjänsterna.


    # sh /etc/init.d/boot.server start
    

Deleteboard visar läckagefel (4730142)

Det kan hända att varningar visas när ett DR-kommando körs på ett system som konfigurerats med SunSwift PCI-kortet, Option 1032. De här varningarna uppträder på domäner som kör antingen Solaris 8, Solaris 9 eller Solaris 10. Det här är ett exempel på en varning:


12 aug 12:27:41 machine genunix: VARNING!
 vmem_destroy('pcisch2_dvma'): läckte

De här varningarna är ofarliga. DVMA-utrymmet (Direct Virtual Memory Access) uppdateras ordentligt under DR-åtgärden. Det inträffar ingen riktig minnesläcka.

Åtgärd: Om du vill förhindra att den här varningen visas lägger du till följande rad i /etc/system:


set pcisch:pci_preserve_iommu_tsb=0

GigaSwift Ethernet MMF-länken till CISCO 4003-switch bryts efter DR-anslutning

Länken mellan ett system med Sun GigaSwift Ethernet MMF-alternativet X1151A och vissa CISCO-switchar avbryts. Avbrottet sker när du försöker köra en DR-åtgärd på ett sådant system som är anslutet till en av följande switchar:

Det här problemet syns inte på en CISCO 6509-switch.

Åtgärd: Använd en annan switch. Du kan även kontakta Cisco och fråga efter en korrigeringsfil för de listade switcharna.

Dynamisk omkonfiguration (DR) på mellanklassiga Sun Fire-system

Det här avsnittet beskriver större problem som är relaterade till DR på följande mellanklassiga Sun Fire-system:

Minimikrav för systemstyrenhetens fasta programvara

I Tabell 4–1 anges giltiga kombinationer av Solaris-programmet och systemstyrenhetens fasta programvara för alla mellanklassiga Sun Fire-system som ska köra DR.


Obs! –

Kör senaste fasta programvara för systemstyrenheten på Sun Fire midrange-systemet om du vill kunna utnyttja funktioner för fast programvara och felkorrigeringar på bästa sätt. Den senaste korrigeringsfilinformationen finns på http://sunsolve.sun.com.


Tabell 4–1 Minimikrav på fast programvara för systemstyrenheten för varje plattform och Solaris-version

Plattform 

Solaris-version 

Minimikrav på fast programvara för systemstyrenheten 

Sun Fire E6900/E4900 med UltraSPARC IV+ 

Solaris 10 3/05 HW1 (en begränsad version) eller Solaris 10 1/06 

5.19.0 

E6900/E4900 utan UltraSPARC IV+ 

Solaris 9 4/04 

5.16.0 

Sun Fire 6800/4810/4800/3800 

Solaris 9 4/04 

5.16.0 

Sun Fire 6800/4810/4800/3800 

Solaris 9 

5.13.0 

Du kan uppgradera fast systemprogramvara för det mellanklassiga Sun Fire-systemet genom att ansluta till en FTP- eller HTTP-server där de fasta programvaruavbildningarna lagras. Mer information finns i filerna README och Install.info. De här filerna ingår i de versioner av fast programvara som körs på dina domäner. Du kan hämta Sun-korrigeringsfiler från http://sunsolve.sun.com.

Kända programvarufel i DR

I det här avsnittet listas viktiga DR-fel.

Det går inte att ta bort en nätverksenhet då ett program håller enheten öppen (5054195)

Om en process håller en nätverksenhet öppen misslyckas alla DR-åtgärder som inkluderar denna enhet. Bakgrundsprogram och processer som gör referenssammanräkningar hindrar DR-åtgärder från att slutföras.

Åtgärd: Utför följande steg som superanvändare:

  1. Ta bort eller byt namn på katalogen /rplboot.

  2. Stäng av NFS-tjänsterna.


    # sh /etc/init.d/nfs.server stop
    
  3. Stäng av startservertjänsterna.


    # sh /etc/init.d/boot.server stop
    
  4. Koppla bort DR.

  5. Starta om NFS-tjänsterna.


    # sh /etc/init.d/nfs.server start
    
  6. Starta om startservertjänsterna.


    # sh /etc/init.d/boot.server start
    

Solaris Bandwidth Manager orsakar ibland systemkrascher under DR-åtgärder (4506562)

En krasch kan inträffa när ett systemkort som innehåller processorer tas bort från systemet medan Solaris Bandwidth Manager (SBM) används.

Åtgärd: Installera inte SBM på system som ska användas för DR. Utför inte DR-åtgärder på CPU-systemkort på servrar där SBM är installerat.

Det går inte att avkonfigurera cPCI-kort när port 0 är inaktiverad (4798990)

Det går inte att avkonfigurera cPCI I/O-kort på mellanklassiga Sun Fire-system när port 0 (P0) på kortet är inaktiverad. Det här problemet finns i Solaris 10 och Solaris 9. Det finns även på de Solaris 8-system där en eller flera av följande korrigeringsfiler är installerade:

Felet inträffar endast under DR-åtgärder som involverar cPCI-kort. Ett felmeddelande som liknar följande visas:


# cfgadm -c unconfigure NO.IB7
cfgadm: Maskinvaruspecifikt fel: unconfigure N0.IB7: Enheten
arbetar:/ssm@0,0/pci@1b,700000/pci@1

NO.IB7 är ett CompactPCI I/O-kort med P0 inaktiverad.

Åtgärd: Inaktivera kortplatserna i stället för port 0.

Tilläggsinformation för Sun Enterprise 10000

I det här avsnittet beskrivs problem som involverar följande funktioner på Sun Enterprise 10000-server:


Obs! –

Solaris 10 kan köras på enskilda domäner inom ett Sun Enterprise 10000-system. Systemtjänstprocessorn för Sun Enterprise 10000 stöds dock inte i den här versionen.


Krav för systemtjänstprocessorn

För att systemtjänstprocessorn ska ge stöd åt Solaris 10 krävs SSP 3.5. Installera först SSP 3.5 på systemtjänstprocessorn. Installera eller uppgradera sedan till operativsystemet Solaris 10 på en Sun Enterprise 10000-domän.

SSP 3.5 krävs även för att domänen ska kunna konfigureras ordentligt för DR Model 3.0.

DR-problem

I det här avsnittet beskrivs olika problem som involverar dynamisk omkonfiguration (DR) på Sun Enterprise 10000-domäner.

DR Model 3.0

Du måste använda DR 3.0 på Sun Enterprise 10000-domäner som kör operativsystemet Solaris med början från Solaris 9 12/03-versionen. DR model 3.0 refererar till funktioner som utför DR-åtgärder genom att använda följande kommandon på systemtjänstprocessorn:

Du kan köra kommandot cfgadm på domäner om du vill hämta information om kortstatus. DR model 3.0 interagerar även med RCM (Reconfiguration Coordination Manager) för att koordinera DR-åtgärder med andra program som körs på en domän.

Mer information om DR model 3.0 hittar du i användarhandboken för Sun Enterprise 10000 Dynamic Reconfiguration.

DR och bundna användarprocesser

I den här Solaris-versionen frigör inte DR användarprocesser automatiskt från processorer som kopplas bort. Du måste själv utföra den här åtgärden innan frånkopplingssekvensen initieras. Tömningen misslyckas om det finns bundna processer knutna till processorer.

Det går inte att ta bort en nätverksenhet då ett program håller enheten öppen (5054195)

Om en process håller en nätverksenhet öppen misslyckas alla DR-åtgärder som inkluderar denna enhet. Bakgrundsprogram och processer som gör referenssammanräkningar hindrar DR-åtgärder från att slutföras.

Åtgärd: Utför följande steg som superanvändare:

  1. Ta bort eller byt namn på katalogen /rplboot.

  2. Stäng av NFS-tjänsterna.


    # sh /etc/init.d/nfs.server stop
    
  3. Stäng av startservertjänsterna.


    # sh /etc/init.d/boot.server stop
    
  4. Koppla bort DR.

  5. Starta om NFS-tjänsterna.


    # sh /etc/init.d/nfs.server start
    
  6. Starta om startservertjänsterna.


    # sh /etc/init.d/boot.server start
    

Det krävs ett extra steg för att aktivera DR 3.0 i vissa situationer (4507010)

SSP 3.5 krävs för att en domän ska kunna konfigureras ordentligt för DR 3.0. Efter att du har uppgraderat SSP till SSP 3.5 (när DR 3.0 är aktiverat på domänen) kör du följande kommando:


# devfsadm -i ngdr

InterDomain Networks

För att en domän ska kunna bli del av ett InterDomain Network (IDN) måste alla kort med aktivt minne i domänen ha minst en aktiv processor.

OpenBoot PROM-variabler

Innan du utfärdar boot net-kommandot från OpenBoot PROM-ledtexten (OK), verifierar du att local-mac-address? har angetts till false. Det är standardfabriksinställningen. Om variabeln har angetts som true måste du försäkra att värdet är en lämplig lokal konfiguration.


Varning! – Varning! –

En local-mac-address? som har angetts till true kan hindra domänen från att starta via nätverket.


Om du vill visa värdena för OpenBoot PROM-variablerna kan du använda följande kommando i OpenBoot PROM-ledtexten i ett netcon-fönster:


OK printenv

Om du vill återställa local-mac-address? -variabeln till standardinställningen. använder du kommandot setenv:


OK setenv local-mac-address? false

Dynamisk omkonfiguration (DR) på mellanklassiga Sun Enterprise-system

Det här avsnittet innehåller den senaste informationen om dynamiska omkonfigurationsfunktioner (DR) för följande mellanklasservrar som kör Solaris 10:

Mer information om dynamisk omkonfiguration i Sun Enterprise-servrar hittar du i Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems. Solaris 10-versionen innehåller stöd för alla processor-/minneskort och de flesta I/O-kort på de system som nämndes i föregående lista.

Maskinvara som stöds

Innan du fortsätter bör du kontrollera att systemet stöder DR. Om systemet är av en äldre typ visas följande meddelande på konsolen eller i konsolloggarna. Den typen av system är inte lämplig för DR.


Hotplug stöds inte på det här systemet

För närvarande stöds inte följande I/O-kort:

Programvaruinformation

I det här avsnittet finns allmän programvaruinformation om DR.

Aktivera dynamisk omkonfiguration

Om du vill aktivera dynamisk omkonfiguration måste du ange två variabler i /etc/system-filen. Du måste även ange ytterligare en variabel om du vill möjliggöra borttagning av processor-/minneskort. Gör så här:

  1. Logga in som superanvändare.

  2. Lägg till följande rader i filen /etc/system:


    set pln:pln_enable_detach_suspend=1
    set soc:soc_enable_detach_suspend=1
    
  3. Lägg till den här raden i samma fil om du vill möjliggöra borttagning av processor-/minneskort.


    set kernel_cage_enable=1
    

    Genom att ange den här variabeln aktiverar du avkonfigurationsåtgärden för minnet.

  4. Starta om systemet för att ändringarna ska gälla.

Vilolägestest

Du startar vilolägestestet med det här kommandot:


 # cfgadm -x quiesce-test sysctr10:slot antal

På stora system kan vilolägestestet ta upp till en minut. Om inte cfgadm hittar några drivrutiner som inte är kompatibla visas inga meddelanden under tiden.

Listan över deaktiverade kort

Om du försöker ansluta ett kort som finns på listan över deaktiverade kort kan följande felmeddelande visas:


# cfgadm -c connect sysctrl0:slotnummer







cfgadm: Hårdvaruspecifikt fel: koppling misslyckades:
kort är inte aktivt: måste åsidosätta med [-f][-o enable-at-boot]

Det finns två alternativ om du vill åsidosätta det deaktiverade tillståndet:

Om du vill ta bort alla kort från listan över deaktiverade kort, väljer du ett av följande två alternativ beroende på från vilken ledtext som du utfärdar kommandot:

Mer information om inställningen disabled-board-list hittar du i avsnittet ”Specific NVRAM Variables” i handboken Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems. Den här handboken är en del av dokumentationen för den här versionen.

Listan över deaktiverat minne

Information om inställningen disabled-memory-list för OpenBoot PROM har publicerats i den här versionen. Se ”Specific NVRAM Variables” i Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems i dokumentationsuppsättningen Solaris on Sun Hardware.

Ta bort koppla bort-osäkra drivrutiner

Om du behöver ta bort koppla bort-osäkra drivrutiner använder du radkommandot modinfo och söker efter drivrutinernas modul-ID:n. Du kan sedan använda dessa modul-ID:n i kommandot modunload för att ta bort drivrutiner som är osäkra att koppla bort.

Självtestet misslyckades under en anslutningssekvens

Ta bort kortet från systemet så fort som möjligt om följande felmeddelande visas under en DR-anslutningssekvens:


cfgadm: Maskinvaruspecifikt fel: anslutningen misslyckades: 
fel vid åtgärd för fast programvara

Kortets självtest har misslyckats och om du tar bort kortet undviker du omkonfigurationsfel som kan ske under nästa omstart.

En misslyckad självteststatus gör att inga vidare åtgärder är möjliga. Därför måste du om du vill försöka igen omgående först ta bort kortet och sedan sätta in det igen.

Kända fel

Följande lista kan när som helst ändras.

Det går inte att ta bort en nätverksenhet då ett program håller enheten öppen (5054195)

Om en process håller en nätverksenhet öppen misslyckas alla DR-åtgärder som inkluderar denna enhet. Bakgrundsprogram och processer som gör referenssammanräkningar hindrar DR-åtgärder från att slutföras.

Åtgärd: Utför följande steg som superanvändare:

  1. Ta bort eller byt namn på katalogen /rplboot.

  2. Stäng av NFS-tjänsterna.


    # sh /etc/init.d/nfs.server stop
    
  3. Stäng av startservertjänsterna.


    # sh /etc/init.d/boot.server stop
    
  4. Koppla bort DR.

  5. Starta om NFS-tjänsterna.


    # sh /etc/init.d/nfs.server start
    
  6. Starta om startservertjänsterna.


    # sh /etc/init.d/boot.server start
    

Överlagrat minne är felaktigt inställt efter en kritisk återställning (4156075)

Det överlagrade minnet lämnas kvar i ett felaktigt läge när en Sun Enterprise5 x500-server gör en nödomstart. Vidare DR-åtgärder misslyckas. Problemet inträffar endast på system där det överlagrade minnet är angett till min.

Åtgärd: Välj ett av följande alternativ:

Det går inte att avkonfigurera ett processor-/minneskort som har överlagrat minne (4210234)

Om du vill avkonfigurera och sedan koppla bort ett processorkort med minne eller kort med bara minne, måste du först avkonfigurera minnet. Om minnet på kortet är överlagrat med minne på andra kort kan det för närvarande inte bli avkonfigurerat dynamiskt.

Du kan visa överlagrat minne genom att använda kommandona prtdiag och cfgadm.

Åtgärd: Stäng av systemet innan du utför underhåll på kortet och starta sedan om systemet. Om du vill tillåta framtida DR-åtgärder på processor-/minneskortet anger du egenskapen memory-interleave för NVRAM till min. Se även Överlagrat minne är felaktigt inställt efter en kritisk återställning (4156075) för en närliggande diskussion om överlagrat minne.

Det går inte att avkonfigurera ett processor-/minneskort som har permanent minne (4210280)

Om du vill avkonfigurera och sedan koppla bort ett processorkort med minne eller kort med bara minne, måste du först avkonfigurera minnet. För närvarande kan dock vissa minnen inte flyttas. Den här typen av minne anses vara permanent.

Ett permanent minne på en kort markeras som ”permanent” i statusdisplayen cfgadm:


# cfgadm -s cols=ap_id:type:info
Ap_Id Type Information
ac0:bank0 memory slot3 64Mb base 0x0 permanent
ac0:bank1 memory slot3 empty
ac1:bank0 memory slot5 empty
ac1:bank1 memory slot5 64Mb base 0x40000000

I det här exemplet kan kortet i slot3 inte flyttas eftersom det har permanent minne.

Åtgärd: Stäng av systemet innan du utför underhåll på kortet och starta sedan om systemet.

cfgadm-frånkoppling misslyckas när samtidiga cfgadm-kommandon körs (4220105)

Om en cfgadm-process körs på ett kort misslyckas försök att samtidigt koppla bort ett annat kort. Följande felmeddelande visas:


cfgadm: Maskinvaruspecifikt fel: 
frånkoppling misslyckades: fel i nexus-drivrutinen vid frånkoppling:adress

Åtgärd: Kör bara en cfgadm-åtgärd i taget. Låt en cfgadm-åtgärd som körs på ett kort slutföras innan du startar en cfgadm-frånkopplingsåtgärd på ett annat kort.