I det här kapitlet beskrivs problem som gäller mellan- och högklassiga Sun-servrar. Dagens Sun-servrar tillhör systemfamiljen Sun Fire. Äldre servrar tillhör systemfamiljen Sun Enterprise.
Tilläggsinformationen för Sun Validation Test Suite finns nu som ett separat dokument på http://sun.com.
En del av problemen och felen i det här kapitlet har åtgärdats i senare Solaris 10-versioner. Om du har uppgraderat Solaris-programvaran kan det hända att vissa problem och fel som beskrivs i det här kapitlet inte längre är aktuella. Du kan se vilka problem och fel som inte längre är aktuella för din specifika Solaris 10-programvara i Bilaga A, Tabell över integrerade fel i operativsystemet Solaris 10.
I det här avsnittet beskrivs större DR-fel på domänsidan för följande högklassiga Sun Fire-system som körs på Solaris 10:
Sun Fire 25K
Sun Fire 20K
Sun Fire 15K
Sun Fire 12K
Information om DR-fel i Sun Management Services finns i SMS Release Notes för den SMS-version som körs på ditt system.
Följande program- och maskinvarufel gäller högklassiga Sun Fire-system.
Om en process håller en nätverksenhet öppen misslyckas alla DR-åtgärder som inkluderar denna enhet. Bakgrundsprogram och processer som gör referenssammanräkningar hindrar DR-åtgärder från att slutföras.
Åtgärd: Utför följande steg som superanvändare:
Ta bort eller byt namn på katalogen /rplboot.
Stäng av NFS-tjänsterna.
# sh /etc/init.d/nfs.server stop |
Stäng av startservertjänsterna.
# sh /etc/init.d/boot.server stop |
Koppla bort DR.
Starta om NFS-tjänsterna.
# sh /etc/init.d/nfs.server start |
Starta om startservertjänsterna.
# sh /etc/init.d/boot.server start |
Det kan hända att varningar visas när ett DR-kommando körs på ett system som konfigurerats med SunSwift PCI-kortet, Option 1032. De här varningarna uppträder på domäner som kör antingen Solaris 8, Solaris 9 eller Solaris 10. Det här är ett exempel på en varning:
12 aug 12:27:41 machine genunix: VARNING! vmem_destroy('pcisch2_dvma'): läckte |
De här varningarna är ofarliga. DVMA-utrymmet (Direct Virtual Memory Access) uppdateras ordentligt under DR-åtgärden. Det inträffar ingen riktig minnesläcka.
Åtgärd: Om du vill förhindra att den här varningen visas lägger du till följande rad i /etc/system:
set pcisch:pci_preserve_iommu_tsb=0 |
Länken mellan ett system med Sun GigaSwift Ethernet MMF-alternativet X1151A och vissa CISCO-switchar avbryts. Avbrottet sker när du försöker köra en DR-åtgärd på ett sådant system som är anslutet till en av följande switchar:
CISCO WS-c4003-switch (f/w: WS-C4003-programvara, version NmpSW: 4.4(1))
CISCO WS-c4003-switch (f/w: WS-C4003-programvara, version NmpSW: 7.1(2))
CISCO WS-c5500-switch (f/w: WS-C5500-programvara, version McpSW: 4.2(1) och NmpSW: 4.2(1))
Det här problemet syns inte på en CISCO 6509-switch.
Åtgärd: Använd en annan switch. Du kan även kontakta Cisco och fråga efter en korrigeringsfil för de listade switcharna.
Det här avsnittet beskriver större problem som är relaterade till DR på följande mellanklassiga Sun Fire-system:
Sun Fire E6900
Sun Fire E4900
Sun Fire E6800
Sun Fire E4810
Sun Fire E4800
Sun Fire E3800
I Tabell 4–1 anges giltiga kombinationer av Solaris-programmet och systemstyrenhetens fasta programvara för alla mellanklassiga Sun Fire-system som ska köra DR.
Kör senaste fasta programvara för systemstyrenheten på Sun Fire midrange-systemet om du vill kunna utnyttja funktioner för fast programvara och felkorrigeringar på bästa sätt. Den senaste korrigeringsfilinformationen finns på http://sunsolve.sun.com.
Plattform |
Solaris-version |
Minimikrav på fast programvara för systemstyrenheten |
---|---|---|
Sun Fire E6900/E4900 med UltraSPARC IV+ |
Solaris 10 3/05 HW1 (en begränsad version) eller Solaris 10 1/06 |
5.19.0 |
E6900/E4900 utan UltraSPARC IV+ |
Solaris 9 4/04 |
5.16.0 |
Sun Fire 6800/4810/4800/3800 |
Solaris 9 4/04 |
5.16.0 |
Sun Fire 6800/4810/4800/3800 |
Solaris 9 |
5.13.0 |
Du kan uppgradera fast systemprogramvara för det mellanklassiga Sun Fire-systemet genom att ansluta till en FTP- eller HTTP-server där de fasta programvaruavbildningarna lagras. Mer information finns i filerna README och Install.info. De här filerna ingår i de versioner av fast programvara som körs på dina domäner. Du kan hämta Sun-korrigeringsfiler från http://sunsolve.sun.com.
I det här avsnittet listas viktiga DR-fel.
Om en process håller en nätverksenhet öppen misslyckas alla DR-åtgärder som inkluderar denna enhet. Bakgrundsprogram och processer som gör referenssammanräkningar hindrar DR-åtgärder från att slutföras.
Åtgärd: Utför följande steg som superanvändare:
Ta bort eller byt namn på katalogen /rplboot.
Stäng av NFS-tjänsterna.
# sh /etc/init.d/nfs.server stop |
Stäng av startservertjänsterna.
# sh /etc/init.d/boot.server stop |
Koppla bort DR.
Starta om NFS-tjänsterna.
# sh /etc/init.d/nfs.server start |
Starta om startservertjänsterna.
# sh /etc/init.d/boot.server start |
En krasch kan inträffa när ett systemkort som innehåller processorer tas bort från systemet medan Solaris Bandwidth Manager (SBM) används.
Åtgärd: Installera inte SBM på system som ska användas för DR. Utför inte DR-åtgärder på CPU-systemkort på servrar där SBM är installerat.
Det går inte att avkonfigurera cPCI I/O-kort på mellanklassiga Sun Fire-system när port 0 (P0) på kortet är inaktiverad. Det här problemet finns i Solaris 10 och Solaris 9. Det finns även på de Solaris 8-system där en eller flera av följande korrigeringsfiler är installerade:
Korrigeringsfils-ID 108528–11 till och med 108528–29
Korrigeringsfils-ID 111372–02 genom 111372–04
Felet inträffar endast under DR-åtgärder som involverar cPCI-kort. Ett felmeddelande som liknar följande visas:
# cfgadm -c unconfigure NO.IB7 cfgadm: Maskinvaruspecifikt fel: unconfigure N0.IB7: Enheten arbetar:/ssm@0,0/pci@1b,700000/pci@1 |
NO.IB7 är ett CompactPCI I/O-kort med P0 inaktiverad.
Åtgärd: Inaktivera kortplatserna i stället för port 0.
I det här avsnittet beskrivs problem som involverar följande funktioner på Sun Enterprise 10000-server:
Krav för systemtjänstprocessorn
DR (Dynamic reconfiguration)
InterDomain Networks (IDNs)
Operativsystemet Solaris på Sun Enterprise 10000-domäner
Solaris 10 kan köras på enskilda domäner inom ett Sun Enterprise 10000-system. Systemtjänstprocessorn för Sun Enterprise 10000 stöds dock inte i den här versionen.
För att systemtjänstprocessorn ska ge stöd åt Solaris 10 krävs SSP 3.5. Installera först SSP 3.5 på systemtjänstprocessorn. Installera eller uppgradera sedan till operativsystemet Solaris 10 på en Sun Enterprise 10000-domän.
SSP 3.5 krävs även för att domänen ska kunna konfigureras ordentligt för DR Model 3.0.
I det här avsnittet beskrivs olika problem som involverar dynamisk omkonfiguration (DR) på Sun Enterprise 10000-domäner.
Du måste använda DR 3.0 på Sun Enterprise 10000-domäner som kör operativsystemet Solaris med början från Solaris 9 12/03-versionen. DR model 3.0 refererar till funktioner som utför DR-åtgärder genom att använda följande kommandon på systemtjänstprocessorn:
addboard
moveboard
deleteboard
showdevices
rcfgadm
Du kan köra kommandot cfgadm på domäner om du vill hämta information om kortstatus. DR model 3.0 interagerar även med RCM (Reconfiguration Coordination Manager) för att koordinera DR-åtgärder med andra program som körs på en domän.
Mer information om DR model 3.0 hittar du i användarhandboken för Sun Enterprise 10000 Dynamic Reconfiguration.
I den här Solaris-versionen frigör inte DR användarprocesser automatiskt från processorer som kopplas bort. Du måste själv utföra den här åtgärden innan frånkopplingssekvensen initieras. Tömningen misslyckas om det finns bundna processer knutna till processorer.
Om en process håller en nätverksenhet öppen misslyckas alla DR-åtgärder som inkluderar denna enhet. Bakgrundsprogram och processer som gör referenssammanräkningar hindrar DR-åtgärder från att slutföras.
Åtgärd: Utför följande steg som superanvändare:
Ta bort eller byt namn på katalogen /rplboot.
Stäng av NFS-tjänsterna.
# sh /etc/init.d/nfs.server stop |
Stäng av startservertjänsterna.
# sh /etc/init.d/boot.server stop |
Koppla bort DR.
Starta om NFS-tjänsterna.
# sh /etc/init.d/nfs.server start |
Starta om startservertjänsterna.
# sh /etc/init.d/boot.server start |
SSP 3.5 krävs för att en domän ska kunna konfigureras ordentligt för DR 3.0. Efter att du har uppgraderat SSP till SSP 3.5 (när DR 3.0 är aktiverat på domänen) kör du följande kommando:
# devfsadm -i ngdr |
För att en domän ska kunna bli del av ett InterDomain Network (IDN) måste alla kort med aktivt minne i domänen ha minst en aktiv processor.
Innan du utfärdar boot net-kommandot från OpenBoot PROM-ledtexten (OK), verifierar du att local-mac-address? har angetts till false. Det är standardfabriksinställningen. Om variabeln har angetts som true måste du försäkra att värdet är en lämplig lokal konfiguration.
En local-mac-address? som har angetts till true kan hindra domänen från att starta via nätverket.
Om du vill visa värdena för OpenBoot PROM-variablerna kan du använda följande kommando i OpenBoot PROM-ledtexten i ett netcon-fönster:
OK printenv |
Om du vill återställa local-mac-address? -variabeln till standardinställningen. använder du kommandot setenv:
OK setenv local-mac-address? false |
Det här avsnittet innehåller den senaste informationen om dynamiska omkonfigurationsfunktioner (DR) för följande mellanklasservrar som kör Solaris 10:
Sun Enterprise 6x00
Sun Enterprise 5x00
Sun Enterprise 4x00
Sun Enterprise 3x00
Mer information om dynamisk omkonfiguration i Sun Enterprise-servrar hittar du i Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems. Solaris 10-versionen innehåller stöd för alla processor-/minneskort och de flesta I/O-kort på de system som nämndes i föregående lista.
Innan du fortsätter bör du kontrollera att systemet stöder DR. Om systemet är av en äldre typ visas följande meddelande på konsolen eller i konsolloggarna. Den typen av system är inte lämplig för DR.
Hotplug stöds inte på det här systemet |
För närvarande stöds inte följande I/O-kort:
Type 2 (grafik)
Type 3 (PCI)
Type 5 (grafik och SOC+)
I det här avsnittet finns allmän programvaruinformation om DR.
Om du vill aktivera dynamisk omkonfiguration måste du ange två variabler i /etc/system-filen. Du måste även ange ytterligare en variabel om du vill möjliggöra borttagning av processor-/minneskort. Gör så här:
Logga in som superanvändare.
Lägg till följande rader i filen /etc/system:
set pln:pln_enable_detach_suspend=1 set soc:soc_enable_detach_suspend=1 |
Lägg till den här raden i samma fil om du vill möjliggöra borttagning av processor-/minneskort.
set kernel_cage_enable=1 |
Genom att ange den här variabeln aktiverar du avkonfigurationsåtgärden för minnet.
Starta om systemet för att ändringarna ska gälla.
Du startar vilolägestestet med det här kommandot:
# cfgadm -x quiesce-test sysctr10:slot antal |
På stora system kan vilolägestestet ta upp till en minut. Om inte cfgadm hittar några drivrutiner som inte är kompatibla visas inga meddelanden under tiden.
Om du försöker ansluta ett kort som finns på listan över deaktiverade kort kan följande felmeddelande visas:
# cfgadm -c connect sysctrl0:slotnummer cfgadm: Hårdvaruspecifikt fel: koppling misslyckades: kort är inte aktivt: måste åsidosätta med [-f][-o enable-at-boot] |
Det finns två alternativ om du vill åsidosätta det deaktiverade tillståndet:
Använd den tvingande (force) flaggan (-f)
# cfgadm -f -c connect sysctrl0:slot antal |
Använd aktivera-alternativet (-o aktivera-vid-start )
# cfgadm -o enable-at-boot -c connect sysctrl0:slot antal |
Om du vill ta bort alla kort från listan över deaktiverade kort, väljer du ett av följande två alternativ beroende på från vilken ledtext som du utfärdar kommandot:
I superanvändarledtexten skriver du:
# eeprom disabled-board-list= |
I OpenBoot PROM-ledtexten skriver du:
OK set-default disabled-board-list |
Mer information om inställningen disabled-board-list hittar du i avsnittet ”Specific NVRAM Variables” i handboken Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems. Den här handboken är en del av dokumentationen för den här versionen.
Information om inställningen disabled-memory-list för OpenBoot PROM har publicerats i den här versionen. Se ”Specific NVRAM Variables” i Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems i dokumentationsuppsättningen Solaris on Sun Hardware.
Om du behöver ta bort koppla bort-osäkra drivrutiner använder du radkommandot modinfo och söker efter drivrutinernas modul-ID:n. Du kan sedan använda dessa modul-ID:n i kommandot modunload för att ta bort drivrutiner som är osäkra att koppla bort.
Ta bort kortet från systemet så fort som möjligt om följande felmeddelande visas under en DR-anslutningssekvens:
cfgadm: Maskinvaruspecifikt fel: anslutningen misslyckades: fel vid åtgärd för fast programvara |
Kortets självtest har misslyckats och om du tar bort kortet undviker du omkonfigurationsfel som kan ske under nästa omstart.
En misslyckad självteststatus gör att inga vidare åtgärder är möjliga. Därför måste du om du vill försöka igen omgående först ta bort kortet och sedan sätta in det igen.
Följande lista kan när som helst ändras.
Om en process håller en nätverksenhet öppen misslyckas alla DR-åtgärder som inkluderar denna enhet. Bakgrundsprogram och processer som gör referenssammanräkningar hindrar DR-åtgärder från att slutföras.
Åtgärd: Utför följande steg som superanvändare:
Ta bort eller byt namn på katalogen /rplboot.
Stäng av NFS-tjänsterna.
# sh /etc/init.d/nfs.server stop |
Stäng av startservertjänsterna.
# sh /etc/init.d/boot.server stop |
Koppla bort DR.
Starta om NFS-tjänsterna.
# sh /etc/init.d/nfs.server start |
Starta om startservertjänsterna.
# sh /etc/init.d/boot.server start |
Det överlagrade minnet lämnas kvar i ett felaktigt läge när en Sun Enterprise5 x500-server gör en nödomstart. Vidare DR-åtgärder misslyckas. Problemet inträffar endast på system där det överlagrade minnet är angett till min.
Åtgärd: Välj ett av följande alternativ:
Om du vill åtgärda problemet startar du om systemet manuellt vid ledtexten OK.
Om du vill undvika problemet anger du egenskapen memory-interleave för NVRAM till max.
Det andra alternativet gör att minnet överlagras så fort systemet startas. Eftersom ett minneskort som innehåller överlagrat minne inte kan omkonfigureras dynamiskt kan detta alternativ vara oanvändbart. Mer information finns i avsnittet Det går inte att avkonfigurera ett processor-/minneskort som har överlagrat minne (4210234).
Om du vill avkonfigurera och sedan koppla bort ett processorkort med minne eller kort med bara minne, måste du först avkonfigurera minnet. Om minnet på kortet är överlagrat med minne på andra kort kan det för närvarande inte bli avkonfigurerat dynamiskt.
Du kan visa överlagrat minne genom att använda kommandona prtdiag och cfgadm.
Åtgärd: Stäng av systemet innan du utför underhåll på kortet och starta sedan om systemet. Om du vill tillåta framtida DR-åtgärder på processor-/minneskortet anger du egenskapen memory-interleave för NVRAM till min. Se även Överlagrat minne är felaktigt inställt efter en kritisk återställning (4156075) för en närliggande diskussion om överlagrat minne.
Om du vill avkonfigurera och sedan koppla bort ett processorkort med minne eller kort med bara minne, måste du först avkonfigurera minnet. För närvarande kan dock vissa minnen inte flyttas. Den här typen av minne anses vara permanent.
Ett permanent minne på en kort markeras som ”permanent” i statusdisplayen cfgadm:
# cfgadm -s cols=ap_id:type:info Ap_Id Type Information ac0:bank0 memory slot3 64Mb base 0x0 permanent ac0:bank1 memory slot3 empty ac1:bank0 memory slot5 empty ac1:bank1 memory slot5 64Mb base 0x40000000 |
I det här exemplet kan kortet i slot3 inte flyttas eftersom det har permanent minne.
Åtgärd: Stäng av systemet innan du utför underhåll på kortet och starta sedan om systemet.
Om en cfgadm-process körs på ett kort misslyckas försök att samtidigt koppla bort ett annat kort. Följande felmeddelande visas:
cfgadm: Maskinvaruspecifikt fel: frånkoppling misslyckades: fel i nexus-drivrutinen vid frånkoppling:adress |
Åtgärd: Kör bara en cfgadm-åtgärd i taget. Låt en cfgadm-åtgärd som körs på ett kort slutföras innan du startar en cfgadm-frånkopplingsåtgärd på ett annat kort.