Ägarhandbok för Sun Enterprise 220R

Om funktioner för pålitlighet, tillgänglighet och enkel service

Pålitlighet, tillgänglighet och lättheten att utföra service är tre aspekter av ett systems design som gör att det kan vara igång länge och inte behöver vara avstängt för service länge. Pålitlighet är serverns förmåga att kunna vara igång hela tiden utan fel, och att data förblir intakta. Systemets tillgänglighet är den andel av tiden som det går att komma åt och använda systemet. Lätthet att utföra service är hur lång tid det tar att göra service på systemet efter ett systemfel. Om dessa tre är bra kan systemet vara igång nästan hela tiden.

För att få hög pålitlighet, tillgänglighet och lätthet att utföra service erbjuder systemet följande funktioner:

Felkorrigering och paritetskontroll

ECC (felkorrigerande kod, error-correcting code) används i alla interna datavägar i systemet för att bevara dataintegriteten. Alla data som flyttas mellan processorerna, I/O och minne har ECC-skydd hela vägen.

System rapporterar och loggar de ECC-fel som det kan korrigera. ECC-fel som systemet kan korrigera är alla fel på en bit i ett 64-bitarsfält. Denna typ av fel korrigeras när de upptäcks. ECC-funktionerna kan även upptäcka tvåbitarsfel i samma 64-bitarsfält och flera bitars fel i samma nibble (4 bitar).

Förutom ECC-skydd för data erbjuder systemet paritetsskydd på systemets alla adressbussar. Paritetsskydd används också på PCI- och SCSI-bussarna och i UltraSPARC-processorernas interna och externa cache.

Statuslampor

Systemet har lättåtkomliga statuslampor (lysdioder) på frontpanelen, platserna för de interna hårddiskarna och nätaggregaten för att man direkt skall kunna se status för systemet och dess komponenter. Statuslamporna gör att man inte behöver hålla på och gissa vad som är fel och förenklar problemdiagnostik för att ytterligare öka enkelheten vid service.

Systemets statuslampor beskrivs i avsnittet "Om status- och kontrollpanelen". Hårddisk- och nätaggregatslamporna beskrivs i "Felindikationer".

Hårddiskar som kan sättas i under drift

Funktionen att interna hårddiskar kan sättas i under drift (hot-plug) gör att hårddiskar kan tas ur och installeras medan systemet är igång. Alla hårddiskar går lätt att komma åt från systemets framsida. Hot-plug-tekniken gör det markant enklare att utföra service och systemets tillgänglighet ökar, genom att man kan:

Mer information om hårddiskar, och hot-plug-funktionen, finns i "Om interna hårddiskar" och "Om konfigurationer av diskuppsättningar och koncept i samband med detta".

Stöd för konfigurationer med RAID 0, RAID 1, RAID 0 + 1 och RAID 5

Solstice DiskSuite-programvaran är designad för användning med systemet och gör att man kan konfigurera systemets hårddisklagring till ett antal olika RAID-nivåer. Du väljer rätt RAID-konfiguration efter vad du önskar inom pris, prestanda, pålitlighet och tillgänglighet.

RAID 0 ("striping"), RAID 1 (spegling), RAID 0+1 (striping plus spegling--kallas ibland RAID 10) och RAID 5 (striping med paritet på annan disk) kan konfigureras med Solstice DiskSuite. Du kan också konfigurera så att en eller flera hårddiskar är klara att börja fungera som en ersättning för någon annan disk om någon skulle gå sönder (hot spare).

Mer information om RAID-konfigurationer finns i "Om konfigurationer av diskuppsättningar och koncept i samband med detta".

Redundanta nätaggregat

Det kan sitta ett eller två nätaggregat i systemet. Alla systemkonfigurationer kan fungera med ett nätaggregat. Med ett andra aggregat får man redundans i och med att systemet kan fortsätta fungera även om ett nätaggregat skulle gå sönder.

Mer information om nätaggregat, redundans och konfigureringsregler finns i "Om nätaggregat".

Nätaggregat som kan bytas under drift

Nätaggregat i en redundant konfiguration kan bytas under drift (hot-swap). En kvalificerad servicerepresentant kan ta ur och byta ut ett trasigt nätaggregat utan att behöva stänga av systemet, eller ens ta ned operativsystemet. Nätaggregaten går lätt att komma åt från systemets framsida. Information om hur man tar ur och installerar ett nätaggregat finns i Sun Enterprise 220R Server Service Manual.

Fyra diagnostiknivåer

För att göra det ännu lättare att utföra service och öka tillgängligheten ytterligare har systemet fyra olika diagnostiknivåer: POST (power-on self-test), OpenBoot-diagnostik (OBDiag), SunVTS(TM) och Sun Enterprise SyMON(TM).

POST och OBDiag är diagnostik som ligger i den inbyggda programvaran och därför kan köras även om det inte går att starta operativsystemet. Diagnostik på programnivå, som SunVTS och Sun Enterprise SyMON, erbjuder ytterligare felsökningsfunktioner när operativsystemet fungerar.

POST-diagnostik gör en snabb men relativt noggrann kontroll av systemets alla grundläggande maskinvarufunktioner. Mer information om POST finns i "Om POST-diagnostik" och "Gör så här för att använda POST-diagnostik".

OBDiag-diagnostik gör ett mer omfattande test av systemet, inklusive externa gränssnitt. OBDiag beskrivs i "Om OpenBoot Diagnostics (OBDiag)" och "Gör så här för att använda OBDiag".

På programnivå kan du använda SunVTS-diagnostik. Precis som OBDiag kan SunVTS göra ett omfattande test av systemet, inklusive dess externa gränssnitt. SunVTS kan också köra fjärrtester av andra datorer över nätverket. Du kan bara använda SunVTS om operativsystemet är igång. Mer infomation om SunVTS finns i "Om SunVTS", "Gör så här för att använda SunVTS" och "Gör så här för att kontrollera om SunVTS är installerat".

Ett annat verktyg på programnivå är Sun Enterprise SyMON. Med detta kan du hela tiden övervaka systemet. Du kan övervaka statusen för systemets maskinvara och operativsystemets prestanda. Mer information om Sun Enterprise SyMON finns i "Om Sun Enterprise SyMON".