Manual del usuario del servidor Sun Enterprise 420R

Información sobre la fiabilidad, disponibilidad y facilidad de mantenimiento

Fiabilidad, disponibilidad y facilidad de mantenimiento son tres aspectos del diseño de un sistema que contribuyen a garantizar un funcionamiento continuo y el mínimo tiempo de detención del sistema para operaciones de servicio. La fiabilidad se refiere a la capacidad del sistema de funcionar permanentemente sin fallos y de mantener la integridad de los datos. La disponibilidad hace referencia al porcentaje de tiempo durante el cual se puede acceder y utilizar el sistema. La facilidad de mantenimiento está relacionada con el tiempo que se tarda en volver a poner el servidor en funcionamiento después del fallo del sistema. Todos estos factores juntos son los que permiten obtener un funcionamiento casi continuo del sistema.

Para proporcionar altos niveles de fiabilidad, disponibilidad y facilidad de mantenimiento, el sistema ofrece las siguientes funciones:

Corrección de errores y comprobación de la paridad

El código de corrección de errores (ECC) se utiliza en todas las rutas de datos internas del sistema para garantizar el máximo nivel de integridad de los datos. Todos los datos que se transfieren entre procesadores, puertos de E/S y la memoria están protegidos por ECC de un extremo a otro.

El sistema informa de los errores de ECC que pueden corregirse y los registra. Un error de ECC corregible es un error de un bit en un campo de 64 bits. Este tipo de errores se corrigen en el momento en que se detectan. La implementación de ECC también puede detectar errores de dos bits en el mismo campo de 64 bits y errores de múltiples bits en el mismo grupo de 4 bits.

Además de proteger los datos mediante ECC, el sistema protege la paridad en todos los buses de direcciones del sistema. La protección de la paridad también se utiliza en los buses PCI y SCSI, así como en la caché interna y externa de las CPU UltraSPARC.

Indicadores de estado

El sistema incluye unos indicadores luminosos (LED) en el panel frontal del sistema, los alojamientos de los discos internos y las fuentes de alimentación para proporcionar una señal visual del estado del sistema y sus componentes. Estos LED de estado eliminan la necesidad de adivinar dónde se encuentran los fallos y simplifican el trabajo de diagnóstico para facilitar las reparaciones.

Los LED de estado del sistema se describen en el apartado "Información sobre el panel de control y estado". Los LED de las unidades de disco y las fuentes de alimentación se describen en "Indicaciones de error".

Unidades de disco conectables en marcha

La función de conexión en marcha de las unidades de disco internas permite extraer e instalar las unidades mientras el sistema se mantiene en funcionamiento. El acceso a las unidades es sencillo y se realiza desde la parte frontal del sistema. La tecnología de conexión en marcha representa un incremento importante de la facilidad de mantenimiento y la disponibilidad del sistema, ya que permite:

Para obtener más información sobre las unidades de disco conectables en marcha, consulte "Información sobre las unidades de disco internas" e "Información y conceptos sobre la configuración de las matrices de discos".

Soporte de configuraciones de discos RAID 0, RAID 1, RAID 0 + 1 RAID 5

El software de Solstice DiskSuite, diseñado para su utilización con el sistema, ofrece la posibilidad de utilizar distintos niveles RAID para configurar los discos del servidor. El usuario puede elegir la configuración RAID apropiada en función de los requisitos de precio, rendimiento, fiabilidad y disponibilidad que deba cumplir el sistema.

Todas las configuraciones RAID 0 (striping), RAID 1 (duplicación en espejo), RAID 0+1 (striping más duplicación en espejo, denominado a veces RAID 10) y RAID 5 (striping con paridad intercalada) pueden implementarse mediante Solstice DiskSuite. También se pueden configurar una unidad de disco (o varias) para que actúe como unidad de repuesto que sustituya automáticamente una unidad defectuosa en caso de fallo de un disco.

Para obtener más información sobre las configuraciones de RAID, consulte "Información y conceptos sobre la configuración de las matrices de discos".

Fuentes de alimentación redundantes

El sistema puede albergar una o dos fuentes de alimentación, aunque es capaz de funcionar únicamente con una en cualquiera de sus configuraciones. La segunda fuente de alimentación puede utilizarse para proporcionar redundancia y garantizar así que el sistema continúa funcionando aunque falle una de las fuentes.

Para obtener más detalles sobre la redundancia y normas de configuración de las fuentes de alimentación, consulte "Información sobre las fuentes de alimentación".

Fuentes de alimentación sustituibles en marcha

Las fuentes de alimentación en configuración redundante son sustituibles en marcha. Esto significa que el proveedor de servicios puede cambiar una fuente defectuosa sin necesidad de apagar el sistema o detener el sistema operativo. El acceso a las fuentes de alimentación es sencillo y se realiza desde la parte frontal del sistema. Para obtener más información sobre la extracción e instalación de las fuentes de alimentación, consulte el Sun Enterprise 420R Server Service Manual.

Cuatro niveles de diagnóstico

Para facilitar el mantenimiento y aumentar la disponibilidad, el sistema proporciona cuatro niveles distintos de pruebas de diagnóstico: comprobación automática al encendido (POST), diagnóstico de OpenBoot (OBDiag), SunVTS(TM) y Sun Enterprise SyMON(TM).

POST y OBDiag son pruebas de diagnóstico residentes en el firmware que pueden ejecutarse incluso cuando el servidor no puede arrancar el sistema operativo. El diagnóstico efectuado por aplicaciones como SunVTS y Sun Enterprise SyMON, ofrecen funciones de detección y solución de errores adicionales una vez que el sistema operativo está en funcionamiento.

Las pruebas de diagnóstico POST proporcionan una verificación rápida pero completa de las funciones de hardware básicas del sistema. Para obtener más detalles sobre POST, consulte "Información sobre las pruebas de diagnóstico durante el encendido (POST)" y "Cómo utilizar las pruebas de diagnóstico POST".

Las pruebas de OBDiag realizan un examen más exhaustivo del sistema, que incluye las interfaces externas. OBDiag se describe en los apartados "Información sobre las pruebas de diagnóstico de OpenBoot (OBDiag)" y "Cómo utilizar las pruebas de diagnóstico de OpenBoot (OBDiag)".

En el nivel de aplicación se puede utilizar SunVTS para realizar el diagnóstico. Al igual que OBDiag, SunVTS realiza un examen completo del sistema, incluidas las interfaces externas. Pero SunVTS permite también realizar pruebas en remoto a través de una conexión de red. Sólo se puede utilizar SunVTS si el sistema operativo está en funcionamiento. Para obtener más información sobre esta aplicación, consulte "Información sobre el software SunVTS", "Cómo utilizar el software SunVTS" y "Cómo comprobar si se encuentra instalado el software SunVTS".

También en el nivel de aplicación se encuentra otro programa denominado Sun Enterprise SyMON, que proporciona una amplia variedad de funciones de supervisión permanente del sistema. Permite controlar el estado del hardware y el rendimiento del sistema operativo del servidor. Para obtener más detalles sobre este software, consulte "Información sobre el software Sun Enterprise SyMON".