Suplemento de notas sobre la versión de Solaris 8 para hardware de Sun

Capítulo 6 Cuestiones pendientes relativas a los sistemas Sun Enterprise 6x00, 5x00, 4x00 y 3x00

Reconfiguración dinámica en los sistemas Sun Enterprise 6x00, 5x00, 4x00 y 3x00

Estas notas proporcionan la información más recientes sobre la función de Reconfiguración dinámica (DR) en los sistemas Sun EnterpriseTM 6x00, 5x00, 4x00 y 3x00 que ejecutan el entorno operativo Solaris 8 de Sun Microsystems. Para obtener más información sobre la reconfiguración dinámica en servidores Sun Enterprise, consulte Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems.

El entorno operativo Solaris 8 incluye soporte para placas de CPU/memoria y para la mayoría de las placas de E/S en sistemas Sun Enterprise 6x00, 5x00, 4x00 y 3x00.

Hardware admitido

Antes de empezar, compruebe si el sistema soporta la reconfiguración dinámica. Si observa el siguiente mensaje en la consola o en los registros de la consola, significa que el modelo del hardware es antiguo y no apto para la reconfiguración dinámica.


Hot Plug not supported in this system

Las placas de E/S admitidas figuran en la sección "Solaris 8" de la página Web siguiente:

http://sunsolve5.sun.com/sunsolve/Enterprise-dr

En el presente no se admiten las placas de E/S de tipo 2 (gráficos), tipo 3 (PCI) y tipo 5 (gráficos y SOC+).

Notas sobre el firmware

Matrices de discos o unidades internas FC-AL

En las matrices de discos Sun StorEdgeTM A5000 o los discos internos FC-AL del sistema Sun Enterprise 3500, la versión del firmware debe ser ST19171FC 0413 o posterior. Para obtener más información, consulte la sección "Solaris 8" de la página Web siguiente:

http://sunsolve5.sun.com/sunsolve/Enterprise-dr

Actualizaciones de la PROM para CPU y placas de E/S

Los usuarios de Solaris 8 que deseen utilizar la reconfiguración dinámica deben utilizar la versión 3.2.22, o una versión posterior, para la PROM de la CPU (ID de modificación del firmware 103346-xx). Este firmware se encuentra disponible en la Web. Consulte "Forma de obtener el firmware".

Las versiones antiguas de la PROM de la CPU pueden mostrar el siguiente mensaje durante el arranque:


Firmware does not support Dynamic Reconfiguration


Precaución - Precaución -

La PROM 3.2.16 de la CPU y versiones anteriores no muestran este mensaje, aunque no admiten la reconfiguración dinámica de las placas de CPU/memoria.


  1. Para ver la revisión utilizada de la PROM, introduzca .version y banner en el indicador ok. La pantalla será similar a la siguiente:


    ok .version 
    Slot  0 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26  iPOST 3.4.22 1999/xx/xx 19:31
    Slot  1 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26  iPOST 3.4.22 1999/xx/xx 19:31
    Slot  2 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  3 - I/O Type 4 FCODE 1.8.22 1999/xx/xx 19:27  iPOST 3.4.22 1999/xx/xx 19:31
    Slot  4 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  5 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  6 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  7 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  9 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot 11 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot 12 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot 14 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    ok banner
    16-slot Sun Enterprise E6500
    OpenBoot 3.2.22, 4672 MB memory installed, Serial #xxxxxxxx.
    Ethernet address 8:0:xx:xx:xx:xx, Host ID: xxxxxxxx.

Forma de obtener el firmware

Si precisa información para actualizar el firmware, consulte la sección "Solaris 8" en la página Web siguiente:

http://sunsolve5.sun.com/sunsolve/Enterprise-dr

En esta página, encontrará información sobre la forma de:

Si no puede acceder a la Web, acuda a un proveedor de servicios de Sun para solicitar ayuda.

Notas sobre el software

Activación de la reconfiguración dinámica

Es necesario definir dos variables del archivo /etc/system para activar la reconfiguración dinámica, además de otra variable para habilitar la desinstalación de las placas de CPU/memoria.

  1. Entre en el sistema como superusuario.

  2. Para activar la reconfiguración dinámica, abra el archivo /etc/system y agregue las líneas siguientes:


    set pln:pln_enable_detach_suspend=1
    set soc:soc_enable_detach_suspend=1

  3. Para activar la supresión de una placa de CPU/memoria, agregue esta línea al archivo /etc/system:


    set kernel_cage_enable=1

    Al definir esta variable, se activa la operación de desconfiguración de la memoria.

  4. Rearranque el sistema para que los cambios tengan efecto.

Prueba de interrupción/reanudación

En sistemas de grandes dimensiones, el comando quiesce-test (cfgadm -x quiesce-test sysctrl0:slotnúmero) puede tardar cerca de un minuto en ejecutarse. Durante este tiempo, no se muestran mensajes si cfgadm no encuentra controladores incompatibles. Este comportamiento es normal.

Lista de placas desactivadas

Si una placa se encuentra en la lista de placas desactivadas, el intento de conectar esa placa puede generar un mensaje de error:


# cfgadm -c connect sysctrl0:slotnúmero
cfgadm: Hardware specific failure: connect failed: board is
 disabled: must override with [-f][-o enable-at-boot]

  1. Para eliminar la condición de desactivación, utilice la opción -f (force) o la opción de activación (-o enable-at-boot) con el comando cfgadm:


    # cfgadm -f -c connect sysctrl0:slotnúmero
    

    # cfgadm -o enable-at-boot -c connect sysctrl0:slotnúmero
    

  1. Para suprimir todas las placas de la lista de placas desactivadas, no defina ningún valor para la variable disabled-board-list con el comando del sistema:


    # eeprom disabled-board-list=
    

  1. Si se encuentra en el indicador de OpenBootTM, utilice este comando de OBP en lugar del comando anterior para suprimir todas las placas de la lista de placas desactivadas:


    OK set-default disabled-board-list
    

    Para obtener más información sobre la configuración de disabled-board-list, consulte la sección "Specific NVRAM Variables" en el manual Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems, dentro del conjunto AnswerBook Solaris on Sun Hardware Collection correspondiente a esta versión.

Lista de memorias desactivadas

Para obtener información sobre la configuración de la variable disabled-memory-list de OBP, consulte la sección "Specific NVRAM Variables" del manual Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems, dentro del conjunto AnswerBook Solaris on Sun Hardware Collection correspondiente a esta versión.

Descarga de controladores no fiables para la desconexión

Si es necesario descargar controladores que no son seguros para la desconexión, utilice el comando modinfo(1M) para localizar los ID de módulo de esos controladores. Puede utilizar esos ID con el comando modunload(1M) para descargar los controladores no fiables.

Memoria intercalada

Las placas de memoria o las placas de CPU/memoria que contengan memoria intercalada no pueden desconfigurarse de forma dinámica.

Para determinar si la memoria está intercalada, utilice los comandos prtdiag o cfgadm.

Para posibilitar las operaciones de DR en placas de CPU/memoria, defina la propiedad memory-interleave de NVRAM con el valor min.

Para obtener más información sobre la memoria intercalada, consulte "El intercalado de la memoria se define incorrectamente después de una restauración por error grave (4156075)" y "DR: No se pude desconfigurar una placa de CPU/memoria que tiene memoria intercalada (4210234)".

Fallo de la prueba de autocomprobación durante una secuencia de conexión

Si aparece el error "cfgadm: Hardware specific failure: connect failed: firmware operation error" durante una secuencia de conexión de DR, extraiga la placa del sistema lo antes posible. Ha fallado la prueba de autocomprobación de la placa y su extracción evita posibles errores de reconfiguración en el siguiente arranque del sistema.

Si desea volver a intentar la operación que ha fallado, debe retirar primero la placa y volverla a instalar, ya que su estado no admite ninguna otra operación.

La función de Reconfiguración dinámica en el software de Sun Management Center

El software de supervisión y gestión de sistemas Sun Management Center(TM) soporta la Reconfiguración dinámica en el entorno operativo Solaris 8. Consulte el Manual del usuario de Sun Management Center 2.1, número de referencia 806-3237-10.

Errores conocidos

La sista siguiente es susceptible de cambios en cualquier momento. Para obtener la última información sobre errores y modificaciones de software, consulte: http://sunsolve5.sun.com/sunsolve/Enterprise-dr.

cfgadm -v no funciona correctamente (4149371)

Categoría: RFE

La prueba de memoria debería indicar con cierta frecuencia que sigue en ejecución. Durante pruebas largas, el usuario no puede determinar con facilidad si el sistema se está bloqueando.

Solución alternativa: Supervise la evolución del sistema en otro shell, u otra ventana, utilizando vmstat(1M), ps(1) u otros comandos de shell similares.

El intercalado de la memoria se define incorrectamente después de una restauración por error grave (4156075)

Categoría: Error

El intercalado de la memoria queda en un estado incorrecto cuando un servidor Sun Enterprise X500 rearranca después de una restauración por error grave. La posteriores operaciones de DR fallan. El problema sólo se produce en sistemas donde el intercalado de memoria está definido con min.

Soluciones alternativas: Existen las dos posibilidades siguientes.

  1. Para eliminar el problema una vez que se ha producido, restaure manualmente el sistema desde el indicador OK.

  1. Para evitar que se produzca el problema, defina la propiedad memory-interleave de NVRAM con el valor max.

    Esto hace que la memoria se intercale cada vez que se arranca el sistema, pero puede que encuentre esta opción inaceptable, ya que la placa de memoria que contenga la memoria intercalada no puede desconfigurarse dinámicamente. Consulte "DR: No se pude desconfigurar una placa de CPU/memoria que tiene memoria intercalada (4210234)".

La salida de vmstat es incorrecta después de configurar los procesadores (4159024)

Categoría: Error

vmstat muestra un número extraordinariamente alto de interrupciones después de configurar las CPU. Con vmstat ejecutándose en el fondo, el campo de interrupciones se vuelve anormalmente grande (pero esto no indica que exista un problema). En la última fila del ejemplo siguiente, la columna de interrupciones (in) tiene un valor de 4294967216:


#  procs     memory            page            disk          faults      cpu
 r b w   swap  free  re  mf pi po fr de sr s6 s9 s1 --   in   sy   cs us sy id
 0 0 0 437208 146424  0   1  4  0  0  0  0  0  1  0  0   50   65   79  0  1 99
 0 0 0 413864 111056  0   0  0  0  0  0  0  0  0  0  0  198  137  214  0  3 97
 0 0 0 413864 111056  0   0  0  0  0  0  0  0  0  0  0  286  101  200  0  3 97
 0 0 0 413864 111072  0  11  0  0  0  0  0  0  1  0  0 4294967216 43 68 0 0 100

Solución alternativa: Reiniciar vmstat.

DR: No se pude desconfigurar una placa de CPU/memoria que tiene memoria intercalada (4210234)

Categoría: RFE

No se puede desconfigurar una placa de CPU/memoria que contiene memoria intercalada.

Para desconfigurar y posteriormente desconectar una placa de CPU con memoria o una placa con memoria únicamente, es necesario desconfigurar primero la memoria. Pero si la memoria de la placa está intercalada con memoria de otras placas, entonces no puede desconfigurarse de forma dinámica.

El intercalado de memoria puede verse mediante los comandos prtdiag o cfgadm.

Solución alternativa: Apague el sistema antes de operar con la placa y vuelva a arrancarlo una vez hecho. Para que DR puede efectuar operaciones en la placa de CPU/memoria en el futuro, defina la propiedad memory-interleave de NVRAM con el valor min. Consulte también "El intercalado de la memoria se define incorrectamente después de una restauración por error grave (4156075)", si desea ver más información relacionada con la memoria intercalada.

DR: No se puede desconfigurar una placa de CPU/memoria que tiene memoria permanente (4210280)

Categoría: RFE

Para desconfigurar y posteriormente desconectar una placa de CPU con memoria o una placa únicamente de memoria, es necesario desconfigurar primero la memoria. Sin embargo, determinada memoria no puede reasignarse; se considera permanente.

La memoria permanente de una placa está marcada como "permanent" en la pantalla de estado de cfgadm:


# cfgadm -s cols=ap_id:type:info
Ap_Id Type Information
ac0:bank0 memory slot3 64Mb base 0x0 permanent
ac0:bank1 memory slot3 empty
ac1:bank0 memory slot5 empty
ac1:bank1 memory slot5 64Mb base 0x40000000

En este ejemplo, la placa de la ranura 3 (slot3) tiene memoria permanente y, por tanto, no puede extraerse.

Solución alternativa: Apague el sistema antes de operar con la placa y vuelva a arrancarlo una vez hecho.

La desconexión con cfgadm falla cuando se ejecutan otros comandos cfgadm simultáneamente (4220105)

Categoría: Error

Si se ejecuta un proceso cfgadm en una placa, fallará cualquier intento de desconectar otra placa simultáneamente.

Una operación de desconexión mediante cfgadm falla si hay otro proceso cfgadm ejecutándose al mismo tiempo en otra placa. El mensaje que aparece es:


cfgadm: Hardware specific failure: disconnect failed: nexus
error during detach: dirección

Solución alternativa: No lleve a cabo más de una operación con cfgadm de forma simultánea. Si se ejecuta cfgadm en una placa, espere a que finalice el proceso antes de iniciar otra operación de desconexión con cfgadm en otra placa.

No pueden desconectarse las placas de servidores Sun Enterprise que contienen tarjetas QFE (4231845)

Cuando un servidor está configurado como servidor de arranque de clientes x86 basados en Solaris 2.5.1, tiene en ejecución varios trabajos rpld con independencia de que se estén utilizando estos dispositivos. Estas referencias activas impiden a DR desconectar dichos dispositivos.

Solución alternativa: para realizar una operación de desconexión con DR:

  1. Suprima o cambie el nombre del directorio /rplboot.

  2. Detenga los servicios NFS con este comando:


    # sh /etc/init.d/nfs.server stop
    

  3. Lleve a cabo la operación de desconexión de DR.

  4. Reinicie los servicios NFS con este comando:


    # sh /etc/init.d/nfs.server start