Estas notas proporcionan la información más recientes sobre la función de Reconfiguración dinámica (DR) en los sistemas Sun EnterpriseTM 6x00, 5x00, 4x00 y 3x00 que ejecutan la versión 8/99 de la línea de productos SolarisTM 7 de Sun Microsystems. Para obtener más información sobre la reconfiguración dinámica en servidores Sun Enterprise, consulte Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems.
La versión 8/99 incluye soporte para placas de CPU/memoria en sistemas Sun Enterprise 6x00, 5x00, 4x00 y 3x00.
Antes de empezar, compruebe si el sistema soporta la reconfiguración dinámica. Si observa el siguiente mensaje en la consola o en los registros de la consola, significa que el modelo del hardware es antiguo y no apto para la reconfiguración dinámica.
Hot Plug not supported in this system
Las placas de E/S admitidas figuran en la sección "Solaris 7 8/99" de la página Web:
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
En el presente no se admiten las placas de E/S de tipo 2 (gráficos), tipo 3 (PCI) y tipo 5 (gráficos y SOC+).
En las matrices de discos Sun StorEdgeTM A5000 o los discos internos FC-AL del sistema Sun Enterprise 3500, la versión del firmware debe ser ST19171FC 0413 o posterior. Para obtener más información, consulte la sección "Solaris 7 8/99" de la página Web:
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
Los usuarios de Solaris 7 8/99 que deseen utilizar la reconfiguración dinámica deben utilizar la versión 3.2.22, o una versión posterior, para la PROM de la CPU (ID de modificación del firmware 103346-xx). Este firmware se encuentra disponible en la Web. Consulte "Forma de obtener el firmware".
Las versiones antiguas de la PROM de la CPU pueden mostrar el siguiente mensaje durante el arranque:
Firmware does not support Dynamic Reconfiguration
La PROM 3.2.16 de la CPU y versiones anteriores no muestran este mensaje, aunque no admiten la reconfiguración dinámica de las placas de CPU/memoria.
Para ver la revisión utilizada de la PROM, introduzca .version y banner en el indicador ok. La pantalla será similar a la siguiente:
ok .version |
Slot 0 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 1 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 2 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 3 - I/O Type 4 FCODE 1.8.22 1999/xx/xx 19:27 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 4 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 5 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 6 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 7 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 9 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 11 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 12 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 14 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
ok banner |
16-slot Sun Enterprise E6500 |
OpenBoot 3.2.22, 4672 MB memory installed, Serial #xxxxxxxx. |
Ethernet address 8:0:xx:xx:xx:xx, Host ID: xxxxxxxx. |
Si precisa información para actualizar el firmware, consulte la sección "Solaris 7 8/99" en la página Web.
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
En esta página, encontrará información sobre la forma de:
Descargar el firmware de PROM con soporte para DR
Actualizar la PROM
Si no puede acceder a la Web, acuda a un proveedor de servicios de Sun para solicitar ayuda.
Es necesario definir dos variables del archivo /etc/system para activar la reconfiguración dinámica, además de otra variable para habilitar la desinstalación de las placas de CPU/memoria.
Entre en el sistema como usuario root.
Para activar la reconfiguración dinámica, abra el archivo /etc/system y agregue las líneas siguientes:
set pln:pln_enable_detach_suspend=1 set soc:soc_enable_detach_suspend=1
Para activar la supresión de una placa de CPU/memoria, agregue esta línea al archivo /etc/system:
set kernel_cage_enable=1
Al definir esta variable, se activa la operación de desconfiguración de la memoria.
Rearranque el sistema para que los cambios tengan efecto.
En sistemas de grandes dimensiones, el comando quiesce-test (cfgadm -x quiesce-test sysctrl0:slotnúmero) puede tardar cerca de un minuto en ejecutarse. Durante este tiempo, no se muestran mensajes si cfgadm no encuentra controladores incompatibles. Este comportamiento es normal.
Si una placa se encuentra en la lista de placas desactivadas, el intento de conectar esa placa puede generar un mensaje de error:
# cfgadm -c connect sysctrl0:slotnúmero cfgadm: Hardware specific failure: connect failed: board is disabled: must override with [-f][-o enable-at-boot]
Para eliminar la condición de desactivación, utilice la opción -f (force) o la opción de activación (-o enable-at-boot) con el comando cfgadm:
# cfgadm -f -c connect sysctrl0:slotnúmero
# cfgadm -o enable-at-boot -c connect sysctrl0:slotnúmero
Para suprimir todas las placas de la lista de placas desactivadas, no defina ningún valor para la variable disabled-board-list con el comando del sistema:
# eeprom disabled-board-list=
Si se encuentra en el indicador de OpenBootTM, utilice en su lugar este comando de OBP para suprimir todas las placas de la lista de placas desactivadas:
OK set-default disabled-board-list
Para obtener más información sobre la configuración de disabled-board-list, consulte la sección "Specific NVRAM Variables" en el manual Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems, número de referencia 805-4454.
Para obtener información sobre la configuración de la variable disabled-memory-list de OBP, consulte la sección "Specific NVRAM Variables" del manual Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems, número de referencia 805-4454.
Si es necesario descargar controladores que no son seguros para la desconexión, utilice el comando modinfo(1M) para localizar los ID de módulo de esos controladores. Puede utilizar esos ID con el comando modunload(1M) para descargar los controladores no fiables.
Las placas de memoria o las placas de CPU/memoria que contengan memoria intercalada no pueden desconfigurarse de forma dinámica.
Para determinar si la memoria está intercalada, utilice los comandos prtdiag o cfgadm.
Para posibilitar las operaciones de DR en placas de CPU/memoria, defina la propiedad memory-interleave de NVRAM con el valor min.
Para obtener más información sobre la memoria intercalada, consulte "El intercalado de la memoria se define incorrectamente después de una restauración por error grave, ID de error 4156075 " y "DR: No se pude desconfigurar una placa de CPU/memoria que tiene memoria intercalada, ID de error 4210234".
Si aparece el error "cfgadm: Hardware specific failure: connect failed: firmware operation error" durante una secuencia de conexión de DR, extraiga la placa del sistema lo antes posible. Ha fallado la prueba de autocomprobación de la placa y su extracción evita posibles errores de reconfiguración en el siguiente arranque del sistema.
Si desea volver a intentar la operación que ha fallado, debe retirar primero la placa y volverla a instalar, ya que su estado no admite ninguna otra operación.
Según se indica en el manual Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems, el software de supervisión y administración de sistemas Sun Enterprise SyMONTM soporta la reconfiguración dinámica, pero la guía remite a una referencia incorrecta. La correcta es Suplemento de Sun Enterprise SyMON(TM) 2.0.1 para servidores Sun Enterprise(TM) de gama media, número de referencia 806-1159.
Para obtener la última información sobre errores y modificaciones de software, consulte: http://sunsolve5.sun.com/sunsolve/Enterprise-dr.
Categoría: RFE
La prueba de memoria debería indicar con cierta frecuencia que sigue en ejecución. Durante pruebas largas, el usuario no puede determinar con facilidad si el sistema se está bloqueando.
Solución alternativa: Supervise la evolución del sistema en otro shell, u otra ventana, utilizando vmstat(1M), ps(1) u otros comandos de shell similares.
Categoría: Error
El intercalado de la memoria queda en un estado incorrecto cuando un servidor Sun Enterprise X500 detecta una restauración por error grave. La posteriores operaciones de DR fallan. El problema sólo se produce en sistemas donde el intercalado de memoria está definido con min.
Soluciones alternativas: Existen las dos posibilidades siguientes.
Para eliminar el problema una vez que se ha producido, restaure manualmente el sistema desde el indicador OK.
Para evitar que se produzca el problema, defina la propiedad memory-interleave de NVRAM con el valor max. Esto hace que la memoria se intercale cada vez que se arranca el sistema, pero puede que encuentre esta opción inaceptable, ya que la placa de memoria que contenga la memoria intercalada no puede desconfigurarse dinámicamente. Consulte "DR: No se pude desconfigurar una placa de CPU/memoria que tiene memoria intercalada, ID de error 4210234".
Categoría: Error
vmstat muestra un número extraordinariamente alto de interrupciones después de configurar las CPU. Con vmstat ejecutándose en el fondo, el campo de interrupciones se vuelve anormalmente grande (pero esto no indica que exista un problema). En la última fila del ejemplo siguiente, la columna de interrupciones (in) tiene un valor de 4294967216:
# procs memory page disk faults cpu r b w swap free re mf pi po fr de sr s6 s9 s1 -- in sy cs us sy id 0 0 0 437208 146424 0 1 4 0 0 0 0 0 1 0 0 50 65 79 0 1 99 0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 198 137 214 0 3 97 0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 286 101 200 0 3 97 0 0 0 413864 111072 0 11 0 0 0 0 0 0 1 0 0 4294967216 43 68 0 0 100
Solución alternativa: Reiniciar vmstat.
Categoría: Error
Si dos CPU de una misma placa fallan antes de informar a la CPU principal, POST indica que ha fallado una CPU, pero puede que no haga referencia a la segunda.
Solución alternativa: Ninguna.
Categoría: RFE
No se puede desconfigurar una placa de CPU/memoria que contiene memoria intercalada.
Para desconfigurar y posteriormente desconectar una placa de CPU con memoria o una placa con memoria únicamente, es necesario desconfigurar primero la memoria. Pero si la memoria de la placa está intercalada con memoria de otras placas, entonces no puede desconfigurarse de forma dinámica.
El intercalado de memoria puede verse mediante los comandos prtdiag o cfgadm.
Solución alternativa: Apague el sistema antes de operar con la placa y vuelva a arrancarlo una vez hecho. Para que DR puede efectuar operaciones en la placa de CPU/memoria en el futuro, defina la propiedad memory-interleave de NVRAM con el valor min. Consulte también "El intercalado de la memoria se define incorrectamente después de una restauración por error grave, ID de error 4156075 ", si desea ver más información relacionada con la memoria intercalada.
Categoría: RFE
Para desconfigurar y posteriormente desconectar una placa de CPU con memoria o una placa únicamente de memoria, es necesario desconfigurar primero la memoria. Sin embargo, determinada memoria no puede reasignarse; se considera permanente.
La memoria permanente de una placa está marcada como "permanent" en la pantalla de estado de cfgadm:
# cfgadm -s cols=ap_id:type:info Ap_Id Type Information ac0:bank0 memory slot3 64Mb base 0x0 permanent ac0:bank1 memory slot3 empty ac1:bank0 memory slot5 empty ac1:bank1 memory slot5 64Mb base 0x40000000
En este ejemplo, la placa de la ranura 3 (slot3) tiene memoria permanente y, por tanto, no puede extraerse.
Solución alternativa: Apague el sistema antes de operar con la placa y vuelva a arrancarlo una vez hecho.
Categoría: Error
Si se ejecuta un proceso cfgadm en una placa, fallará cualquier intento de desconectar otra placa simultáneamente.
Una operación de desconexión mediante cfgadm falla si hay otro proceso cfgadm ejecutándose al mismo tiempo en otra placa. El mensaje que aparece es:
cfgadm: Hardware specific failure: disconnect failed: nexus error during detach: dirección
Solución alternativa: No lleve a cabo más de una operación con cfgadm de forma simultánea. Si se ejecuta cfgadm en una placa, espere a que finalice el proceso antes de iniciar otra operación de desconexión con cfgadm en otra placa.
Categoría: error
Después de ejecutar operaciones de DR, el intento de apagar el sistema con el comando init 5 puede provocar una restauración por error grave.
Solución alternativa: restaure el sistema, luego apáguelo con el comando power-off desde el indicador ok.
Cuando un servidor está configurado como servidor de arranque de clientes x86 basados en Solaris 2.5.1, tiene en ejecución varios trabajos rpld con independencia de que se estén utilizando estos dispositivos. Estas referencias activas impiden a DR desconectar dichos dispositivos.
Solución alternativa: para realizar una operación de desconexión con DR: