Suplemento de notas sobre la versión de Solaris 7 5/99 para hardware de Sun

Capítulo 5 Cuestiones pendientes relativas a los sistemas Sun Enterprise 6x00, 5x00, 4x00 y 3x00

AP en servidores Sun Enterprise

Esta sección contiene notas sobre la versión relativas a Alternate Pathing (AP) 2.2 en todos los servidores Sun Enterprise excepto el Sun Enterprise 10000. Consulte "AP en el Sun Enterprise 10000" si precisa información sobre el servidor Enterprise 10000.


Nota -

AP 2.2 es la primera versión de AP que soporta Solaris 7 5/99.


AP permite definir y controlar rutas físicas alternativas para acceder a los dispositivos periféricos, lo que proporciona mayor disponibilidad y capacidad de recuperación frente a fallos del servidor. Si una ruta física a un dispositivo queda fuera de servicio, puede utilizarse la ruta alternativa. Para obtener más información, consulte la Sun Enterprise Server Alternate Pathing User's Guide en el AnswerBook2(TM) Solaris 7 5/99 on Sun Hardware Collection.


Nota -

En el momento de la edición de este documento, AP 2.2 Beta no es compatible con ninguna versión de Sun Enterprise Volume Manager(TM) (SEVM).


Cuestiones relativas a la instalación

Si va a actualizar el entorno operativo Solaris 2.6 al entorno Solaris 7 5/99 y tiene instalado el software de AP 2.0 o 2.1 y Solstice(TM) DiskSuite(TM) 4.0 o 4.1 (SDS) en el sistema, necesitará actualizar a AP 2.2 y SDS 4.2. Esta sección contiene una descripción general de todo el proceso, que requiere el uso de diversas secciones contenidas en distintas publicaciones. Deberá asegurarse, por tanto, de que dispone de los siguientes documentos antes de proceder a la actualización:


Precaución - Precaución -

Es preciso seguir el orden aquí indicado para poder realizar la actualización correctamente.


En general, deberá llevar a cabo las tareas siguientes:

También deberá efectuar algunas tareas específicas:

  1. Leer "Actualización de AP" en el capítulo "Alternate Pathing 2.2 en el servidor Sun Enterprise 10000" de la Solaris 7 5/99: Guía de plataformas de hardware de Sun.

  2. Confirmar los metadispositivos AP que queden por confirmar (lea el Paso 1 de "Para actualizar a AP 2.2" en el capítulo "Alternate Pathing 2.2 en el servidor Sun Enterprise 10000" de la Solaris 7 5/99: Guía de plataformas de hardware de Sun).

  3. Desconfigurar SDS (lea los pasos del 1 al 8 del procedimiento "How to Convert to DiskSuite 4.2 on SPARC Systems Running DiskSuite 4.0 or 4.1" en Solstice DiskSuite 4.2 Installation and Product Notes).


    Precaución - Precaución -

    No instale Solaris 7 5/99 en este momento.


  4. Eliminar la configuración existente de AP (lea el Paso 3 en "Para actualizar a AP 2.2" en la Solaris 7 5/99: Guía de plataformas de hardware de Sun).

  5. Actualizar a Solaris 7 5/99 (lea el Paso 4 de la sección "Para actualizar a AP 2.2" de la Solaris 7 5/99: Guía de plataformas de hardware de Sun).

  6. Actualizar a AP 2.2 (lea el Paso 5 de "Para actualizar a AP 2.2" en la Solaris 7 5/99: Guía de plataformas de hardware de Sun).

  7. Instale SDS 4.2 y restáurelo (lea el Paso 6 de "Para actualizar a AP 2.2 y SDS4.2" en la Solaris 7 5/99: Guía de plataformas de hardware de Sun y los pasos del 10 al 16 de "How to Convert to DiskSuite 4.2 on SPARC Systems Running DiskSuite 4.0 or 4.1" en el Capítulo 1 de Solstice DiskSuite 4.2 Installation and Product Notes).

Cuestiones generales

Esta sección contiene algunas consideraciones generales relacionadas con la instalación de AP en servidores Sun Enterprise. Recomendamos su lectura antes de proceder a instalar o configurar AP.

Dispositivos admitidos

El software AP en servidores Sun Enterprise admite el uso de los dispositivos siguientes:

La tabla siguiente contiene los dispositivos de red admitidos en cada versión:

Tabla 5-1 Dispositivos de red admitidos

 

AP 2.0 

AP 2.1 

AP 2.2 

Solaris 2.5.1 

hme, le, nf, bf, hi, qe, qfe

N/A 

N/A 

Solaris 2.6 (5/98) 

N/A 

ge, hme, le, nf, qe, qfe, vge

N/A 

Solaris 7 5/99 

N/A 

N/A 

ge,hme, le, nf, qe, qfe

Dispositivos SunFDDI y GigabitEthernet

Se han llevado a cabo pruebas de validación de AP 2.2 con SunFDDI (revisión 6.0) y GigabitEthernet (revisión 2.0). Si instala uno de estos dispositivos, utilice el número de revisión probado, a menos que exista una revisión posterior. Deberá instalar también todas las modificaciones de software disponibles para estos dispositivos. Consulte la página http://www.sunsolve.sun.com para obtener más información sobre estas modificaciones.

Sun StorEdge A3000

Sun StorEdge A3000 incluye funciones de recuperación frente a fallos similares a las proporcionadas por AP, por lo cual, AP no puede utilizarse con este producto. Consulte la documentación de Sun StorEdge A3000 para obtener más información sobre sus funciones de recuperación frente a fallos.

Sun StorEdge A5000

AP incluye soporte para Sun StorEdge A5000 en esta versión.

Sun StorEdge A7000

AP 2.2 no incluye soporte para Sun StorEdge A7000 en esta versión.

Compatibilidad del software

Las listas siguientes incluyen las posibles combinaciones del software de AP y de Solaris que pueden instalarse en un servidor Sun Enterprise.

Errores corregidos

Esta sección contiene una descripción de los errores más importantes que se han corregido desde la versión 2.1 de AP (Solaris 2.6 5/98) y el ID de error asignado por Sun. La lista no incluye todos los errores corregidos.

4126743 - La recuperación automática de AP tras el fallo de un disco se bloquea cuando se producen fallos simultáneos en varios grupos de rutas (este error se corrigió con el ID de error 4136249).

4126897 - El dominio indica un error grave cuando no existe ninguna base de datos de AP ni entradas de metadispositivo en /etc/vfstab.

4136249 - Las E/S a volúmenes RAID de SEVM se bloquean después de una recuperación automática de AP tras un fallo.

4141438 - La interfaz mhme se bloquea si se hace un uso intensivo de la red.

4143514 - FDDI con AP se bloquea si se hace un uso intensivo de la red.

4147674 - AP provoca el bloqueo de ifconfig con mutex.

4153152 - apconfig funciona como un usuario normal.

4161396 - AP 2.x necesita tener capacidad para funcionar con GEM.

4163270 - netstat no muestra recuentos de las metainterfaces de red de ap.

4166620 - La ejecución de snoop con una metainterfaz de red de AP detiene el snooping después de conmutar.

4170818 - Si se ejecuta la macro $<callouts nadb o el comando "callout ts" de fm2, se verán miles de tiempos de espera excedidos de qenable en la tabla de llamadas de tiempo compartido.

4180055 - El acceso a un metadisco de AP con una ruta alternativa activa que ha fallado provoca un error grave.

4180702 - Los mensajes de swap.c no están internacionalizados.

4183581 - apboot disco provoca el volcado del núcleo central cuando disco coincide con el disco de arranque actual.

4185154 - La prueba de funcionamiento de AP con GigabitEthernet bajo presión se bloquea.

4188418 - Es posible que Veritas [SEVM] no detecte un error del disco duro.

4195441 - ap_daemon de AP2.0 no se comunica con AP2.2.

4228731 - Las interfaces de red que no existen no se marcan como desconectadas después de rearrancar.

Reconfiguración dinámica en los sistemas Sun Enterprise 6x00, 5x00, 4x00 y 3x00

Estas notas proporcionan la información más recientes sobre la función de Reconfiguración dinámica (DR) en los sistemas Sun EnterpriseTM 6x00, 5x00, 4x00 y 3x00 que ejecutan la versión 5/99 de la línea de productos SolarisTM 7 de Sun Microsystems. Para obtener más información sobre la reconfiguración dinámica en servidores Sun Enterprise, consulte Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems.

La versión 5/99 incluye soporte para placas de CPU/memoria en sistemas Sun Enterprise 6x00, 5x00, 4x00 y 3x00.

Hardware admitido

Antes de empezar, compruebe si el sistema soporta la reconfiguración dinámica. Si observa el siguiente mensaje en la consola o en los registros de la consola, significa que el modelo del hardware es antiguo y no apto para la reconfiguración dinámica.


Hot Plug not supported in this system 

Las placas de E/S admitidas figuran en la sección "Solaris 7 5/99" de la página Web:

http://sunsolve5.sun.com/sunsolve/Enterprise-dr/

En el presente no se admiten las placas de E/S de tipo 2 (gráficos), tipo 3 (PCI) y tipo 5 (gráficos y SOC+).

Notas sobre el firmware

Matrices de discos o unidades internas FC-AL

En las matrices de discos Sun StorEdgeTM A5000 o los discos internos FC-AL del sistema Sun Enterprise 3500, la versión del firmware debe ser ST19171FC 0413 o posterior. Para obtener más información, consulte la sección "Solaris 7 5/99" de la página Web:

http://sunsolve5.sun.com/sunsolve/Enterprise-dr/

Actualizaciones de la PROM para CPU y placas de E/S

Los usuarios de Solaris 7 5/99 que deseen utilizar la reconfiguración dinámica deben utilizar la versión 3.2.22, o una versión posterior, para la PROM de la CPU (ID de modificación del firmware 103346-22). Este firmware se encuentra disponible en la Web. Consulte "Forma de obtener el firmware".

Las versiones antiguas de la PROM de la CPU pueden mostrar el siguiente mensaje durante el arranque:


Firmware does not support Dynamic Reconfiguration


Precaución - Precaución -

La PROM 3.2.16 de la CPU y versiones anteriores no muestran este mensaje, aunque no admiten la reconfiguración dinámica de las placas de CPU/memoria.


  1. Para ver la revisión utilizada de la PROM, introduzca .version y banner en el indicador ok. La pantalla será similar a la siguiente:

    ok .version
    Slot 0 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31
    Slot 1 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31
    Slot 2 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 3 - I/O Type 4 FCODE 1.8.22 1999/xx/xx 19:27 iPOST 3.4.22 1999/xx/xx 19:31
    Slot 4 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 5 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 6 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 7 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 9 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 11 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 12 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 14 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    ok banner
     16-slot Sun Enterprise E6500
     OpenBoot 3.2.22, 4672 MB memory installed, Serial #xxxxxxxx.
     Ethernet address 8:0:xx:xx:xx:xx, Host ID: xxxxxxxx.

Forma de obtener el firmware

Si precisa información para actualizar el firmware, consulte la sección "Solaris 7 5/99" en la página Web:

http://sunsolve5.sun.com/sunsolve/Enterprise-dr/

En esta página, encontrará información sobre la forma de:

Si no puede acceder a la Web, acuda a un proveedor de servicios de Sun para solicitar ayuda.

Notas sobre el software

Activación de la reconfiguración dinámica

Es necesario definir dos variables del archivo /etc/system para activar la reconfiguración dinámica, además de otra variable para habilitar la desinstalación de las placas de CPU/memoria.

  1. Entre en el sistema como usuario root.

  2. Para activar la reconfiguración dinámica, abra el archivo /etc/system y agregue las líneas siguientes:


    set pln:pln_enable_detach_suspend=1
    set soc:soc_enable_detach_suspend=1
    

  3. Para activar la supresión de una placa de CPU/memoria, agregue esta línea al archivo /etc/system:


    set kernel_cage_enable=1
    

    Al definir esta variable, se activa la operación de desconfiguración de la memoria.

  4. Rearranque el sistema para que los cambios tengan efecto.

Prueba de interrupción/reanudación

En sistemas de grandes dimensiones, el comando quiesce-test (cfgadm -x quiesce-test sysctrl0:slotnúmero) puede tardar cerca de un minuto en ejecutarse. Durante este tiempo, no se muestran mensajes si cfgadm no encuentra controladores incompatibles. Este comportamiento es normal.

Lista de placas desactivadas

Si una placa se encuentra en la lista de placas desactivadas, el intento de conectar esa placa puede generar un mensaje de error:


# cfgadm -c connect sysctrl0:slotnúmero
cfgadm: Hardware specific failure: connect failed: board is disabled: must override with [-f][-o enable-at-boot]

  1. Para eliminar la condición de desactivación, utilice la opción -f (force) o la opción de activación (-o enable-at-boot) con el comando cfgadm:


    # cfgadm -f -c connect sysctrl0:slotnúmero
    


    # cfgadm -o enable-at-boot -c connect sysctrl0:slotnúmero
    

  1. Para suprimir todas las placas de la lista de placas desactivadas, no defina ningún valor para la variable disabled-board-list con el comando del sistema:


    # eeprom disabled-board-list=
    

  1. Si se encuentra en el indicador de OpenBootTM, utilice en su lugar este comando de OBP para suprimir todas las placas de la lista de placas desactivadas:


    OK set-default disabled-board-list 
    

    Para obtener más información sobre la configuración de disabled-board-list, consulte la sección "Specific NVRAM Variables" en el manual Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems, número de referencia 805-4454.

Lista de memorias desactivadas

Para obtener información sobre la configuración de la variable disabled-memory-list de OBP, consulte la sección "Specific NVRAM Variables" del manual Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems, número de referencia 805-4454.

Descarga de controladores no fiables para la desconexión

Si es necesario descargar controladores que no son seguros para la desconexión, utilice el comando modinfo(1M) para localizar los ID de módulo de esos controladores. Puede utilizar esos ID con el comando modunload(1M) para descargar los controladores no fiables.

Memoria intercalada

Las placas de memoria o las placas de CPU/memoria que contengan memoria intercalada no pueden desconfigurarse de forma dinámica.

Para determinar si la memoria está intercalada, utilice los comandos prtdiag o cfgadm.

Para posibilitar las operaciones de DR en placas de CPU/memoria, defina la propiedad memory-interleave de NVRAM con el valor min.

Para obtener más información sobre la memoria intercalada, consulte "El intercalado de la memoria se define incorrectamente después de una restauración por error grave, ID de error 4156075 " y "DR: No se pude desconfigurar una placa de CPU/memoria que tiene memoria intercalada, ID de error 4210234".

Fallo de la prueba de autocomprobación durante una secuencia de conexión

Si aparece el error "cfgadm: Hardware specific failure: connect failed: firmware operation error" durante una secuencia de conexión de DR, extraiga la placa del sistema lo antes posible. Ha fallado la prueba de autocomprobación de la placa y su extracción evita posibles errores de reconfiguración en el siguiente arranque del sistema.

Si desea volver a intentar la operación que ha fallado, debe retirar primero la placa y volverla a instalar, ya que su estado no admite ninguna otra operación.

La función de Reconfiguración dinámica en el software de Sun Enterprise SyMON

Según se indica en el manual Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems, el software de supervisión y administración de sistemas Sun Enterprise SyMONTM soporta la reconfiguración dinámica, pero la guía remite a una referencia incorrecta. La correcta es Sun Enterprise SyMON 2.0.1 Supplement for Sun Enterprise Midrange Servers, número de referencia 806-0649.

Errores conocidos

cfgadm -v no funciona correctamente, ID de error 4149371

Categoría: RFE

La prueba de memoria debería indicar con cierta frecuencia que sigue en ejecución. Durante pruebas largas, el usuario no puede determinar con facilidad si el sistema se está bloqueando.

Solución alternativa: Supervise la evolución del sistema en otro shell, u otra ventana, utilizando vmstat(1M), ps(1) u otros comandos de shell similares.

El intercalado de la memoria se define incorrectamente después de una restauración por error grave, ID de error 4156075

Categoría: Error

El intercalado de la memoria queda en un estado incorrecto cuando un servidor Sun Enterprise X500 detecta una restauración por error grave. La posteriores operaciones de DR fallan. El problema sólo se produce en sistemas donde el intercalado de memoria está definido con min.

Soluciones alternativas: Existen las dos posibilidades siguientes:

La salida de vmstat es incorrecta después de configurar los procesadores, ID de error 4159024

Categoría: Error

vmstat muestra un número extraordinariamente alto de interrupciones después de configurar las CPU. Con vmstat ejecutándose en el fondo, el campo de interrupciones se vuelve anormalmente grande (pero esto no indica que exista un problema). En la última fila del ejemplo siguiente, la columna de interrupciones (in) tiene un valor de 4294967216:

# procs memory page disk faults cpu
r b w swap free re mf pi po fr de sr s6 s9 s1 -- in sy cs us sy id
0 0 0 437208 146424 0 1 4 0 0 0 0 0 1 0 0 50 65 79 0 1 99
0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 198 137 214 0 3 97
0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 286 101 200 0 3 97
0 0 0 413864 111072 0 11 0 0 0 0 0 0 1 0 0 4294967216 43 68 0 0 100

Solución alternativa: Reiniciar vmstat.

El estado de la placa del sistema indicado por POST muestra sólo 1 de las dos 2 CPU que fallan, ID de error 4200513

Categoría: Error

Si dos CPU de una misma placa fallan antes de informar a la CPU principal, POST indica que ha fallado una CPU, pero puede que no haga referencia a la segunda.

Solución alternativa: Ninguna.

DR: No se pude desconfigurar una placa de CPU/memoria que tiene memoria intercalada, ID de error 4210234

Categoría: RFE

No se puede desconfigurar una placa de CPU/memoria que contiene memoria intercalada.

Para desconfigurar y posteriormente desconectar una placa de CPU con memoria o una placa con memoria únicamente, es necesario desconfigurar primero la memoria. Pero si la memoria de la placa está intercalada con memoria de otras placas, entonces no puede desconfigurarse de forma dinámica.

El intercalado de memoria puede verse mediante los comandos prtdiag o cfgadm.

Solución alternativa: Apague el sistema antes de operar con la placa y vuelva a arrancarlo una vez hecho. Para que DR puede efectuar operaciones en la placa de CPU/memoria en el futuro, defina la propiedad memory-interleave de NVRAM con el valor min. Consulte también "El intercalado de la memoria se define incorrectamente después de una restauración por error grave, ID de error 4156075 ", si desea ver más información relacionada con la memoria intercalada.

DR: No se puede desconfigurar una placa de CPU/memoria que tiene memoria permanente, ID de error 4210280

Categoría: RFE

Para desconfigurar y posteriormente desconectar una placa de CPU con memoria o una placa únicamente de memoria, es necesario desconfigurar primero la memoria. Sin embargo, determinada memoria no puede reasignarse; se considera permanente.

La memoria permanente de una placa está marcada como "permanent" en la pantalla de estado de cfgadm:


# cfgadm -s cols=ap_id:type:info
Ap_Id Type Information
ac0:bank0 memory slot3 64Mb base 0x0 permanent
ac0:bank1 memory slot3 empty
ac1:bank0 memory slot5 empty
ac1:bank1 memory slot5 64Mb base 0x40000000

En este ejemplo, la placa de la ranura 3 (slot3) tiene memoria permanente y, por tanto, no puede extraerse.

Solución alternativa: Apague el sistema antes de operar con la placa y vuelva a arrancarlo una vez hecho.

La desconexión con cfgadm falla cuando se ejecutan otros comandos cfgadm simultáneamente, ID de error 4220105

Categoría: Error

Si se ejecuta un proceso cfgadm en una placa, fallará cualquier intento de desconectar otra placa simultáneamente.

Una operación de desconexión mediante cfgadm falla si hay otro proceso cfgadm ejecutándose al mismo tiempo en otra placa. El mensaje que aparece es:


cfgadm: Hardware specific failure: disconnect failed: nexus
error during detach: dirección

Solución alternativa: No lleve a cabo más de una operación con cfgadm de forma simultánea. Si se ejecuta cfgadm en una placa, espere a que finalice el proceso antes de iniciar otra operación de desconexión con cfgadm en otra placa.

Restauración por error grave con init 5 después de las operaciones de DR, ID de error 4220852

Categoría: error

Después de ejecutar operaciones de DR, el intento de apagar el sistema con el comando init 5 puede provocar una restauración por error grave.

Solución alternativa: restaure el sistema, luego apáguelo con el comando power-off desde el indicador ok.

No pueden desconectarse las placas de servidores Sun Enterprise que contienen tarjetas QFE, ID de error 4231845

Cuando un servidor está configurado como servidor de arranque de clientes x86 basados en Solaris 2.5.1, tiene en ejecución varios trabajos rpld con independencia de que se estén utilizando estos dispositivos. Estas referencias activas impiden a DR desconectar dichos dispositivos.

Solución alternativa: para realizar una operación de desconexión con DR:

  1. Suprima o cambie el nombre del directorio /rplboot.

  2. Detenga los servicios NFS con este comando:


    # sh /etc/init.d/nfs.server stop
    

  3. Lleve a cabo la operación de desconexión de DR.

  4. Reinicie los servicios NFS con este comando:


    # sh /etc/init.d/nfs.server start