Esta sección contiene notas sobre la versión relativas a Alternate Pathing (AP) 2.2 en todos los servidores Sun Enterprise excepto el Sun Enterprise 10000. Consulte "AP en el Sun Enterprise 10000" si precisa información sobre el servidor Enterprise 10000.
AP 2.2 es la primera versión de AP que soporta Solaris 7 5/99.
AP permite definir y controlar rutas físicas alternativas para acceder a los dispositivos periféricos, lo que proporciona mayor disponibilidad y capacidad de recuperación frente a fallos del servidor. Si una ruta física a un dispositivo queda fuera de servicio, puede utilizarse la ruta alternativa. Para obtener más información, consulte la Sun Enterprise Server Alternate Pathing User's Guide en el AnswerBook2(TM) Solaris 7 5/99 on Sun Hardware Collection.
En el momento de la edición de este documento, AP 2.2 Beta no es compatible con ninguna versión de Sun Enterprise Volume Manager(TM) (SEVM).
Si va a actualizar el entorno operativo Solaris 2.6 al entorno Solaris 7 5/99 y tiene instalado el software de AP 2.0 o 2.1 y Solstice(TM) DiskSuite(TM) 4.0 o 4.1 (SDS) en el sistema, necesitará actualizar a AP 2.2 y SDS 4.2. Esta sección contiene una descripción general de todo el proceso, que requiere el uso de diversas secciones contenidas en distintas publicaciones. Deberá asegurarse, por tanto, de que dispone de los siguientes documentos antes de proceder a la actualización:
Suplemento de notas sobre la versión de Solaris 7 5/99 para hardware de Sun (disponible en formato impreso en el kit de soporte de Solaris 7 5/99)
Solaris 7 5/99: Guía de plataformas de hardware de Sun (disponible en formato impreso en el kit de soporte de Solaris 7 5/99 o en formato AnswerBook2 en el Sun Hardware Supplements CD)
Sun Enterprise Server Alternate Pathing User's Guide (disponible en formato AnswerBook2 en el Sun Hardware Supplements CD del kit de soporte de Solaris 7 5/99)
Solstice DiskSuite 4.2 User's Guide (disponible en formato AnswerBook2 a través de http://docs.sun.com o a través del kit de soporte de SDS)
Solstice DiskSuite 4.2 Installation and Product Notes (disponible en formato AnswerBook2 a través de http://docs.sun.com o del kit de soporte de SDS)
Es preciso seguir el orden aquí indicado para poder realizar la actualización correctamente.
En general, deberá llevar a cabo las tareas siguientes:
Desconfigurar SDS 4.0 o 4.1.
Desinstalar AP 2.0 o 2.1.
Actualizar a Solaris 7 5/99.
Instalar AP 2.2.
Instalar y reconfigurar SDS 4.2.
También deberá efectuar algunas tareas específicas:
Leer "Actualización de AP" en el capítulo "Alternate Pathing 2.2 en el servidor Sun Enterprise 10000" de la Solaris 7 5/99: Guía de plataformas de hardware de Sun.
Confirmar los metadispositivos AP que queden por confirmar (lea el Paso 1 de "Para actualizar a AP 2.2" en el capítulo "Alternate Pathing 2.2 en el servidor Sun Enterprise 10000" de la Solaris 7 5/99: Guía de plataformas de hardware de Sun).
Desconfigurar SDS (lea los pasos del 1 al 8 del procedimiento "How to Convert to DiskSuite 4.2 on SPARC Systems Running DiskSuite 4.0 or 4.1" en Solstice DiskSuite 4.2 Installation and Product Notes).
No instale Solaris 7 5/99 en este momento.
Eliminar la configuración existente de AP (lea el Paso 3 en "Para actualizar a AP 2.2" en la Solaris 7 5/99: Guía de plataformas de hardware de Sun).
Actualizar a Solaris 7 5/99 (lea el Paso 4 de la sección "Para actualizar a AP 2.2" de la Solaris 7 5/99: Guía de plataformas de hardware de Sun).
Actualizar a AP 2.2 (lea el Paso 5 de "Para actualizar a AP 2.2" en la Solaris 7 5/99: Guía de plataformas de hardware de Sun).
Instale SDS 4.2 y restáurelo (lea el Paso 6 de "Para actualizar a AP 2.2 y SDS4.2" en la Solaris 7 5/99: Guía de plataformas de hardware de Sun y los pasos del 10 al 16 de "How to Convert to DiskSuite 4.2 on SPARC Systems Running DiskSuite 4.0 or 4.1" en el Capítulo 1 de Solstice DiskSuite 4.2 Installation and Product Notes).
Esta sección contiene algunas consideraciones generales relacionadas con la instalación de AP en servidores Sun Enterprise. Recomendamos su lectura antes de proceder a instalar o configurar AP.
El software AP en servidores Sun Enterprise admite el uso de los dispositivos siguientes:
AP reconoce las matrices SPARCstorage(TM) utilizando los puertos pln, soc y ssd.
AP reconoce la Sun(TM) StorEdge(TM) A5000 utilizando los puertos sf, soc y ssd.
SunFastEthernet(TM) 2.0 (hme)
SunFDDI(TM) 5.0 (nf) SAS (Single-Attach Station) y DAS (Dual-Attach Station)
SCSI-2/Buffered Ethernet FSBE/S y DSBE/S (le)
Quad Ethernet (qe)
Sun(TM) Quad FastEthernet(TM) (qfe)
Sun GigabitEthernet 2.0 (ge)
La tabla siguiente contiene los dispositivos de red admitidos en cada versión:
Tabla 5-1 Dispositivos de red admitidos
|
AP 2.0 |
AP 2.1 |
AP 2.2 |
---|---|---|---|
Solaris 2.5.1 |
hme, le, nf, bf, hi, qe, qfe |
N/A |
N/A |
Solaris 2.6 (5/98) |
N/A |
ge, hme, le, nf, qe, qfe, vge |
N/A |
Solaris 7 5/99 |
N/A |
N/A |
ge,hme, le, nf, qe, qfe |
Se han llevado a cabo pruebas de validación de AP 2.2 con SunFDDI (revisión 6.0) y GigabitEthernet (revisión 2.0). Si instala uno de estos dispositivos, utilice el número de revisión probado, a menos que exista una revisión posterior. Deberá instalar también todas las modificaciones de software disponibles para estos dispositivos. Consulte la página http://www.sunsolve.sun.com para obtener más información sobre estas modificaciones.
Sun StorEdge A3000 incluye funciones de recuperación frente a fallos similares a las proporcionadas por AP, por lo cual, AP no puede utilizarse con este producto. Consulte la documentación de Sun StorEdge A3000 para obtener más información sobre sus funciones de recuperación frente a fallos.
AP incluye soporte para Sun StorEdge A5000 en esta versión.
AP 2.2 no incluye soporte para Sun StorEdge A7000 en esta versión.
Las listas siguientes incluyen las posibles combinaciones del software de AP y de Solaris que pueden instalarse en un servidor Sun Enterprise.
Solaris 2.6 5/98 con AP 2.1 y DR
Solaris 7 con AP 2.2 y DR
Solaris 7 5/99 con AP 2.2 y DR
Esta sección contiene una descripción de los errores más importantes que se han corregido desde la versión 2.1 de AP (Solaris 2.6 5/98) y el ID de error asignado por Sun. La lista no incluye todos los errores corregidos.
4126743 - La recuperación automática de AP tras el fallo de un disco se bloquea cuando se producen fallos simultáneos en varios grupos de rutas (este error se corrigió con el ID de error 4136249).
4126897 - El dominio indica un error grave cuando no existe ninguna base de datos de AP ni entradas de metadispositivo en /etc/vfstab.
4136249 - Las E/S a volúmenes RAID de SEVM se bloquean después de una recuperación automática de AP tras un fallo.
4141438 - La interfaz mhme se bloquea si se hace un uso intensivo de la red.
4143514 - FDDI con AP se bloquea si se hace un uso intensivo de la red.
4147674 - AP provoca el bloqueo de ifconfig con mutex.
4153152 - apconfig funciona como un usuario normal.
4161396 - AP 2.x necesita tener capacidad para funcionar con GEM.
4163270 - netstat no muestra recuentos de las metainterfaces de red de ap.
4166620 - La ejecución de snoop con una metainterfaz de red de AP detiene el snooping después de conmutar.
4170818 - Si se ejecuta la macro $<callouts nadb o el comando "callout ts" de fm2, se verán miles de tiempos de espera excedidos de qenable en la tabla de llamadas de tiempo compartido.
4180055 - El acceso a un metadisco de AP con una ruta alternativa activa que ha fallado provoca un error grave.
4180702 - Los mensajes de swap.c no están internacionalizados.
4183581 - apboot disco provoca el volcado del núcleo central cuando disco coincide con el disco de arranque actual.
4185154 - La prueba de funcionamiento de AP con GigabitEthernet bajo presión se bloquea.
4188418 - Es posible que Veritas [SEVM] no detecte un error del disco duro.
4195441 - ap_daemon de AP2.0 no se comunica con AP2.2.
4228731 - Las interfaces de red que no existen no se marcan como desconectadas después de rearrancar.
Estas notas proporcionan la información más recientes sobre la función de Reconfiguración dinámica (DR) en los sistemas Sun EnterpriseTM 6x00, 5x00, 4x00 y 3x00 que ejecutan la versión 5/99 de la línea de productos SolarisTM 7 de Sun Microsystems. Para obtener más información sobre la reconfiguración dinámica en servidores Sun Enterprise, consulte Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems.
La versión 5/99 incluye soporte para placas de CPU/memoria en sistemas Sun Enterprise 6x00, 5x00, 4x00 y 3x00.
Antes de empezar, compruebe si el sistema soporta la reconfiguración dinámica. Si observa el siguiente mensaje en la consola o en los registros de la consola, significa que el modelo del hardware es antiguo y no apto para la reconfiguración dinámica.
Hot Plug not supported in this system
Las placas de E/S admitidas figuran en la sección "Solaris 7 5/99" de la página Web:
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
En el presente no se admiten las placas de E/S de tipo 2 (gráficos), tipo 3 (PCI) y tipo 5 (gráficos y SOC+).
En las matrices de discos Sun StorEdgeTM A5000 o los discos internos FC-AL del sistema Sun Enterprise 3500, la versión del firmware debe ser ST19171FC 0413 o posterior. Para obtener más información, consulte la sección "Solaris 7 5/99" de la página Web:
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
Los usuarios de Solaris 7 5/99 que deseen utilizar la reconfiguración dinámica deben utilizar la versión 3.2.22, o una versión posterior, para la PROM de la CPU (ID de modificación del firmware 103346-22). Este firmware se encuentra disponible en la Web. Consulte "Forma de obtener el firmware".
Las versiones antiguas de la PROM de la CPU pueden mostrar el siguiente mensaje durante el arranque:
Firmware does not support Dynamic Reconfiguration
La PROM 3.2.16 de la CPU y versiones anteriores no muestran este mensaje, aunque no admiten la reconfiguración dinámica de las placas de CPU/memoria.
Para ver la revisión utilizada de la PROM, introduzca .version y banner en el indicador ok. La pantalla será similar a la siguiente:
ok .version |
Slot 0 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 1 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 2 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 3 - I/O Type 4 FCODE 1.8.22 1999/xx/xx 19:27 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 4 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 5 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 6 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 7 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 9 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 11 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 12 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 14 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
ok banner |
16-slot Sun Enterprise E6500 |
OpenBoot 3.2.22, 4672 MB memory installed, Serial #xxxxxxxx. |
Ethernet address 8:0:xx:xx:xx:xx, Host ID: xxxxxxxx. |
Si precisa información para actualizar el firmware, consulte la sección "Solaris 7 5/99" en la página Web:
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
En esta página, encontrará información sobre la forma de:
Descargar el firmware de PROM con soporte para DR
Actualizar la PROM
Si no puede acceder a la Web, acuda a un proveedor de servicios de Sun para solicitar ayuda.
Es necesario definir dos variables del archivo /etc/system para activar la reconfiguración dinámica, además de otra variable para habilitar la desinstalación de las placas de CPU/memoria.
Entre en el sistema como usuario root.
Para activar la reconfiguración dinámica, abra el archivo /etc/system y agregue las líneas siguientes:
set pln:pln_enable_detach_suspend=1 set soc:soc_enable_detach_suspend=1
Para activar la supresión de una placa de CPU/memoria, agregue esta línea al archivo /etc/system:
set kernel_cage_enable=1
Al definir esta variable, se activa la operación de desconfiguración de la memoria.
Rearranque el sistema para que los cambios tengan efecto.
En sistemas de grandes dimensiones, el comando quiesce-test (cfgadm -x quiesce-test sysctrl0:slotnúmero) puede tardar cerca de un minuto en ejecutarse. Durante este tiempo, no se muestran mensajes si cfgadm no encuentra controladores incompatibles. Este comportamiento es normal.
Si una placa se encuentra en la lista de placas desactivadas, el intento de conectar esa placa puede generar un mensaje de error:
# cfgadm -c connect sysctrl0:slotnúmero cfgadm: Hardware specific failure: connect failed: board is disabled: must override with [-f][-o enable-at-boot]
Para eliminar la condición de desactivación, utilice la opción -f (force) o la opción de activación (-o enable-at-boot) con el comando cfgadm:
# cfgadm -f -c connect sysctrl0:slotnúmero
# cfgadm -o enable-at-boot -c connect sysctrl0:slotnúmero
Para suprimir todas las placas de la lista de placas desactivadas, no defina ningún valor para la variable disabled-board-list con el comando del sistema:
# eeprom disabled-board-list=
Si se encuentra en el indicador de OpenBootTM, utilice en su lugar este comando de OBP para suprimir todas las placas de la lista de placas desactivadas:
OK set-default disabled-board-list
Para obtener más información sobre la configuración de disabled-board-list, consulte la sección "Specific NVRAM Variables" en el manual Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems, número de referencia 805-4454.
Para obtener información sobre la configuración de la variable disabled-memory-list de OBP, consulte la sección "Specific NVRAM Variables" del manual Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems, número de referencia 805-4454.
Si es necesario descargar controladores que no son seguros para la desconexión, utilice el comando modinfo(1M) para localizar los ID de módulo de esos controladores. Puede utilizar esos ID con el comando modunload(1M) para descargar los controladores no fiables.
Las placas de memoria o las placas de CPU/memoria que contengan memoria intercalada no pueden desconfigurarse de forma dinámica.
Para determinar si la memoria está intercalada, utilice los comandos prtdiag o cfgadm.
Para posibilitar las operaciones de DR en placas de CPU/memoria, defina la propiedad memory-interleave de NVRAM con el valor min.
Para obtener más información sobre la memoria intercalada, consulte "El intercalado de la memoria se define incorrectamente después de una restauración por error grave, ID de error 4156075 " y "DR: No se pude desconfigurar una placa de CPU/memoria que tiene memoria intercalada, ID de error 4210234".
Si aparece el error "cfgadm: Hardware specific failure: connect failed: firmware operation error" durante una secuencia de conexión de DR, extraiga la placa del sistema lo antes posible. Ha fallado la prueba de autocomprobación de la placa y su extracción evita posibles errores de reconfiguración en el siguiente arranque del sistema.
Si desea volver a intentar la operación que ha fallado, debe retirar primero la placa y volverla a instalar, ya que su estado no admite ninguna otra operación.
Según se indica en el manual Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems, el software de supervisión y administración de sistemas Sun Enterprise SyMONTM soporta la reconfiguración dinámica, pero la guía remite a una referencia incorrecta. La correcta es Sun Enterprise SyMON 2.0.1 Supplement for Sun Enterprise Midrange Servers, número de referencia 806-0649.
Categoría: RFE
La prueba de memoria debería indicar con cierta frecuencia que sigue en ejecución. Durante pruebas largas, el usuario no puede determinar con facilidad si el sistema se está bloqueando.
Solución alternativa: Supervise la evolución del sistema en otro shell, u otra ventana, utilizando vmstat(1M), ps(1) u otros comandos de shell similares.
Categoría: Error
El intercalado de la memoria queda en un estado incorrecto cuando un servidor Sun Enterprise X500 detecta una restauración por error grave. La posteriores operaciones de DR fallan. El problema sólo se produce en sistemas donde el intercalado de memoria está definido con min.
Soluciones alternativas: Existen las dos posibilidades siguientes:
Para eliminar el problema una vez que se ha producido, restaure manualmente el sistema desde el indicador OK.
Para evitar que se produzca el problema, defina la propiedad memory-interleave de NVRAM con el valor max. Esto hace que la memoria se intercale cada vez que se arranca el sistema, pero puede que encuentre esta opción inaceptable, ya que la placa de memoria que contenga la memoria intercalada no puede desconfigurarse dinámicamente. Consulte "DR: No se pude desconfigurar una placa de CPU/memoria que tiene memoria intercalada, ID de error 4210234".
Categoría: Error
vmstat muestra un número extraordinariamente alto de interrupciones después de configurar las CPU. Con vmstat ejecutándose en el fondo, el campo de interrupciones se vuelve anormalmente grande (pero esto no indica que exista un problema). En la última fila del ejemplo siguiente, la columna de interrupciones (in) tiene un valor de 4294967216:
# procs memory page disk faults cpu |
r b w swap free re mf pi po fr de sr s6 s9 s1 -- in sy cs us sy id |
0 0 0 437208 146424 0 1 4 0 0 0 0 0 1 0 0 50 65 79 0 1 99 |
0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 198 137 214 0 3 97 |
0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 286 101 200 0 3 97 |
0 0 0 413864 111072 0 11 0 0 0 0 0 0 1 0 0 4294967216 43 68 0 0 100 |
Solución alternativa: Reiniciar vmstat.
Categoría: Error
Si dos CPU de una misma placa fallan antes de informar a la CPU principal, POST indica que ha fallado una CPU, pero puede que no haga referencia a la segunda.
Solución alternativa: Ninguna.
Categoría: RFE
No se puede desconfigurar una placa de CPU/memoria que contiene memoria intercalada.
Para desconfigurar y posteriormente desconectar una placa de CPU con memoria o una placa con memoria únicamente, es necesario desconfigurar primero la memoria. Pero si la memoria de la placa está intercalada con memoria de otras placas, entonces no puede desconfigurarse de forma dinámica.
El intercalado de memoria puede verse mediante los comandos prtdiag o cfgadm.
Solución alternativa: Apague el sistema antes de operar con la placa y vuelva a arrancarlo una vez hecho. Para que DR puede efectuar operaciones en la placa de CPU/memoria en el futuro, defina la propiedad memory-interleave de NVRAM con el valor min. Consulte también "El intercalado de la memoria se define incorrectamente después de una restauración por error grave, ID de error 4156075 ", si desea ver más información relacionada con la memoria intercalada.
Categoría: RFE
Para desconfigurar y posteriormente desconectar una placa de CPU con memoria o una placa únicamente de memoria, es necesario desconfigurar primero la memoria. Sin embargo, determinada memoria no puede reasignarse; se considera permanente.
La memoria permanente de una placa está marcada como "permanent" en la pantalla de estado de cfgadm:
# cfgadm -s cols=ap_id:type:info Ap_Id Type Information ac0:bank0 memory slot3 64Mb base 0x0 permanent ac0:bank1 memory slot3 empty ac1:bank0 memory slot5 empty ac1:bank1 memory slot5 64Mb base 0x40000000
En este ejemplo, la placa de la ranura 3 (slot3) tiene memoria permanente y, por tanto, no puede extraerse.
Solución alternativa: Apague el sistema antes de operar con la placa y vuelva a arrancarlo una vez hecho.
Categoría: Error
Si se ejecuta un proceso cfgadm en una placa, fallará cualquier intento de desconectar otra placa simultáneamente.
Una operación de desconexión mediante cfgadm falla si hay otro proceso cfgadm ejecutándose al mismo tiempo en otra placa. El mensaje que aparece es:
cfgadm: Hardware specific failure: disconnect failed: nexus error during detach: dirección
Solución alternativa: No lleve a cabo más de una operación con cfgadm de forma simultánea. Si se ejecuta cfgadm en una placa, espere a que finalice el proceso antes de iniciar otra operación de desconexión con cfgadm en otra placa.
Categoría: error
Después de ejecutar operaciones de DR, el intento de apagar el sistema con el comando init 5 puede provocar una restauración por error grave.
Solución alternativa: restaure el sistema, luego apáguelo con el comando power-off desde el indicador ok.
Cuando un servidor está configurado como servidor de arranque de clientes x86 basados en Solaris 2.5.1, tiene en ejecución varios trabajos rpld con independencia de que se estén utilizando estos dispositivos. Estas referencias activas impiden a DR desconectar dichos dispositivos.
Solución alternativa: para realizar una operación de desconexión con DR: