Go to main content
Guía de administración para Oracle® VM Server for SPARC 3.4

Salir de la Vista de impresión

Actualización: Agosto de 2016
 
 

Recuperación de dominios tras detectar recursos defectuosos o faltantes

Si un servidor SPARC T5, un servidor serie SPARC T7, un servidor SPARC M5, un servidor SPARC M6, un servidor serie SPARC M7, un servidor serie SPARC S7 o un Fujitsu M10 Server detecta un recurso defectuoso o faltante al encenderse, el Logical Domains Manager intenta recuperar los dominios configurados mediante el uso del resto de los recursos disponibles. Durante la recuperación, se dice que el sistema (o el dominio físico en servidores serie SPARC M5, SPARC M6 y SPARC M7) está en el modo de recuperación. El modo de recuperación está activado por defecto. Consulte Control del modo de recuperación.

    Al encenderse, el firmware del sistema vuelve a la configuración predeterminada de fábrica si la última configuración de encendido seleccionada no se puede iniciar en cualquiera de las siguientes circunstancias:

  • La topología de E/S de cada conmutador PCIe de la configuración no coincide con la topología de E/S de la última configuración de encendido seleccionada.

  • Los recursos de CPU o de memoria de la última configuración de encendido seleccionada ya no están presentes en el sistema

Si está activado el modo de recuperación, Logical Domains Manager recupera todos los dominios enlazados y activos de la última configuración de encendido seleccionada. La configuración que se ejecuta como resultado se denomina configuración degradada. La configuración degradada se guarda en el SP y permanece como la configuración activa hasta que se guarde una nueva configuración de SP o el ciclo de energía del dominio físico vuelva a iniciarse.


Notas - El dominio físico no requiere que un ciclo de energía active la configuración degradada después de la recuperación, dado que la configuración ya está en ejecución.

Si el ciclo de energía del dominio físico se vuelve a iniciar, el firmware del sistema primero intenta iniciar la última configuración original de encendido. De esta manera, si el hardware defectuoso o faltante se reemplaza, mientras tanto, el sistema puede iniciar la configuración original normal. Si la última configuración de encendido seleccionada no se puede iniciar, el firmware intenta iniciar la configuración degradada asociada, si existe. Si la configuración degradada no se puede iniciar o no existe, se inicia la configuración predeterminada de fábrica y se invoca el modo de recuperación.

    La operación de recuperación funciona en el siguiente orden:

  • Dominio de control. Logical Domains Manager recupera el dominio de control mediante la restauración de la configuración de CPU, memoria y E/S, así como de sus servicios de E/S virtual.

    Si la cantidad de memoria o CPU necesaria para todos los dominios recuperables es mayor que el resto de las cantidades disponibles, la cantidad de CPU, núcleos o memoria se reduce en relación con el tamaño de los otros dominios. Por ejemplo, en un sistema de cuatro dominios donde cada dominio tiene asignado el 25% de las CPU y la memoria, la configuración degradada que se obtiene como resultado aún asigna el 25% de las CPU y la memoria a cada dominio. Si el dominio primary tenía originalmente hasta dos núcleos (16 CPU virtuales) y ocho GB de memoria, el tamaño del dominio de control no se reduce.

    Los complejos raíz y los dispositivos PCIe que están asignados a otros dominios se eliminan del dominio de control. Las funciones virtuales de los complejos raíz que pertenecen al dominio de control se vuelven a crear. Los complejos raíz, los dispositivos PCIe, las funciones físicas o las funciones virtuales que se asignan al dominio de control se marcan como evacuados. A continuación, Logical Domains Manager reinicia el dominio de control para activar los cambios.

  • Dominios raíz. Después de reiniciar el dominio de control, Logical Domains Manager recupera los dominios raíz. La cantidad de CPU y de memoria se reduce en relación con los otros dominios recuperables, si es necesario. Si un complejo raíz ya no está presente físicamente en el sistema, se marca como evacuado. Este complejo raíz no está configurado en el dominio durante la operación de recuperación. Un dominio raíz se recupera siempre que al menos uno de los complejos raíz asignados al dominio raíz esté disponible. Si no hay ningún complejo raíz disponible, el dominio raíz no se recupera. Logical Domains Manager inicia el dominio raíz y vuelve a crear las funciones virtuales sobre las funciones físicas que pertenecen al dominio raíz. Además, extrae las ranuras PCIe que el dominio raíz presta. Las ranuras PCIe, las funciones físicas y las funciones virtuales faltantes se marcan como evacuadas. Los servicios de E/S virtual que proporciona el dominio se vuelven a crear, si es posible.

  • Dominios de E/S. Logical Domains Manager recupera todos los dominios de E/S. Las ranuras PCIe y las funciones virtuales que faltan en el sistema se marcan como evacuadas. Si no hay ningún dispositivo de E/S presente, el dominio no se recupera y sus recursos de memoria y CPU están disponibles para que otros dominios los usen. Los servicios de E/S virtual que proporciona el dominio se vuelven a crear, si es posible.

  • Dominios invitados. Un dominio invitado se recupera solo si al menos uno de los dominios de servicio que se utiliza como dominio se ha recuperado. Si el dominio invitado no se puede recuperar, sus recursos de CPU y de memoria están disponibles para que otros dominios invitados los usen.

Cuando sea posible, la misma cantidad de CPU y de memoria se asigna a un dominio según lo especificado por la configuración original. Si esa cantidad de CPU o de memoria no está disponible, estos recursos se reducen de forma proporcional para consumir el resto de los recursos disponibles. Si se asignaron recursos con nombre a un dominio y, más tarde, este se recupera en el modo de recuperación, no se realiza ningún intento de volver a asignar esos recursos con nombre al dominio.


Notas - Cuando un sistema está en modo de recuperación, solo puede ejecutar comandos ldm list-*. Se desactivan todos los demás comandos ldm hasta que termine la operación de recuperación.

Logical Domains Manager solo intenta recuperar los dominios enlazados y activos. La configuración de recursos existente de cualquier dominio no enlazado se copia en la nueva configuración tal como está.

Durante una operación de recuperación, es posible que haya menos recursos disponibles que en la configuración iniciada anteriormente. Como resultado, es posible que Logical Domains Manager solo pueda recuperar algunos de los dominios configurados previamente. También es posible que un dominio recuperado no incluya todos los recursos de su configuración original. Por ejemplo, un dominio enlazado recuperado puede tener menos recursos de E/S que en su configuración anterior. Es posible que un dominio no se recupere si sus dispositivos de E/S ya no están presentes o si su principal dominio de servicio no se pudo recuperar.

El modo de recuperación registra sus pasos en el registro SMF de Logical Domains Manager /var/svc/log/ldoms-ldmd:default.log. Se escribe un mensaje en la consola del sistema cuando Logical Domains Manager inicia una recuperación, reinicia el dominio de control y cuando termina la recuperación.


Caution

Precaución  - No se garantiza que un dominio recuperado sea completamente utilizable. Es posible que el dominio no incluya un recurso que es esencial para ejecutar una instancia del sistema operativo o una aplicación. Por ejemplo, un dominio recuperado puede tener solo un recurso de red y ningún recurso de disco. O bien, puede faltarle un sistema de archivos que es necesario para ejecutar una aplicación. El uso de la función de rutas múltiples de E/S para un dominio reduce el impacto de los recursos de E/S faltantes.


Requisitos de hardware y software de modo de recuperación

  • Requisitos de hardware: la función de modo de recuperación se admite en el servidor SPARC T5, en el servidor serie SPARC T7, en el servidor SPARC M5, en el servidor SPARC M6, en el servidor serie SPARC M7, en el servidor serie SPARC S7 y en el Fujitsu M10 Server.

  • Requisitos de firmware: como mínimo, la versión 9.1.0.a del firmware del sistema para el servidor SPARC T5, el servidor SPARC M5 y el servidor SPARC M6. Al menos la versión 9.4.3 del firmware del sistema para el servidor serie SPARC T7 y el servidor serie SPARC M7. Cualquier versión publicada del firmware del sistema para el servidor serie SPARC S7. Al menos la versión XCP2230 del firmware del sistema para el Fujitsu M10 Server.

  • Requisitos de software: los dominios raíz no primary y prestan ranuras PCIe deben ejecutar, como mínimo, el sistema operativo Oracle Solaris 10 1/13 o el sistema operativo Oracle Solaris 11.2.

Configuración degradada

Cada dominio físico puede tener solo una configuración degradada guardada en el SP. Si ya existe una configuración degradada, se sustituye por la configuración degradada recién creada.

No puede interactuar directamente con las configuraciones degradadas. Si es necesario, el firmware del sistema inicia la versión degradada de la siguiente configuración de encendido de manera transparente. Esta transparencia permite al sistema iniciar la configuración original después de un ciclo de energía cuando los recursos faltantes vuelven a aparecer. Cuando la configuración activa es una configuración degradada, se marca como [degraded] en la salida de ldm list-spconfig.

La funcionalidad de guardado automático está desactivada mientras la configuración activa es una configuración degradada. Si guarda una nueva configuración en el SP cuando hay configuración degradada activa, la nueva configuración se considera una configuración normal no degradada.


Notas - Un recurso faltante previo que vuelve a aparecer en un ciclo de energía posterior no tiene ningún efecto en el contenido de una configuración normal. Sin embargo, si posteriormente se selecciona la configuración que inició el modo de recuperación, el SP inicia la configuración original, no degradada, ya que todo su hardware ahora está disponible.

Control del modo de recuperación

La propiedad de la SMF ldmd/recovery_mode controla el comportamiento del modo de recuperación. El modo de recuperación está activado por defecto.

Cuando la propiedad ldmd/recovery_mode no está presente o se establece en auto, se activa el modo de recuperación.

Cuando la propiedad ldmd/recovery_mode no está presente o se establece en never, Logical Domains Manager cierra el modo de recuperación sin realizar ninguna acción y el dominio físico ejecuta la configuración por defecto de fábrica.


Notas - Si el firmware del sistema solicita el modo de recuperación cuando no está activado, ejecute los siguientes comandos para activar el modo de recuperación después de que se realiza la solicitud:
primary# svccfg -s ldmd setprop ldmd/recovery_mode = astring: auto
primary# svcadm refresh ldmd
primary# svcadm restart ldmd

El modo de recuperación se inicia inmediatamente en este caso solo si no se han realizado cambios en el sistema, es decir, si aún se usa la configuración predeterminada de fábrica.


Además de activar el modo de recuperación, puede especificar un valor de timeout para el inicio de un dominio raíz durante la recuperación. Por defecto, el valor de la propiedad ldmd/recovery_mode_boot_timeout es de 30 minutos. Los valores válidos comienzan a partir de 5 minutos.