Operaciones de mantenimiento de nodos informáticos

Para las operaciones de mantenimiento, incluida la actualización o aplicación de parches de software de Private Cloud Appliance, y cuando se necesita la reparación de hardware, los nodos de cálculo se deben colocar en modo de mantenimiento. Esto requiere la evacuación de las instancias informáticas en ejecución y el bloqueo del nodo de cualquier otra operación del sistema.

Evacuación de un nodo de cálculo

Algunas operaciones de nodo de cálculo solo se pueden realizar si el nodo de cálculo no tiene instancias de cálculo en ejecución. Los administradores pueden migrar todas las instancias en ejecución fuera de un nodo de cálculo, también conocido como evacuación del nodo de cálculo.

Por defecto, si hay suficientes recursos disponibles, las instancias en ejecución se migran en directo a otros nodos de cálculo del mismo dominio de errores.

Importante

Antes de realizar la evacuación de un nodo de cálculo, compruebe cuál será el comportamiento de las instancias que no se pueden migrar en directo a otro nodo de cálculo en el mismo dominio de errores.

En este tema y en Configuración de alta disponibilidad para instancias informáticas, se describe cómo comprobar los valores y cómo se manejan las instancias para diferentes valores.

No se admite la migración en directo entre diferentes tipos de nodos de cálculo. Por ejemplo, no puede migrar instancias informáticas de un servidor de Oracle X10 a un servidor de Oracle X11.

Compruebe si se ha definido una aplicación estricta del dominio de errores.

  • Cuando se desactiva la aplicación estricta del dominio de errores (Strict FD is set to Disabled in the Service Web UI o Strict FD Enabled is false in the Service CLI), las instancias que no se pueden migrar en directo a otro nodo de cálculo del mismo dominio de errores se migran en directo a un dominio de errores diferente si hay suficientes recursos disponibles en ese dominio de errores.

  • Cuando la aplicación estricta del dominio de errores está activada (la opción Restricción de FD está definida en Activado en la interfaz de usuario web de servicio o Strict FD Enabled es true en la CLI de servicio), las instancias que no se pueden migrar en directo a otro nodo de cálculo del mismo dominio de errores no se migran; esas instancias se siguen ejecutando en el nodo de cálculo que desea evacuar.

Active o desactive la aplicación estricta del dominio de errores para definir si las instancias que no pueden migrar en directo a otros nodos de cálculo del mismo dominio de errores se migrarán en directo a un dominio de errores diferente o se seguirán ejecutando en el mismo nodo de cálculo después de intentar evacuar el nodo de cálculo.

Si algunas instancias no se pueden migrar en directo, ya sea porque el dominio de errores actual no puede adaptarse y la aplicación estricta del dominio de errores está activada, o porque la aplicación estricta del dominio de errores está desactivada, pero otros dominios de errores también no pueden adaptarse a las instancias, puede volver a ejecutar la operación de migración con la opción forzada especificada. Cuando se especifica la opción force, el servicio Compute detiene todas las instancias que no se pueden migrar en directo, lo que permite que continúe la evacuación.

Reinicie las instancias paradas. Si el servicio Compute ha parado las instancias (no las ha parado manualmente un administrador) y desea que se restauren automáticamente a la ejecución cuando los recursos estén disponibles, compruebe que la propiedad Recuperación automática del servicio Compute está activada y que la acción de recuperación de disponibilidad de la instancia está definida en RESTORE_INSTANCE. Consulte Visualización y definición de la configuración del servicio informático y Configuración del estado de recuperación para una instancia parada.

El servicio de cálculo puede parar las instancias si se utiliza la opción force cuando un administrador evacúa un nodo de cálculo o en respuesta a una interrupción no planificada del nodo de cálculo. Puede cambiar el valor de Recuperación automática en cualquier momento antes o después de que los recursos estén disponibles después de un mantenimiento administrativo o una interrupción no planificada para reiniciar las instancias detenidas por el servicio Compute. Si la acción de recuperación de disponibilidad de la instancia se define en STOP_INSTANCE, la instancia permanece parada aunque la propiedad Recuperación automática esté activada. Si la acción de recuperación de disponibilidad de la instancia se cambia posteriormente a RESTORE_INSTANCE, una posterior transferencia de recuperación automática reiniciará la instancia.

Devolver instancias reubicadas. Si las instancias se migran en directo a un dominio de errores diferente (desplazado) y desea que se vuelvan al dominio de errores seleccionado (el dominio de errores que se especifica en la configuración de la instancia) cuando los recursos estén disponibles, compruebe que la propiedad Resolución automática del servicio informático esté activada. Consulte Visualización y configuración de Compute Service Configuration y Comandos de configuración de Compute Service. Puede definir la propiedad Auto Resolve en cualquier momento antes o después de que finalice la evacuación del nodo de cálculo para reubicar las instancias desplazadas.

Utilice los siguientes procedimientos para realizar la operación de migración.

Evacuación de nodo de cálculo: antes de empezar
  1. Compruebe los recursos de dominio de errores y nodo de cálculo. Consulte admin-monitor-capacity.htm. Sobre la base de esta información, decida si desea realizar alguna de las siguientes acciones:

    • Termine las instancias que ya no son necesarias.

    • Vuelva a configurar algunas instancias para utilizar menos recursos. Por ejemplo, especifique una unidad diferente.

    • Vuelva a configurar algunas instancias para especificar un dominio de errores diferente.

    • Pare algunas instancias mientras realiza la evacuación del nodo de cálculo.

    • Cierre las instancias no migrables. Consulte el siguiente paso.

    • Especifique la opción forzar en la operación de migración para detener temporalmente cualquier instancia que no se pueda migrar en directo. Consulte la explicación anterior sobre la acción de recuperación de disponibilidad de la instancia y la configuración de recuperación automática.

  2. Si bien es posible especificar la opción force en la operación vmMigrate para detener de forma flexible cualquier instancia que no se pueda migrar en directo, la mejor práctica es cerrar de forma controlada las instancias no migrables antes de la migración para que las cargas de trabajo que se ejecuten en la instancia tengan un buen estado.

    1. Mostrar la lista de instancias que no se pueden migrar.

      Copie el ID de las instancias en ejecución para poder cerrarlas.

      PCA-ADMIN> getNonMigratableInstances
      Data:
        id                           Display Name  Compute Node Id  Domain State
        --                           ------------  ---------------  ------------
        ocid1.instance.unique_ID     instance202   CN_ID            running
        ocid1.instance.unique_ID     kqh027        CN_ID            shut off
    2. Cierre las instancias en ejecución.

      Consulte Parada, inicio y restablecimiento de una instancia.

  3. Desactive el aprovisionamiento en el nodo de cálculo.

    Consulte Desactivación del aprovisionamiento de nodos de cálculo.

Uso de la IU web de servicio
  1. En el menú de navegación, haga clic en Rack Units.

  2. En la tabla Rack Units (Unidades de rack), busque el nombre de host del nodo de cálculo que desea evacuar. Haga clic en el menú Actions (Acciones) de ese host y haga clic en la opción Migrate All Vms (Migrar todas las máquinas virtuales).

    De manera alternativa, en la tabla Rack Units (Unidades de rack), haga clic en el nombre de host del nodo de cálculo que desea evacuar para mostrar la página de detalles de ese nodo de cálculo. Haga clic en el menú Controls (Controles) y en la opción Migrate All Vms (Migrar todas las máquinas virtuales).

  3. En el cuadro de diálogo Confirmar migración de máquinas virtuales, seleccione si desea forzar la detención de las instancias que no se pueden migrar.

    Por defecto, la opción de detención forzada no está activada y las instancias que no se pueden migrar seguirán ejecutándose en el nodo después de que finalice la operación de migración. Para forzar instancias de parada que no se pueden migrar, active la opción de forzar parada en el cuadro de diálogo Confirmar migración de máquinas virtuales.

  4. En el cuadro de diálogo Confirmar migración de máquinas virtuales, haga clic en el botón Migrar.

    El servicio de recursos informáticos migra en directo las instancias en ejecución a otros nodos de recursos informáticos si hay suficientes recursos disponibles y la configuración de alta disponibilidad está configurada para permitirlo. Si se especificó la opción Forzar, las instancias que no se pudieron migrar se paran temporalmente. Si no se pudo migrar ninguna instancia y no se especificó Forzar, esas instancias permanecen en ejecución en el nodo de cálculo que está intentando evacuar.

Uso de la CLI del servicio
  1. Visualice la lista de nodos de cálculo.

    Copie el ID del nodo de cálculo que desea evacuar.

    PCA-ADMIN> list ComputeNode
    Data:
      id                                     name       provisioningState   provisioningType
      --                                     ----       -----------------   ----------------
      3e62bf25-a26c-407e-ab8b-df01a4ad98b6   pcacn002   Provisioned         KVM
      f7b8356b-052f-4911-babb-447e6ab9c78d   pcacn003   Provisioned         KVM
      4e06ebdf-faed-484e-996d-d77af786f123   pcacn001   Provisioned         KVM
  2. Utilice el comando migrateVm para migrar en directo todas las instancias informáticas en ejecución fuera del nodo de cálculo. Para parar suavemente cualquier instancia que no se pueda migrar, defina la opción force:

    PCA-ADMIN> migrateVm id=7a0236f4-b00e-461d-93a0-b22673a18d9c force=true
    JobId: 6f1e94bc-7d5b-4002-ada9-7d4b504a2599

    El servicio de recursos informáticos migra en directo las instancias en ejecución a otros nodos de recursos informáticos si hay suficientes recursos disponibles y la configuración de alta disponibilidad está configurada para permitirlo. Si se especificó force=true, las instancias que no se pudieron migrar se paran temporalmente. Si no se pudo migrar ninguna instancia y no se especificó force=true, esas instancias permanecen en ejecución en el nodo de cálculo que está intentando evacuar.

    Utilice el identificador de trabajo para comprobar el estado del comando migrateVm.

    PCA-ADMIN> show Job id=6f1e94bc-7d5b-4002-ada9-7d4b504a2599
    [...]
      Done = true
      Name = MODIFY_TYPE
      Run State = Succeeded

Desactivación del aprovisionamiento de nodos de cálculo

Varias operaciones de nodo de cálculo solo se pueden realizar a condición de que se haya desactivado el aprovisionamiento. Siga estas instrucciones para imponer y liberar un bloqueo de aprovisionamiento.

Uso de la IU web de servicio
  1. En el menú de navegación, haga clic en Rack Units.

  2. En la tabla Rack Units (Unidades de rack), haga clic en el nombre de host del nodo de cálculo al que desea realizar cambios.

    Aparece la página de detalles del nodo de cálculo.

  3. En la esquina superior derecha de la página, haga clic en Controls y seleccione el comando Provisioning Lock.

    Cuando aparezca la ventana de confirmación, haga clic en Lock para continuar.

    Una vez finalizada correctamente, el separador Información de nodo de cálculo muestra Aprovisionamiento bloqueado = Sí.

  4. Para liberar el bloqueo de aprovisionamiento, haga clic en Controls y seleccione el comando Provisioning Unlock.

    Cuando aparezca la ventana de confirmación, haga clic en Desbloquear para continuar.

    Una vez finalizada correctamente, el separador Información de nodo de cálculo muestra Aprovisionamiento bloqueado = No.

Uso de la CLI del servicio
  1. Visualice la lista de nodos de cálculo.

    Copie el ID del nodo de cálculo para el que desea desactivar las operaciones de aprovisionamiento.

    PCA-ADMIN> list ComputeNode
    Data:
      id                                     name       provisioningState   provisioningType
      --                                     ----       -----------------   ----------------
      3e62bf25-a26c-407e-ab8b-df01a4ad98b6   pcacn002   Provisioned         KVM
      f7b8356b-052f-4911-babb-447e6ab9c78d   pcacn003   Provisioned         KVM
      4e06ebdf-faed-484e-996d-d77af786f123   pcacn001   Provisioned         KVM
  2. Defina un bloqueo de aprovisionamiento en el nodo de cálculo.

    PCA-ADMIN> provisioningLock id=f7b8356b-052f-4911-babb-447e6ab9c78d
    JobId: 6ee78c8a-e227-4d31-a770-9b9c96085f3f

    Utilice el ID de trabajo para comprobar el estado del comando.

    PCA-ADMIN> show Job id=6ee78c8a-e227-4d31-a770-9b9c96085f3f
    [...]
      Done = true
      Name = MODIFY_TYPE
      Run State = Succeeded
  3. Cuando el trabajo haya finalizado, confirme que el nodo de cálculo está bajo bloqueo de aprovisionamiento.

    PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d
    [...]
      Provisioning State = Provisioned
      [...]
      Provisioning Locked = true
      Maintenance Locked = false

    Todas las operaciones de aprovisionamiento ahora están desactivadas hasta que se libera el bloqueo.

  4. Para liberar el bloqueo de aprovisionamiento, utilice este comando:

    PCA-ADMIN> provisioningUnlock id=f7b8356b-052f-4911-babb-447e6ab9c78d
    JobId: 523892e8-c2d4-403c-9620-2f3e94015b46

    Utilice el ID de trabajo para comprobar el estado del comando.

    PCA-ADMIN> show Job id=523892e8-c2d4-403c-9620-2f3e94015b46
    [...]
      Done = true
      Name = MODIFY_TYPE
      Run State = Succeeded
  5. Cuando el trabajo haya finalizado, confirme que se haya liberado el bloqueo de aprovisionamiento.

    PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d
    [...]
      Provisioning State = Provisioned
      [...]
      Provisioning Locked = false
      Maintenance Locked = false

Bloqueo de un nodo de cálculo para mantenimiento

Para las operaciones de mantenimiento, los nodos de cálculo se deben colocar en modo de mantenimiento. Siga estas instrucciones para imponer y liberar un bloqueo de mantenimiento. Para poder bloquear un nodo de cálculo para el mantenimiento, primero debe desactivar el aprovisionamiento. Las operaciones de mantenimiento solo se pueden realizar si el nodo de cálculo no tiene instancias de cálculo en ejecución.

Atención

En función de la configuración de alta disponibilidad del servicio Compute, las migraciones automáticas de instancias pueden evitar que bloquee correctamente un nodo de cálculo. Consulte Configuración de alta disponibilidad para instancias informáticas. Esta situación es más probable que se produzca cuando la capacidad informática disponible es limitada.

  • Las operaciones de migración o recuperación de instancias después de una interrupción del nodo de cálculo pueden provocar que falle un bloqueo de mantenimiento. Los nodos informáticos implicados en las migraciones de instancias rechazarán el bloqueo de mantenimiento hasta que se completen las migraciones.

  • Las instancias desplazadas se pueden migrar de nuevo a su dominio de errores original cuando se libera un bloqueo de mantenimiento de nodo de cálculo. Un nodo de cálculo desde el que se vuelve a migrar una instancia desplazada rechazará el bloqueo de mantenimiento hasta que se complete la migración.

  • La migración de una instancia normalmente no tarda más de 30 segundos. Sin embargo, las instancias grandes y las cargas de trabajo pesadas aumentan el tiempo necesario.

  • En caso de que una instancia se quede atascada en estado móvil y la migración no se complete, su nodo de cálculo de host no se puede bloquear para mantenimiento. Póngase en contacto con Oracle para obtener ayuda.

Uso de la IU web de servicio
  1. Asegúrese de que el aprovisionamiento se haya desactivado en el nodo de cálculo.

  2. Asegúrese de que el nodo de cálculo no tenga instancias activas. Se deben migrar o cerrar.

  3. En el menú de navegación, haga clic en Rack Units.

  4. En la tabla Rack Units (Unidades de rack), haga clic en el nombre de host del nodo de cálculo que requiere mantenimiento.

    Aparece la página de detalles del nodo de cálculo.

  5. En la esquina superior derecha de la página, haga clic en Controls y seleccione el comando Maintenance Lock.

    Cuando aparezca la ventana de confirmación, haga clic en Lock para continuar.

    Una vez finalizada correctamente, el separador Información de nodo de cálculo muestra Mantenimiento bloqueado = Sí.

  6. Para liberar el bloqueo de mantenimiento, haga clic en Controles y seleccione el comando Desbloqueo de mantenimiento.

    Cuando aparezca la ventana de confirmación, haga clic en Desbloquear para continuar.

    Una vez finalizada correctamente, el separador Información de nodo de cálculo muestra Mantenimiento bloqueado = No.

Uso de la CLI del servicio
  1. Visualice la lista de nodos de cálculo.

    Copie el ID del nodo de cálculo que requiere mantenimiento.

    PCA-ADMIN> list ComputeNode
    Data:
      id                                     name       provisioningState   provisioningType
      --                                     ----       -----------------   ----------------
      3e62bf25-a26c-407e-ab8b-df01a4ad98b6   pcacn002   Provisioned         KVM
      f7b8356b-052f-4911-babb-447e6ab9c78d   pcacn003   Provisioned         KVM
      4e06ebdf-faed-484e-996d-d77af786f123   pcacn001   Provisioned         KVM
  2. Asegúrese de que el aprovisionamiento se haya desactivado en el nodo de cálculo.

  3. Bloquee el nodo de cálculo para realizar el mantenimiento.

    PCA-ADMIN> maintenanceLock id=f7b8356b-052f-4911-babb-447e6ab9c78d
    JobId: e46f6603-2af2-4df4-a0db-b15156491f88

    Utilice el ID de trabajo para comprobar el estado del comando.

    PCA-ADMIN> show Job id=e46f6603-2af2-4df4-a0db-b15156491f88
    [...]
      Done = true
      Name = MODIFY_TYPE
      Run State = Succeeded
  4. Cuando finalice el trabajo, confirme que el nodo de cálculo se haya bloqueado para mantenimiento.

    PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d
    [...]
      Provisioning State = Provisioned
      [...]
      Provisioning Locked = true
      Maintenance Locked = true

    El nodo de cálculo ya está listo para el mantenimiento.

  5. Para liberar el bloqueo de mantenimiento, utilice este comando:

    PCA-ADMIN> maintenanceUnlock id=f7b8356b-052f-4911-babb-447e6ab9c78d
    JobId: 625af20e-4b49-4201-879f-41d4405314c7

    Utilice el ID de trabajo para comprobar el estado del comando.

    PCA-ADMIN> show Job id=625af20e-4b49-4201-879f-41d4405314c7
    [...]
      Done = true
      Name = MODIFY_TYPE
      Run State = Succeeded
  6. Cuando el trabajo haya finalizado, confirme que se haya liberado el bloqueo de aprovisionamiento.

    PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d
    [...]
      Provisioning State = Provisioned
      [...]
      Provisioning Locked = true
      Maintenance Locked = false