Mantenimiento de infraestructura

Oracle Cloud Infrastructure realiza un mantenimiento rutinario del centro de datos en la infraestructura física de las instancias informáticas. Este mantenimiento incluye tareas como actualizar y reemplazar hardware o realizar mantenimiento que detiene la energía al host. En este tema, se proporciona información sobre el mantenimiento de la infraestructura, las opciones de migración y las métricas de estado que se pueden utilizar para supervisar el mantenimiento de la infraestructura.

Puede utilizar las métricas de estado de la infraestructura informática para supervisar el estado de las instancias durante el mantenimiento.

Nota

Para los hosts de máquina virtual dedicados, consulte Gestión de migración de reinicio de mantenimiento para hosts de máquina virtual dedicados.

Acciones de mantenimiento

Oracle Cloud Infrastructure admite una variedad de acciones de mantenimiento para instancias informáticas que incluyen migración en vivo, mantenimiento programado, reconstrucción en su lugar y migración manual. La acción de mantenimiento depende de características como la unidad que utiliza la instancia.

Migración en directo (sin tiempo de inactividad)

La migración en directo es un mecanismo para mover una VM de un servidor físico a otro mientras la VM aún está en ejecución. Durante una migración en directo, la instancia de máquina virtual de origen sigue ejecutándose a medida que el servicio informático copia la memoria y todos los componentes virtuales en la nueva instancia de máquina virtual de destino. Cuando se completa la copia, solo hay una pequeña pausa, normalmente medida en decenas de milisegundos, cuando el sistema cambia a la nueva VM. La interrupción es muy breve.

Mantenimiento programado (tiempo de inactividad corto)

Con el mantenimiento programado, se define una fecha para cuando se mueve una instancia a un nuevo host. Mediante la migración con reinicio, la instancia se para, se migra a un host en buen estado y se reinicia. Durante la migración, se produce un breve tiempo de inactividad. Puede controlar cuándo se produce el tiempo de inactividad migrando la instancia con reinicio de forma proactiva antes de la fecha de vencimiento del mantenimiento. En raras ocasiones, la migración con reinicio no es posible y la instancia se termina.

Reconstrucción in situ (tiempo de inactividad largo)

Esta acción de mantenimiento no mueve la instancia. A la hora programada, la instancia se para, se reconstruye en el mismo hardware físico y se reinicia. Durante el proceso de mantenimiento, se produce un tiempo de inactividad de varias horas.

Una reconstrucción en el lugar conserva las propiedades de la instancia que están vinculadas al hardware físico, como la dirección MAC o el número de identificación universal. Una reconstrucción en el lugar también permite retener el SSD basado en NVMe asociado localmente en una instancia de E/S densa.

Para las VM, si desea minimizar el tiempo de inactividad y puede suprimir la SSD basada en NVMe asociada localmente, puede reiniciar la instancia de forma proactiva antes de la hora de mantenimiento programada. La instancia se migrará con reinicio a un host en buen estado y la SSD se suprimirá permanentemente. Durante la migración, se produce un breve tiempo de inactividad.

Migración manual

Para las instancias de VM en las que las acciones anteriores no están disponibles, debe mover la instancia manualmente. Este método requiere que suprima (termine) la instancia y, a continuación, inicie una nueva instancia desde el volumen de inicio retenido. Se requieren pasos adicionales para las instancias que tienen VNIC adicionales, direcciones IP secundarias, volúmenes en bloque asociados remotos, el módulo de plataforma de confianza (TPM) activado o que pertenecen a un juego de backends de un equilibrador de carga.

En raras ocasiones, no es posible recuperar una instancia de VM en el mismo host físico. Oracle Cloud Infrastructure le notifica que suprima (termine) la instancia en un plazo de 14 días. Si no suprime la instancia antes de la fecha límite, Oracle Cloud Infrastructure desactiva la instancia en la fecha límite y la suprime en un plazo de siete días. Se conservan el volumen de inicio y el volumen de datos asociado remoto.

Identificación de instancias con mantenimiento planificado

Si una instancia soporta la migración con reinicio o la reconstrucción en su lugar, haga clic en el separador Mantenimiento. La página de detalles de mantenimiento indica cuándo está programado el inicio del mantenimiento planificado. Las horas de inicio y finalización del mantenimiento se muestran en la columna Programado para iniciar. En el caso de instancias que solo admiten la migración manual, Oracle Cloud Infrastructure le envía una notificación y se muestra un evento de mantenimiento en la página de detalles de mantenimiento.

Para identificar las instancias programadas para el mantenimiento, realice cualquiera de las siguientes acciones:

Mediante la consola: ver qué instancias del compartimento actual están programadas para el mantenimiento
  1. Abra el menú de navegación y haga clic en Recursos informáticos. En Recursos informáticos, haga clic en Mantenimiento de instancias.

    Se muestra una lista de instancias programadas para mantenimiento.

  2. Haga clic en la instancia que le interesa y, a continuación, haga clic en el separador Mantenimiento de la instancia. Esta fecha y hora de inicio y finalización se muestran para cualquier evento de mantenimiento.
Mediante la API: ver qué instancias de un compartimento están programadas para el mantenimiento

Utilice la operación InstanceMaintenanceEvents para mostrar los eventos. Proporcione un campo de compartimento para mostrar todas las instancias con eventos de mantenimiento en un compartimento determinado. Filtre los resultados mediante opciones como instanceAction o lifecycleState para acotar la búsqueda.

Uso de la búsqueda: para buscar todas las instancias programadas para el mantenimiento
  1. En la barra de navegación superior, haga clic en Search for resources, services, documentation, and Marketplace y, a continuación, seleccione Advanced resource query.
  2. Haga clic en Seleccionar consulta de ejemplo y, a continuación, en Consulta de todas las instancias con un reinicio de mantenimiento programado próximo.

    A continuación se muestra un ejemplo de consulta:

    query
      instancemaintenanceevent resources
        where (timeWindowStart > 'Now' && lifecycleState = 'SCHEDULED')
  3. Haga clic en Buscar.

Se muestra una lista de instancias coincidentes.

Una instancia ya no se ve afectada por un evento de mantenimiento cuando el separador Mantenimiento está vacío.

Ampliación de la fecha límite de mantenimiento

Puede ampliar la fecha de vencimiento de mantenimiento para las instancias programadas para el mantenimiento o el cese. Se admite la ampliación de la fecha límite para el mantenimiento de la migración de reinicio, que normalmente se programa en instancias de máquina virtual y con hardware dedicado que utilizan unidades estándar o flexibles. OCI determina la última hora posible hasta la que se puede ampliar la fecha de vencimiento.

Mediante la consola: ampliar la fecha de vencimiento de mantenimiento de una instancia
  1. Abra el menú de navegación y haga clic en Recursos informáticos. En Recursos informáticos, haga clic en Instancias.
  2. Haga clic en la instancia en la que está interesado, haga clic en el separador Mantenimiento y, a continuación, en Volver a programar.
  3. Haga clic en Ampliar fecha límite.
  4. En el cuadro Nueva fecha límite, seleccione una nueva fecha y hora.
  5. Haga clic en Guardar cambios.

    Se amplía la fecha de vencimiento del mantenimiento. En las 24 horas siguientes a la fecha de vencimiento del mantenimiento, la instancia con hardware dedicado se para, se migra a un host en buen estado y se reinicia. Durante la migración, se produce un breve tiempo de inactividad.

Mediante la API: ampliar la fecha de vencimiento de mantenimiento de una instancia
  1. Compruebe la última hora posible hasta la que se puede ampliar la fecha de vencimiento mediante la operación GetInstanceMaintenanceReboot.
  2. Amplíe la fecha de vencimiento del mantenimiento mediante una de las siguientes acciones:

    • Instancias de máquina virtual y con hardware dedicado: utilice la operación InstanceAction, transfiriendo el valor REBOOTMIGRATE como la acción que se va a realizar. En el atributo timeScheduled, proporcione la fecha de vencimiento actualizada.
    • Máquinas virtuales: utilice la operación UpdateInstance, transfiriendo la fecha de vencimiento actualizada en el atributo timeMaintenanceRebootDue.

    Se amplía la fecha de vencimiento del mantenimiento. En las 24 horas siguientes a la fecha de vencimiento del mantenimiento, la instancia con hardware dedicado se para, se migra a un host en buen estado y se reinicia. Durante la migración, se produce un breve tiempo de inactividad.

Recuperación de una instancia

Cuando la infraestructura subyacente de una instancia no está en buen estado, Oracle Cloud Infrastructure intenta recuperar automáticamente la instancia. La acción de mantenimiento depende del tipo de instancia.

  • Instancias de máquina virtual (VM): si es posible, la instancia se migra en directo a un host físico en buen estado. Si la migración en directo no es posible, la instancia se migra con reinicio o se reconstruye en su lugar, según la unidad.
  • Instancias con hardware dedicado: si es posible, la instancia se migra con reinicio a un host físico en buen estado. Si no es posible efectuar una migración con reinicio, deberá migrar la instancia de forma manual.

Mantenimiento planificado para instancias de máquina virtual

Cuando un evento de mantenimiento de infraestructura afecta a instancias de máquina virtual, Oracle Cloud Infrastructure migra en directo instancias de máquina virtual soportadas desde el host de máquina virtual físico que necesita mantenimiento a un nuevo host de máquina virtual con una interrupción mínima de las instancias en ejecución.

Si una instancia de máquina virtual no se puede migrar en directo o no es compatible con la migración en directo, Oracle Cloud Infrastructure programa una fecha de vencimiento de mantenimiento en un plazo de entre 14 y 16 días y le envía una notificación que describe el tipo de acción de mantenimiento necesaria, como la migración con reinicio. Es posible que una migración en directo no se realice correctamente si se produce alguno de los siguientes eventos durante la migración: hay demasiada actividad en la instancia, se realiza un cambio en la instancia mediante la API o se produce un error interno no relacionado con la instancia.

Si se ha programado el mantenimiento de una instancia de máquina virtual, puede realizar una migración de la instancia de forma proactiva en cualquier momento antes de la fecha de vencimiento del mantenimiento programado. La migración proactiva con reinicio permite controlar cómo y cuándo sus aplicaciones experimentan tiempo de inactividad. Si no migra la instancia de forma proactiva antes de la fecha de vencimiento, la instancia está migrada con inicio o recreada en su lugar, según la unidad.

El mantenimiento gestionado por el cliente para instancias de VM se soporta en unidades de instancia de E/S estándar y densa, incluidas imágenes de plataforma e imágenes personalizadas importadas desde fuera de Oracle Cloud Infrastructure.

Para las unidades estándar y DenseIO, puede ampliar la fecha de vencimiento del mantenimiento.

Nota

En algunos casos, como un evento de mantenimiento relacionado con la seguridad, es posible que no pueda ampliar la fecha.

Después de una migración, la instancia se recupera por defecto al mismo estado del ciclo de vida que antes del evento de mantenimiento. Si tiene un proceso alternativo para recuperar la instancia, puede configurar la instancia para que permanezca parada después de migrarla con reinicio al hardware en buen estado.

Mantenimiento planificado para instancias con hardware dedicado

Cuando un evento de mantenimiento de infraestructura afecta a las instancias con hardware dedicado, Oracle Cloud Infrastructure migra con reinicio las instancias con hardware dedicado soportadas desde el host físico que necesita mantenimiento a un host en buen estado. Oracle Cloud Infrastructure programa una fecha de vencimiento de mantenimiento en un plazo de entre 14 y 16 días y le envía una notificación que describe el tipo de acción de mantenimiento que es necesaria, como la migración con reinicio. Dentro de las 24 horas posteriores a la fecha de vencimiento del mantenimiento, la instancia con hardware dedicado se para, se migra a un host en buen estado y se reinicia. Durante la migración, se produce un breve tiempo de inactividad.

Si se ha programado el mantenimiento de una instancia con hardware dedicado, puede reiniciar la instancia de forma proactiva en cualquier momento antes de la fecha de vencimiento del mantenimiento programado. El reinicio proactivo permite controlar cómo y cuándo sus aplicaciones experimentan tiempo de inactividad. Si no reinicia la instancia de forma proactiva antes de la fecha de vencimiento, la instancia se migra con reinicio.

La migración con reinicio para instancias con hardware dedicado está soportada en las unidades de instancia estándar que utilizan imágenes de plataforma basadas en Linux. La migración con reinicio para instancias con hardware dedicado no es compatible con instancias que utilizan imágenes personalizadas o de Windows, instancias protegidas, instancias con VNIC secundarias creadas y configuradas en una NIC física con el índice 1 o instancias que no utilizan el comando sanboot estándar en el script iPXE.

Para las unidades estándar, puede ampliar la fecha de vencimiento del mantenimiento.

Si decide no reiniciar antes de la hora programada, Oracle Cloud Infrastructure migra o reconstruye la instancia. Después de una migración, la instancia se recupera por defecto al mismo estado del ciclo de vida que antes del evento de mantenimiento. Si tiene un proceso alternativo para recuperar la instancia, puede configurar opcionalmente la instancia para que permanezca parada después de migrarla con reinicio al hardware en buen estado.

Recuperación de una VM debido a un fallo de infraestructura

Cuando falla la infraestructura subyacente de una instancia de VM debido a problemas de software o hardware, Oracle Cloud Infrastructure intenta recuperar automáticamente la instancia.

Las instancias de máquina virtual estándar se recuperan mediante una migración con reinicio, que restaura automáticamente la máquina virtual en un host en buen estado, ya sea el host físico original o un host físico diferente. El fallo de máquina virtual se detecta en el lapso de un minuto desde que se produce la incidencia. Si el host no se puede recuperar inmediatamente, la máquina virtual se mueve a otro host en buen estado. En este escenario, el proceso de migración y reinicio en un host en buen estado comienza automáticamente en cinco minutos. Durante el reinicio, se conservan propiedades de instancia como las direcciones IP públicas privadas y efímeras, los volúmenes en bloque asociados y las VNIC.

DenseIO Las instancias de VM se recuperan reiniciando la instancia en el mismo host físico. Si no es posible recuperar una instancia de DenseIO en el mismo host físico, Oracle Cloud Infrastructure le notifica que reinicie la migración o suprima (termine) la instancia en el plazo de 14 días. Si se utiliza la migración con reinicio, los datos locales de NVMe aún se pierden. Si no suprime la instancia antes de la fecha límite, Oracle Cloud Infrastructure desactiva la instancia en la fecha límite y la suprime en un plazo de siete días. Se conservan el volumen de inicio y el volumen de datos asociado remoto.

Oracle Cloud Infrastructure le notifica por correo electrónico o anuncios de cualquier evento de fallo de infraestructura de la VM, con el estado de la acción de recuperación que se ha llevado a cabo. También puede supervisar la métrica de estado de la instancia para mantenerse al tanto de cualquier reinicio inesperado.

Puede optar por no reiniciar automáticamente las máquinas virtuales configurando las instancias para que permanezcan paradas después de recuperarlas.

Métricas de estado de infraestructura

Puede utilizar métricas, alarmas y notificaciones para supervisar el estado de mantenimiento de la infraestructura en la que se ejecutan las instancias informáticas. Las métricas principales que se deben tener en cuenta para el mantenimiento de la infraestructura son las métricas de estado de infraestructura:

  • Instance health (up/down) status: The instance_status metric lets you check whether a VM instance is available (up) or unavailable (down) when in the running state. Si la instancia sigue sin estar disponible a los 30 minutos, póngase en contacto con los Servicios de Soporte.
  • Estado de mantenimiento de la instancia: la métrica maintenance_status permite supervisar si se ha programado el mantenimiento planificado de la infraestructura de una instancia de máquina virtual o con hardware dedicado.
  • Estado de la infraestructura de hardware dedicado: la métrica health_status le ayuda a supervisar el estado de la infraestructura para las instancias con hardware dedicado, incluidos componentes de hardware como la CPU y la memoria.

Visualización de estado de instancia y notificaciones de mantenimiento en la consola

Puede ver el estado de la instancia y las notificaciones de reinicio de mantenimiento en la consola, en la página Detalles de instancia. Para ver estos campos:

  1. Abra el menú de navegación y haga clic en Recursos informáticos. En Recursos informáticos, haga clic en Instancias.
  2. Haga clic en la instancia en la que está interesado.
  3. En el separador Información de instancia, en la sección Detalles de instancia, consulte el campo Estado de instancia y el campo Reinicio de mantenimiento.
    Nota

    El campo Estado de la instancia solo se muestra si la instancia no estaba disponible en el último mes.