Mantenimiento de instancias

Oracle Cloud Infrastructure realiza un mantenimiento rutinario en la infraestructura física de los centros de datos para las instancias informáticas. Este mantenimiento incluye tareas como actualizar y reemplazar hardware o realizar mantenimiento que detiene la energía al host. En este tema, se proporciona información sobre el mantenimiento de la infraestructura, las opciones de migración y las métricas de estado que se pueden utilizar para supervisar el mantenimiento de la infraestructura.

Puede utilizar las métricas de sistema de infraestructura informática para supervisar el estado de sus instancias durante la mantenimiento.

Nota

Para los hosts de máquina virtual dedicados, consulte Gestión de la migración de reinicio de mantenimiento para hosts dedicados de máquina virtual.

Acciones de mantenimiento

Oracle Cloud Infrastructure soporta una variedad de acciones de mantenimiento para instancias informáticas, como la reparación sin fin, la migración en directo, el mantenimiento programado, la reconstrucción en su lugar y la migración manual. La acción de mantenimiento depende de características como la unidad que utiliza la instancia.

Eventos de mantenimiento

OCI proporciona eventos de mantenimiento para gestionar los procesos de mantenimiento de instancias. Los eventos de mantenimiento se crean cuando su instancia/host necesita mantenimiento. Los eventos notifican a los usuarios las próximas actividades de mantenimiento que afectan a sus instancias. Los eventos de mantenimiento aparecen en el recurso de mantenimiento de instancias de la consola de OCI. Además, los eventos de mantenimiento se pueden gestionar mediante la CLI o los SDK. Todas las interfaces permiten a los usuarios reprogramar ventanas de mantenimiento, supervisar el progreso del mantenimiento y realizar las acciones necesarias de mantenimiento previo o posterior.

Reparación sin terminación

La reparación no terminal (NTR) en OCI permite el mantenimiento y la reparación de componentes de hardware o software subyacentes sin necesidad de terminar o evacuar instancias en ejecución. Este enfoque contrasta con los métodos tradicionales de terminación de reparación (TR), que requieren la terminación de la instancia antes de que se realice el mantenimiento. NTR minimiza las interrupciones del servicio y mejora la disponibilidad de las aplicaciones en OCI. Con NTR, puede mantener el estado y el rendimiento de su infraestructura en la nube con un tiempo de inactividad reducido y una eficiencia operativa mejorada.

Los tipos de mantenimiento de NTR incluyen:

Reparaciones de tiempo de inactividad: las instancias se paran antes del mantenimiento.
Reparaciones en directo: el mantenimiento se produce mientras las instancias permanecen operativas.
Reparación en segundo plano activa: caso de uso en el que no se necesita ninguna acción del usuario y OCI crea un evento de mantenimiento y ejecuta la reparación en segundo plano.

Para obtener más información sobre la reparación que no termina, consulte: Non-Terminating Repair.

Importante

NTR solo está soportado en unidades con hardware dedicado.

Migración en directo (sin tiempo de inactividad)

La migración en directo es un mecanismo para mover una máquina virtual de un servidor físico a otro mientras la máquina virtual aún se está ejecutando. Durante una migración en directo, la instancia de VM de origen se sigue ejecutando a medida que el servicio Compute copia la memoria y todos los componentes virtuales en la nueva instancia de VM de destino. Cuando se completa la copia, solo hay una pequeña pausa, que normalmente se mide en decenas de milisegundos, cuando el sistema cambia a la nueva VM. La disrupción es mínima.

Mantenimiento programado (tiempo de inactividad corto)

Con el mantenimiento programado, se define una fecha para cuando una instancia se mueve a un nuevo host. Mediante la migración con reinicio, la instancia se para, se migra a un host en buen estados y se reinicia. Durante la migración, se produce un breve tiempo de inactividad. Puede controlar cuándo se produce el tiempo de inactividad migrando la instancia con reinicio de forma proactiva antes de la fecha de vencimiento del mantenimiento. En raras ocasiones, la migración con reinicio no es posible y la instancia se termina.

Reconstrucción en el lugar (tiempo de inactividad largo)

Esta acción de mantenimiento no mueve la instancia. A la hora programada, la instancia se para, se reconstruye en el mismo hardware físico y se reinicia. Durante el proceso de mantenimiento, se produce un tiempo de inactividad de varias horas.

Una reconstrucción en el lugar conserva las propiedades de la instancia que están vinculadas al hardware físico, como la dirección MAC o el número de identificación universal. Una reconstrucción en el lugar también permite retener el SSD basado en NVMe asociado localmente en una instancia de E/S densa.

Para las VM, si desea minimizar el tiempo de inactividad y puede suprimir la SSD basada en NVMe asociada localmente, puede reiniciar la instancia de forma proactiva antes de la hora de mantenimiento programada. La instancia se migrará con reinicio a un host en buen estado y la SSD se suprimirá permanentemente. Durante la migración, se produce un breve tiempo de inactividad.

Migración manual

Para las instancias de VM en las que las acciones anteriores no están disponibles, debe mover la instancia manualmente. Este método requiere que suprima (termine) la instancia y, a continuación, inicie una nueva instancia desde el volumen de inicio retenido. Se requieren pasos adicionales para las instancias que tienen VNIC adicionales, direcciones IP secundarias, volúmenes en bloque asociados remotos, el módulo de plataforma de confianza (TPM) activado o que pertenecen a un juego de backends de un equilibrador de carga.

En raras ocasiones, no es posible recuperar una instancia de VM en el mismo host físico. Oracle Cloud Infrastructure le notifica que suprima (termine) la instancia en un plazo de 14 días. Si no suprime la instancia antes de la fecha límite, Oracle Cloud Infrastructure desactiva la instancia en la fecha límite y lo suprime el plazo de siete días. Se conservan el volumen de inicio y el volumen de datos asociado remoto.

Mantenimiento planificado

Identificación de instancias con mantenimiento planificado

Si una instancia admite la migración con reinicio o la reconstrucción en su lugar, haga clic en el separador Mantenimiento. La página de detalles de mantenimiento indica cuándo está programado el inicio del mantenimiento planificado. Las horas de inicio y finalización del mantenimiento se muestran en la columna Programado para inicio. Para las instancias que solo soportan la migración manual, Oracle Cloud Infrastructure le envía una notificación y se muestra un evento de mantenimiento en la página de detalles de mantenimiento.

Para identificar las instancias programadas para el mantenimiento, realice cualquiera de las siguientes acciones:

Mediante la consola: ver qué instancias del compartimento actual están programadas para el mantenimiento

Abra el menú de navegación y haga clic en Recursos informáticos. En Recursos informáticos, haga clic en Mantenimiento de instancias.
Se muestra una lista de instancias programadas para mantenimiento.
Haga clic sobre la instancia que le interese y, a continuación, en el separador Mantenimiento de la instancia. Esta fecha y hora de inicio y finalización se muestran para cualquier evento de mantenimiento.

Mediante la API: ver qué instancias de un compartimento están programadas para el mantenimiento

Utilice la operación InstanceMaintenanceEvents para mostrar los eventos. Proporcione un campo de compartimento para mostrar todas las instancias con eventos de mantenimiento en un compartimento determinado. Filtre los resultados mediante opciones como instanceAction o lifecycleState para acotar la búsqueda.

Uso de la búsqueda: para buscar todas las instancias programadas para el mantenimiento

En la barra de navegación superior, seleccione Buscar recursos, servicios, documentación y Marketplace y, a continuación, seleccione Consulta de recursos avanzada.
Haga clic en Seleccionar consulta de ejemplo y, a continuación, en Consulta de todas las instancias con un reinicio del mantenimiento programado próximo.
A continuación, se muestra un ejemplo de consulta:
```
query
  instancemaintenanceevent resources
    where (timeWindowStart > 'Now' && lifecycleState = 'SCHEDULED')
```
Haga clic en Buscar.

Se muestra una lista de instancias coincidentes.

Una instancia ya no se ve afectada por un evento de mantenimiento cuando el separador Mantenimiento está vacío.

Ampliación de la fecha límite de mantenimiento

Puede ampliar la fecha de vencimiento de mantenimiento para las instancias programadas para el mantenimiento o la terminación. Se admite la ampliación de la fecha límite para el mantenimiento de la migración con reinicio, que normalmente se programa en instancias de máquina virtual y con hardware dedicado que utilizan unidades estándar o flexibles. OCI determina la última hora posible a la que se puede extender la fecha de vencimiento.

Mediante la consola: ampliar la fecha de vencimiento de mantenimiento de una instancia

Abra el menú de navegación y seleccione Recursos informáticos. En Recursos informáticos, seleccione Instancias.
Haga clic en la instancia en la que está interesado, en el separador Mantenimiento y, a continuación, en Volver a programar.
Haga clic en Ampliar fecha límite.
En el cuadro Nueva fecha límite, seleccione una nueva fecha y hora.
Haga clic en Save changes.

Se amplía la fecha de vencimiento del mantenimiento. Dentro de las 24 horas siguientes a la fecha de vencimiento de mantenimiento, la instancia se detiene, se migra a un host que está en buen estados y se reinicia. Durante la migración, se produce un breve tiempo de inactividad.

Mediante la API: ampliar la fecha de vencimiento de mantenimiento de una instancia

Compruebe la última hora posible hasta la que se puede ampliar la fecha de vencimiento mediante la operación GetInstanceMaintenanceReboot.
Amplíe la fecha de vencimiento del mantenimiento mediante una de las siguientes acciones:
- Instancias de máquina virtual y con hardware dedicado: utilice la operación InstanceAction, transfiriendo el valor REBOOTMIGRATE como la acción que se debe realizar. En el atributo timeScheduled, proporcione la fecha de vencimiento actualizada.
- Máquinas Virtuales: utilice la operación UpdateInstance, transfiriendo la fecha del vencimiento actualizada en el atributo timeMaintenanceRebootDue.
Se amplía la fecha de vencimiento del mantenimiento. Dentro de las 24 horas siguientes a la fecha de vencimiento de mantenimiento, la instancia se detiene, se migra a un host que está en buen estados y se reinicia. Durante la migración, se produce un breve tiempo de inactividad.

Recuperación de una instancia

Cuando la infraestructura subyacente para una instancia no está en buen estado, Oracle Cloud Infrastructure intentará recuperar automáticamente la instancia. La acción de mantenimiento depende del tipo de instancia.

Instancias de máquina virtual (VM): si es posible, la instancia se migra en directo a un host físico en buen estados. Si la migración en directo no es posible, la instancia se migra con reinicio o se reconstruye en su lugar, según la unidad.
Instancias de hardware dedicado: si es posible, la instancia se migra con reinicio a un host físico. Si no es posible efectuar una migración con reinicio, deberá migrar la instancia de forma manual.

Mantenimiento planificado para instancias de máquina virtual

Cuando un evento del mantenimiento de la infraestructura afecta a las instancias de VM, Oracle Cloud Infrastructure migra de forma activa las instancias de VM soportadas desde el host de VM físico que necesita mantenimiento a un nuevo host de VM con un mínimo de interrupción de las instancias en ejecución .

Si una instancia de VM no se puede migrar en directo o no es compatibles con el servicio de migración en directo, Oracle Cloud Infrastructure programa una fecha en un plazo de entre 14 y 16 días y le envía una notificación que describe el tipo de acción de conservación necesaria, como la migración con reinicio Es posible que una migración en directo no se realice correctamente si se produce alguno de los siguientes eventos durante la migración: hay demasiada actividad en la instancia, se realiza un cambio en la instancia mediante la API o se produce un error interno no relacionado con la instancia.

Si se ha programado el mantenimiento de una instancia con máquina virtual, puede reiniciar de manera proactiva la instancia en cualquier momento antes de la Fecha de Vencimiento del Mantenimiento programado. La migración con reinicio proactivo le permite controlar cómo y cuándo sus aplicaciones experimentan tiempo de inactividad. Si usted no reinicia la instancia de forma proactiva antes de la fecha del vencimiento, la instancia se migra con reinicio o reconstruye en su lugar, según la forma.

El mantenimiento gestionado por los clientes para instancias de VM se soporta en unidades de instancias de E/S estándar y densa, incluidas imágenes y imágenes personalizadas de plataforma importadas desde fuera de Oracle Cloud Infrastructure.

Para unidades estándar y DenseIO, puede ampliar la fecha de vencimiento del mantenimiento.

Nota

En algunos casos, como un evento de mantenimiento relacionado con la seguridad, es posible que no pueda ampliar la fecha.

Después de una migración, la instancia se recupera por defecto al mismo estado del ciclo de vida que antes del evento de mantenimiento. Si tiene un proceso alternativo para recuperar la instancia, puede configurar la instancia para que permanezca parada después de migrarla con reinicio al hardware en buen estado.

Mantenimiento planificado para instancias con hardware dedicado

Cuando un evento de mantenimiento de infraestructura afecta a las instancias con hardware dedicado, Oracle Cloud Infrastructure migra de nuevo con reinicio las instancias con hardware dedicadas soportadas desde el host físico que necesita mantenimiento a un host con estado correcto. Oracle Cloud Infrastructure programa una fecha en el plazo de 14 a 16 días y le envía una notificación en la que se describe el tipo de acciones de mantenimiento que es necesaria, como por ejemplo la migración con reinicio. Dentro de 24 horas posteriores, a la fecha de vencimiento del mantenimiento, la instancia con hardware dedicado se paró, se migró a un host En buen Estado y se reinicia. Durante la migración, se produce un breve tiempo de inactividad.

Si se ha programado el mantenimiento de una instancia con hardware dedicado, puede reiniciar la instancia de forma proactiva en cualquier momento antes de la fecha de vencimiento del mantenimiento programado. El reinicio proactivo permite controlar cómo y cuándo sus aplicaciones experimentan tiempo de inactividad. Si no reinicia la instancia de forma proactiva antes de la fecha de vencimiento, la instancia se migra con reinicio.

La migración con reinicio para instancias con hardware dedicado está soportada en las unidades de instancia estándar que utilizan imágenes de plataforma basadas en Linux. La migración con reinicio para instancias con hardware dedicado no es compatible con instancias que utilizan imágenes personalizadas o de Windows, instancias protegidas, instancias con VNIC secundarias creadas y configuradas en una NIC física con el índice 1 o instancias que no utilizan el comando sanboot estándar en el script iPXE.

Para las unidades estándar, puede ampliar la fecha de vencimiento del mantenimiento.

Si decide no reiniciar antes de la hora programada, Oracle Cloud Infrastructure migra o reconstruye la instancia. Después de una migración, la instancia se recupera por defecto al mismo estado del ciclo de vida que antes del evento de mantenimiento. Si tiene un proceso alternativo para recuperar la instancia, puede configurar opcionalmente la instancia para que permanezca parada después de migrarla con reinicio al hardware en buen estado.

Recuperación de una VM debido a un fallo de infraestructura

Cuando falla la infraestructura subyacente de una instancia de VM debido al software o al hardware, Oracle Cloud Infrastructure intenta recuperar automáticamente la instancia.

Las instancias de máquina virtual estándar se recuperan mediante una migración con reinicio, que restaura automáticamente la máquina virtual en un host en buen estado, ya sea el host físico original o un host físico diferente. El fallo de máquina virtual se detecta en el lapso de un minuto desde que se produce la incidencia. Si el host no se puede recuperar inmediatamente, la máquina virtual se mueve a otro host en buen estado. En este escenario, el proceso de migración y reinicio en un host en buen estado comienza automáticamente en cinco minutos. Durante el reinicio, se conservan propiedades de instancia como las direcciones IP públicas privadas y efímeras, los volúmenes en bloque asociados y las VNIC.

Las instancias de VM de DenseIO se recuperan reiniciando la instancia en el mismo host físico. Si no Es posible recuperar una instancia de DenseIO en el mismo host físico, Oracle Cloud Infrastructure le notifica que suprima (termine) la instancia en el plazo de 14 días. Si se utiliza la migración con reinicio, los datos locales de NVMe aún se pierden. Si no suprime la instancia antes de la fecha límite, Oracle Cloud Infrastructure desactiva la instancia en la fecha límite y lo suprime el plazo de siete días. Se conservan el volumen de inicio y el volumen de datos asociado remoto.

Oracle Cloud Infrastructure le notifica por correo electrónico o anuncios de cualquier evento del fallo de infraestructura de las VM, con el estado de la acción de recuperación que se ha llevado a cabo. También puede supervisar la métrica de estado de la instancia para mantenerse al tanto de cualquier reinicio inesperado.

Puede optar por no reiniciar automáticamente las máquinas virtuales configurando las instancias para que permanezcan paradas después de recuperarlas.

Métricas de estado de infraestructura

Puede utilizar métricas, alarmas y notificaciones para supervisar el estado de mantenimiento de la infraestructura en la que se ejecutan las instancias informáticas. Las métricas principales que se deben tener en cuenta para el mantenimiento de la infraestructura son las métricas de estado de infraestructura:

Estado de las instancias (activo/inactivo): la métrica instance_status permite comprobar si una instancia de VM está disponible (activo) o no (inactivo) cuando se encuentra en el estado En ejecución. Si la instancia sigue sin estar disponible a los 30 minutos, póngase en contacto con los Servicios de Soporte.
Estado de mantenimiento de instancia: la métrica maintenance_status permite supervisar si se han programado instancias de máquina virtual o con hardware dedicado para mantenimiento planificado de la infraestructura.
Estado de Infraestructura de Hardware dedicado: la métrica health_status le ayuda a supervisar el estado de infraestructura para instancias con hardware dedicadas, incluidos componentes del hardware como la CPU y memoria.

Visualización del estado de la instancia y las notificaciones de mantenimiento en la consola

Puede ver el estado de la instancia y la notificación de reinicio del mantenimiento en la consola, en la página Detalles de instancia. Para ver estos campos:

Abra el menú de navegación y seleccione Recursos informáticos. En Recursos informáticos, seleccione Instancias.
Haga clic en la instancia en la que está interesado.
En el separador Información de instancia, en la sección Detalles de instancia, consulte el campo de Estado de instancia y el campo de Reinicio de Mantenimiento.
Nota

El campo Estado de la instancia solo se muestra si la instancia no estaba disponible en el último mes.

Documentación de Oracle Cloud Infrastructure