Mantenimiento de infraestructura

Oracle Cloud Infrastructure realiza un mantenimiento rutinario del centro de datos en la infraestructura física de las instancias informáticas. Este mantenimiento incluye tareas como actualizar y reemplazar hardware o realizar mantenimiento que detiene la energía al host. En este tema, se proporciona información sobre el mantenimiento de la infraestructura, las opciones de migración y las métricas de estado que se pueden utilizar para supervisar el mantenimiento de la infraestructura.

Puede utilizar las métricas de estado de la infraestructura informática para supervisar el estado de las instancias durante el mantenimiento.

Nota

Para los hosts de máquina virtual dedicados, consulte Gestión de migración de reinicio de mantenimiento para hosts de máquina virtual dedicados.

Recuperación de una instancia durante el mantenimiento planificado

Cuando sea necesario someter la infraestructura subyacente para una instancia a tareas de mantenimiento planificado, Oracle Cloud Infrastructure intentará, cuando sea posible, recuperar automáticamente la instancia. La acción de mantenimiento depende del tipo de instancia.

  • Instancias de máquina virtual (VM): si es posible, la instancia se migra en directo a un host físico en buen estado. Si la migración en directo no es posible, la instancia se migra con reinicio o se reconstruye en su lugar, según la unidad.
  • Instancias con hardware dedicado: si es posible, la instancia se migra con reinicio a un host físico en buen estado. Si no es posible efectuar una migración con reinicio, deberá migrar la instancia de forma manual.

Mantenimiento planificado para instancias de máquina virtual

Si un evento de mantenimiento de infraestructura afecta a alguna instancia de máquina virtual, Oracle Cloud Infrastructure migra en directo las instancias de máquina virtual soportadas desde el host de máquina virtual físico que necesita mantenimiento a un host de máquina virtual en buen estado con una interrupción mínima de las instancias en ejecución.

Si una instancia de máquina virtual no se puede migrar en directo o no es compatible con la migración en directo, Oracle Cloud Infrastructure programa una fecha de vencimiento de mantenimiento en un plazo de 14 a 16 días y le envía una notificación que describe el tipo de acción de mantenimiento necesaria, como una migración con reinicio. Es posible que una migración en directo no se realice correctamente si se produce alguno de los siguientes eventos durante la migración: hay demasiada actividad en la instancia, se realiza un cambio en la instancia mediante la API o se produce un error interno no relacionado con la instancia.

Si se ha programado el mantenimiento de una instancia de máquina virtual, puede reiniciar de forma proactiva (o parar e iniciar) la instancia en cualquier momento antes de la fecha de vencimiento del mantenimiento programado. El reinicio proactivo permite controlar cómo y cuándo sus aplicaciones experimentan tiempo de inactividad. Si no reinicia la instancia de forma proactiva antes de la fecha de vencimiento, la instancia se migra con reinicio o se reconstruye en su lugar, según la unidad.

El mantenimiento gestionado por el cliente para instancias de VM se soporta en unidades de instancia de E/S estándar y densa, incluidas imágenes de plataforma e imágenes personalizadas importadas desde fuera de Oracle Cloud Infrastructure.

Para las unidades estándar, puede ampliar la fecha de vencimiento del mantenimiento.

Si decide no reiniciar antes de la hora programada, Oracle Cloud Infrastructure migra o reconstruye la instancia. Después de una migración, la instancia se recupera por defecto al mismo estado del ciclo de vida que antes del evento de mantenimiento. Si tiene un proceso alternativo para recuperar la instancia, puede configurar la instancia para que permanezca parada después de migrarla con reinicio al hardware en buen estado.

Mantenimiento planificado para instancias con hardware dedicado

Cuando un evento de mantenimiento de infraestructura afecta a las instancias con hardware dedicado, Oracle Cloud Infrastructure migra con reinicio las instancias con hardware dedicado soportadas desde el host físico que necesita mantenimiento a un host en buen estado. Oracle Cloud Infrastructure programa una fecha de vencimiento de mantenimiento en un plazo de entre 14 y 16 días y le envía una notificación que describe el tipo de acción de mantenimiento que es necesaria, como la migración con reinicio. Dentro de las 24 horas posteriores a la fecha de vencimiento del mantenimiento, la instancia con hardware dedicado se para, se migra a un host en buen estado y se reinicia. Durante la migración, se produce un breve tiempo de inactividad.

Si se ha programado el mantenimiento de una instancia con hardware dedicado, puede reiniciar la instancia de forma proactiva en cualquier momento antes de la fecha de vencimiento del mantenimiento programado. El reinicio proactivo permite controlar cómo y cuándo sus aplicaciones experimentan tiempo de inactividad. Si no reinicia la instancia de forma proactiva antes de la fecha de vencimiento, la instancia se migra con reinicio.

La migración con reinicio para instancias con hardware dedicado está soportada en las unidades de instancia estándar que utilizan imágenes de plataforma basadas en Linux. La migración con reinicio para instancias con hardware dedicado no es compatible con instancias que utilizan imágenes personalizadas o de Windows, instancias protegidas, instancias con VNIC secundarias creadas y configuradas en una NIC física con el índice 1 o instancias que no utilizan el comando sanboot estándar en el script iPXE.

Para las unidades estándar, puede ampliar la fecha de vencimiento del mantenimiento.

Si decide no reiniciar antes de la hora programada, Oracle Cloud Infrastructure migra o reconstruye la instancia. Después de una migración, la instancia se recupera por defecto al mismo estado del ciclo de vida que antes del evento de mantenimiento. Si tiene un proceso alternativo para recuperar la instancia, puede configurar opcionalmente la instancia para que permanezca parada después de migrarla con reinicio al hardware en buen estado.

Identificación de instancias con mantenimiento planificado

Si una instancia soporta las acciones de mantenimiento de migración en directo, migración con reinicio o reconstrucción en su lugar, la fecha del campo Reinicio de mantenimiento de la instancia (disponible en la consola, la CLI y los SDK) indica que el mantenimiento planificado está programado. En el caso de instancias que solo soportan la migración manual, Oracle Cloud Infrastructure le envía una notificación, pero no se muestra ninguna fecha en el campo Reinicio de mantenimiento.

Para identificar las instancias programadas para el mantenimiento, realice cualquiera de las siguientes acciones:

Mediante la consola: ver qué instancias del compartimento actual están programadas para el mantenimiento
  1. Abra el menú de navegación y haga clic en Recursos informáticos. En Recursos informáticos, haga clic en Instancias.

    Si la instancia tiene un mantenimiento programado y se puede reiniciar de forma proactiva, aparece un icono de advertencia junto al nombre de la instancia.

  2. Haga clic en la instancia que le interesa y, a continuación, compruebe el campo Reinicio por mantenimiento de la instancia. Este campo muestra la fecha y la hora de inicio del mantenimiento.
Mediante la API: ver qué instancias de un compartimento están programadas para el mantenimiento

Utilice la operación ListInstances. El campo timeMaintenanceRebootDue de la instancia devuelve la fecha y la hora de inicio del mantenimiento.

Uso de la búsqueda: para buscar todas las instancias programadas para el mantenimiento
  1. En la barra de navegación superior, haga clic en Buscar recursos, servicios, documentación y Marketplace y, a continuación, seleccione Consulta de recursos avanzados.
  2. Haga clic en Seleccionar consulta de ejemplo y, a continuación, en Consulta de todas las instancias con un reinicio de mantenimiento programado próximo.
  3. Haga clic en Buscar.

Una instancia deja de verse afectada por un evento de mantenimiento si el campo Reinicio de mantenimiento de la instancia está en blanco.

Recuperación de una VM debido a un fallo de infraestructura

Cuando falla la infraestructura subyacente de una instancia de VM debido a problemas de software o hardware, Oracle Cloud Infrastructure intenta recuperar automáticamente la instancia.

Las instancias de máquina virtual estándar se recuperan mediante una migración con reinicio, que restaura automáticamente la máquina virtual en un host en buen estado, ya sea el host físico original o un host físico diferente. El fallo de máquina virtual se detecta en el lapso de un minuto desde que se produce la incidencia. Si el host no se puede recuperar inmediatamente, la máquina virtual se mueve a otro host en buen estado. En este escenario, el proceso de migración y reinicio en un host en buen estado comienza automáticamente en cinco minutos. Durante el reinicio, se conservan propiedades de instancia como las direcciones IP públicas privadas y efímeras, los volúmenes en bloque asociados y las VNIC.

Las instancias de VM de E/S densas se recuperan reiniciando la instancia en el mismo host físico. Si no es posible recuperar una instancia de E/S densa en el mismo host físico, Oracle Cloud Infrastructure le notifica que suprima (termine) la instancia en un plazo de 14 días. Si no suprime la instancia antes de la fecha límite, Oracle Cloud Infrastructure desactiva la instancia en la fecha límite y la suprime en un plazo de siete días. Se conservan el volumen de inicio y el volumen de datos asociado remoto.

Oracle Cloud Infrastructure le notifica por correo electrónico o anuncios de cualquier evento de fallo de infraestructura de la VM, con el estado de la acción de recuperación que se ha llevado a cabo. También puede supervisar la métrica de estado de la instancia para mantenerse al tanto de cualquier reinicio inesperado.

Puede optar por no reiniciar automáticamente las máquinas virtuales configurando las instancias para que permanezcan paradas después de recuperarlas.

Métricas de estado de infraestructura

Puede utilizar métricas, alarmas y notificaciones para supervisar el estado de mantenimiento de la infraestructura en la que se ejecutan las instancias informáticas. Las métricas principales que se deben tener en cuenta para el mantenimiento de la infraestructura son las métricas de estado de infraestructura:

  • Instance health (up/down) status: The instance_status metric lets you check whether a VM instance is available (up) or unavailable (down) when in the running state. Si la instancia sigue sin estar disponible a los 30 minutos, póngase en contacto con los Servicios de Soporte.
  • Estado de mantenimiento de la instancia: la métrica maintenance_status permite supervisar si se ha programado el mantenimiento planificado de la infraestructura de una instancia de máquina virtual o con hardware dedicado.
  • Estado de la infraestructura de hardware dedicado: la métrica health_status le ayuda a supervisar el estado de la infraestructura para las instancias con hardware dedicado, incluidos componentes de hardware como la CPU y la memoria.

Visualización de notificaciones de mantenimiento y estado de instancia en la consola

Puede ver el estado de la instancia y las notificaciones de reinicio de mantenimiento en la consola, en la página Detalles de instancia. Para ver estos campos:

  1. Abra el menú de navegación y haga clic en Recursos informáticos. En Recursos informáticos, haga clic en Instancias.
  2. Haga clic en la instancia en la que está interesado.
  3. En el separador Información de instancia, en la sección Detalles de instancia, consulte el campo Estado de instancia y el campo Reinicio de mantenimiento.
    Nota

    El campo Estado de la instancia solo se muestra si la instancia no estaba disponible en el último mes.

Acciones de mantenimiento

Oracle Cloud Infrastructure soporta una variedad de acciones de mantenimiento para instancias informáticas, incluidas la reconstrucción en el lugar, la migración en directo, la migración de reinicio y la migración manual. La acción de mantenimiento depende de características como la unidad que utiliza la instancia.

Reconstrucción en el lugar

Esta acción de mantenimiento no mueve la instancia. A la hora programada, la instancia se para, se reconstruye en el mismo hardware físico y se reinicia. Durante el proceso de mantenimiento, se produce un tiempo de inactividad de varias horas.

Una reconstrucción en el lugar conserva las propiedades de la instancia que están vinculadas al hardware físico, como la dirección MAC o el número de identificación universal. Una reconstrucción en el lugar también permite retener el SSD basado en NVMe asociado localmente en una instancia de E/S densa.

Para las VM, si desea minimizar el tiempo de inactividad y puede suprimir la SSD basada en NVMe asociada localmente, puede reiniciar la instancia de forma proactiva antes de la hora de mantenimiento programada. La instancia se migrará con reinicio a un host en buen estado y la SSD se suprimirá permanentemente. Durante la migración, se produce un breve tiempo de inactividad.

Acciones de Mantenimiento de Migración

Las otras tres acciones de mantenimiento implican la migración de instancias. Para obtener información detallada sobre cada acción de mantenimiento, consulte Live, Reboot, and Manual Migration: Moving a Compute Instance to a New Host. O bien, haga clic en uno de los siguientes enlaces para ir directamente a los detalles de esa acción.