Manutenção da Infraestrutura
O Oracle Cloud Infrastructure executa a manutenção rotineira do data center na infraestrutura física das instâncias de computação. Essa manutenção inclui tarefas como fazer upgrade e substituir hardware ou executar manutenção que interrompe a energia do host. Este tópico fornece detalhes sobre manutenção da infraestrutura, opções de migração e métricas de status que você pode usar para monitorar a manutenção da infraestrutura.
Você pode usar métricas de integridade da infraestrutura de computação para monitorar o status de suas instâncias durante a manutenção.
Para hosts de máquina virtual dedicados, consulte Gerenciando a Migração de Reinicialização de Manutenção para Hosts de Máquina Virtual Dedicados.
Ações de Manutenção
O Oracle Cloud Infrastructure suporta uma variedade de ações de manutenção para instâncias de computação, incluindo migração ao vivo, manutenção programada, reconstrução no local e migração manual. A ação de manutenção depende de características como a forma que a instância usa.
Migração ao Vivo (Sem Tempo de Inatividade)
A Migração ao Vivo é um mecanismo para mover uma VM de um servidor físico para outro enquanto a VM ainda está em execução. Durante uma migração ao vivo, a instância da VM de origem continua a ser executada à medida que o serviço Compute copia a memória e todos os componentes virtuais para a nova instância da VM de destino. Quando a cópia é concluída, há apenas uma pequena pausa, normalmente medida em dezenas de milissegundos, quando o sistema muda para a nova VM. A interrupção é mínima.
Manutenção Programada (Tempo de Inatividade Curto)
Com a manutenção programada, uma data é definida para quando uma instância é movida para um novo host. Usando a migração de reinicialização, a instância é interrompida, migrada para um host saudável e reiniciada. Um curto período de indisponibilidade ocorre durante a migração. Você pode controlar quando a indisponibilidade ocorre migrando proativamente a instância antes da data de vencimento da manutenção. Em casos raros, a migração de reinicialização não é possível e a instância é encerrada.
Reconstruir no Local (Inatividade Longa)
Esta ação de manutenção não move a instância. No horário programado, a instância é interrompida, reconstruída no mesmo hardware físico e reiniciada. Um período de indisponibilidade de várias horas ocorre durante o processo de manutenção.
Uma recriação no local preserva as propriedades da instância vinculadas ao hardware físico, como o endereço MAC ou o número de identificação universal. Uma recriação no local também permite que você mantenha o SSD baseado em NVMe anexado localmente em uma instância com alta densidade de Entrada/Saída.
Para VMs, se quiser minimizar o período de indisponibilidade e excluir o SSD baseado em NVMe anexado localmente, você poderá reinicializar proativamente a instância antes do horário de manutenção programado. Será feito na instância o processo de migração com reinicialização para um host íntegro e o SSD será excluído permanentemente. Um curto período de indisponibilidade ocorre durante a migração.
Migração Manual
Para instâncias de VM em que as ações anteriores não estão disponíveis, você deve mover a instância manualmente. Esse método requer que você exclua (encerre) a instância e, em seguida, inicie uma nova instância com base no volume de inicialização retido. As instâncias que têm VNICs adicionais, endereços IP secundários, volumes em blocos remotos anexados, o Módulo de Plataforma Confiável (TPM) ativado ou que pertencem a um conjunto de backend de um balanceador de carga exigem etapas adicionais.
Em casos raros, não é possível recuperar uma instância de VM no mesmo host físico. O Oracle Cloud Infrastructure notifica você para excluir (encerrar) a instância dentro de 14 dias. Se você não excluir a instância antes do prazo, o Oracle Cloud Infrastructure desativará a instância no prazo e a excluirá nos próximos sete dias. O volume de inicialização e o volume de dados anexados remoto são preservados.
Manutenção Planejada
Identificando Instâncias com Manutenção Planejada
Se uma instância suportar migração de reinicialização ou reconstrução no local, clique na guia Manutenção. A página de detalhes da manutenção indica quando a manutenção planejada está programada para ser iniciada. As horas inicial e final da manutenção são mostradas na coluna Programado para Início. Para instâncias que suportam apenas a migração manual, o Oracle Cloud Infrastructure envia uma notificação e um evento de manutenção é mostrado na página de detalhes da manutenção.
Para identificar as instâncias programadas para manutenção, execute um dos seguintes procedimentos:
- Abra o menu de navegação e clique em Compute. Em Compute, clique em Manutenção de Instâncias.
Uma lista de instâncias programadas para manutenção é exibida.
- Clique na instância desejada e, em seguida, clique na guia Manutenção da instância. Essa data e hora de início e término são exibidas para qualquer evento de manutenção.
Use a operação InstanceMaintenanceEvents
para listar eventos. Forneça um campo de compartimento para listar todas as instâncias com eventos de manutenção em um determinado compartimento. Filtre os resultados usando opções como instanceAction ou lifecycleState para restringir a pesquisa.
- Na barra de navegação superior, selecione Procurar recursos, serviços, documentação e Marketplace e, em seguida, selecione Consulta de recurso avançada.
- Clique em Selecionar Consulta de Amostra e, em seguida, clique em Consultar todas as instâncias que tenham uma futura reinicialização de manutenção programada.
Esta é uma consulta de exemplo:
query instancemaintenanceevent resources where (timeWindowStart > 'Now' && lifecycleState = 'SCHEDULED')
- Clique em Pesquisar.
Uma lista de instâncias correspondentes é exibida.
Uma instância não será mais afetada por um evento de manutenção quando a guia Manutenção estiver vazia.
Estendendo o Prazo da Manutenção
Você pode prorrogar a data de vencimento da manutenção para instâncias programadas para manutenção ou encerramento. Há suporte para extensão do prazo na manutenção da migração de reinicialização, que geralmente é programada em instâncias de VM e bare metal que usam formas padrão ou flexíveis. O OCI determina o horário mais recente possível até o qual a data de vencimento pode ser prorrogada.
- Abra o menu de navegação e selecione Computação. Em Compute, selecione Instâncias.
- Clique na instância em que você está interessado, clique na guia Manutenção e, em seguida, clique em Reprogramar.
- Clique em Estender prazo.
- Na caixa Novo prazo, selecione uma nova data e um novo horário.
-
Clique em Salvar alterações.
A data de vencimento da manutenção foi prorrogada. Até 24 horas após a data de vencimento da manutenção, a instância é interrompida, migrada para um host íntegro e reiniciada. Um curto período de indisponibilidade ocorre durante a migração.
- Verifique o horário mais recente possível até o qual a data de vencimento pode ser prorrogada usando a operação GetInstanceMaintenanceReboot.
-
Prorrogue a data de vencimento da manutenção executando um dos seguintes procedimentos:
- VMs e instâncias bare metal: Use a operação InstanceAction, especificando o valor
REBOOTMIGRATE
como a ação a ser executada. No atributotimeScheduled
, forneça a data de vencimento atualizada. - VMs: Use a operação UpdateInstance, especificando a data de vencimento atualizada no atributo
timeMaintenanceRebootDue
.
A data de vencimento da manutenção foi prorrogada. Até 24 horas após a data de vencimento da manutenção, a instância é interrompida, migrada para um host íntegro e reiniciada. Um curto período de indisponibilidade ocorre durante a migração.
- VMs e instâncias bare metal: Use a operação InstanceAction, especificando o valor
Recuperando uma Instância
Quando a infraestrutura subjacente de uma instância não estiver íntegra, o Oracle Cloud Infrastructure tentará recuperar automaticamente a instância. A ação de manutenção depende do tipo de instância.
- Instâncias de máquina virtual (VM): Quando possível, a instância é migrada ao vivo para um host físico íntegro. Se a migração ao vivo não for possível, a instância passará pelo processo de migração com reinicialização ou será recriada no local, dependendo da forma.
- Instâncias bare metal: Quando possível, a instância passará pelo processo de migração com reinicialização para um host físico íntegro. Se a migração com reinicialização não for possível, você deverá migrar manualmente a instância.
Manutenção Planejada para Instâncias de VM
Quando um evento de manutenção de infraestrutura afeta instâncias de VM, o Oracle Cloud Infrastructure migra ao vivo as instâncias de VM suportadas do host de VM físico que precisa de manutenção para um novo host de VM com interrupção mínima das instâncias em execução.
Se uma instância de VM não puder ser migrada ao vivo ou não suportar a migração ao vivo, o Oracle Cloud Infrastructure programará uma data de vencimento de manutenção em até 14 a 16 dias e enviará a você uma notificação descrevendo o tipo de ação de manutenção necessário, como migração com reinicialização. Uma migração ao vivo poderá não ser bem-sucedida se algum dos seguintes eventos ocorrer durante a migração: há muita atividade na instância, uma alteração na instância foi feita usando a API ou ocorre erro interno não relacionado à instância.
Se uma instância de VM estiver programada para manutenção, você poderá reinicializar proativamente a migração da instância a qualquer momento antes da data de vencimento da manutenção programada. A migração de reinicialização proativa permite controlar como e quando seus aplicativos passam por tempo de inatividade. Se você não reiniciar proativamente a migração da instância antes da data de vencimento, a instância será migrada novamente ou migrada novamente no local para você, dependendo da forma.
Existe suporte para a manutenção gerenciada pelo cliente em instâncias de VM nas formas de instância padrão e com alta densidade de Entrada/Saída, incluindo imagens de plataforma e imagens personalizadas que foram importadas de fora do Oracle Cloud Infrastructure.
Para formas padrão e DenseIO, você pode prorrogar a data de vencimento da manutenção.
Em alguns casos, como um evento de manutenção relacionado à segurança, talvez você não consiga estender a data.
Após uma migração, por padrão, a instância é recuperada para o mesmo estado do ciclo de vida anterior ao evento de manutenção. Se você tiver um processo alternativo para recuperar a instância, poderá, opcionalmente, configurá-la para permanecer interrompida após a migração com reinicialização para um hardware íntegro.
Manutenção Planejada para Instâncias Bare Metal
Quando um evento de manutenção de infraestrutura afeta instâncias bare metal, o Oracle Cloud Infrastructure migra novamente instâncias bare metal suportadas do host físico que precisa de manutenção para um host saudável. O Oracle Cloud Infrastructure programa uma data de vencimento de manutenção dentro de 14 a 16 dias e envia a você uma notificação descrevendo o tipo de ação de manutenção necessário, como migração com reinicialização. Até 24 horas após a data de vencimento da manutenção, a instância bare metal é interrompida, migrada para um host íntegro e reiniciada. Um curto período de indisponibilidade ocorre durante a migração.
Se uma instância bare metal estiver programada para manutenção, você poderá reinicializar proativamente a instância a qualquer momento antes da data de vencimento da manutenção programada. A reinicialização proativa permite controlar como e quando seus aplicativos passam por tempo de inatividade. Se você não reinicializar a instância proativamente antes da data de vencimento, será feito para você o processo de migração com reinicialização da instância.
Existe suporte para a migração com reinicialização para instâncias bare metal em formas de instância padrão que usam imagens de plataforma baseadas em Linux. Não há suporte para a migração com reinicialização para instâncias bare metal em instâncias que usam imagens do Windows ou personalizadas, instâncias protegidas, instâncias que têm VNICs secundárias criadas e configuradas na NIC física com índice 1 ou em instâncias que não usam o comando padrão sanboot
no script iPXE.
Para formas padrão, você pode prorrogar a data de vencimento da manutenção.
Se você optar por não reinicializar antes do tempo programado, o Oracle Cloud Infrastructure migrará ou recriará a instância. Após uma migração, por padrão, a instância é recuperada para o mesmo estado do ciclo de vida anterior ao evento de manutenção. Se houver um processo alternativo para recuperar a instância, você poderá, se preferir, configurá-la para permanecer interrompida após a migração com reinicialização para um hardware íntegro.
Recuperação de VM em Decorrência de Falha de Infraestrutura
Quando a infraestrutura subjacente de uma instância de VM falhar por causa de problemas de software ou hardware, o Oracle Cloud Infrastructure tentará recuperar automaticamente a instância.
As instâncias de VM padrão são recuperadas usando uma migração com reinicialização, que restaura automaticamente a VM em um host íntegro, seja ele o host físico original ou outro host físico. A falha da VM é detectada um minuto após a ocorrência. Se o host não puder ser recuperado imediatamente, ocorrerá uma movimentação íntegra, em que a VM será movida para outro host. Nesse cenário, o processo de migração e reinicialização em um host íntegro é iniciado automaticamente em cinco minutos. Durante a reinicialização, as propriedades da instância, como endereços IP públicos privados e efêmeros, volumes em blocos anexados e VNICs, são preservadas.
DenseIO As instâncias de VM são recuperadas com a reinicialização da instância no mesmo host físico. Se não for possível recuperar uma instância DenseIO no mesmo host físico, o Oracle Cloud Infrastructure notificará você para reinicializar a migração ou excluir (encerrar) a instância dentro de 14 dias. Se a migração de reinicialização for usada, os dados locais NVMe ainda serão perdidos. Se você não excluir a instância antes do prazo, o Oracle Cloud Infrastructure desativará a instância no prazo e a excluirá nos próximos sete dias. O volume de inicialização e o volume de dados anexados remoto são preservados.
O Oracle Cloud Infrastructure notifica você por e-mail ou anúncios de qualquer evento de falha de infraestrutura de VM, com o status da ação de recuperação que foi executada. Você também pode monitorar a métrica de status da instância para ficar ciente de qualquer reinicialização inesperada.
Você não tem a opção de reiniciar suas VMs automaticamente configurando suas instâncias para permanecerem interrompidas depois de recuperadas.
Métricas de Integridade da Infraestrutura
Você pode usar métricas, alarmes e notificações para monitorar o status de manutenção da infraestrutura na qual as suas instâncias de computação são executadas. As principais métricas a serem consideradas para a manutenção da infraestrutura são as métricas de integridade da infraestrutura:
- Status de integridade da instância (ativo/down): A métrica
instance_status
permite verificar se uma instância de VM está disponível (ativa) ou indisponível (down) quando no estado em execução. Se a instância ficar indisponível por mais de 30 minutos, entre em contato com o suporte. - Status de manutenção da instância: A métrica
maintenance_status
permite monitorar se uma instância bare metal ou VM está programada para manutenção de infraestrutura planejada. - Status de integridade da infraestrutura bare metal: A métrica
health_status
ajuda você a monitorar a integridade da infraestrutura das instâncias bare metal, incluindo componentes de hardware, como CPU e memória.
Exibindo o Status da Instância e Notificações de Manutenção na Console
Você pode exibir o status da instância e as notificações de reinicialização de manutenção na Console na página Detalhes da Instância. Para ver estes campos:
- Abra o menu de navegação e selecione Computação. Em Compute, selecione Instâncias.
- Clique na instância em que você está interessado.
- Na guia Informações da instância, na seção Detalhes da instância, consulte o campo Status da instância e o campo Reinicialização de manutenção.Observação
O campo Status da instância só será exibido caso a instância não tenha estado disponível no mês passado.