Manutenção da Infraestrutura
O Oracle Cloud Infrastructure executa manutenção de rotina do data center na infraestrutura física para instâncias de computação. Essa manutenção inclui tarefas como fazer upgrade e substituir hardware ou executar manutenção que interrompe a energia do host. Este tópico fornece detalhes sobre manutenção da infraestrutura, opções de migração e métricas de status que você pode usar para monitorar a manutenção da infraestrutura.
Você pode usar métricas para monitorar o status de suas instâncias durante sua manutenção.
Para hosts de máquina virtual dedicados, consulte Gerenciando a Migração de Reinicialização de Manutenção para Hosts de Máquina Virtual Dedicados.
Ações de Manutenção
O Oracle Cloud Infrastructure suporta uma variedade de ações de manutenção para instâncias do serviço Compute, incluindo migração ao vivo, manutenção programada, recriação no local e migração manual. A ação de manutenção depende de características como a forma que a instância usa.
Live Migration (sem tempo de inatividade)
O serviço Live Migration é um mecanismo para mover uma VM de um servidor físico para outro enquanto a VM ainda está em execução. Durante uma migração ao vivo, a instância da VM de origem continua a ser executada à medida que o serviço Compute copia a memória e todos os componentes virtuais para a nova instância da VM de destino. Quando a cópia é concluída, há apenas uma pequena pausa, normalmente medida em dezenas de milissegundos, quando o sistema muda para a nova VM. A interrupção é mínima.
Manutenção agendada (tempo de inatividade curto)
Com a manutenção programada, uma data é definida para quando uma instância é movida para um novo host. Usando migração de reinicialização, a instância é interrompida, migrada para um host íntegro e reiniciada. Um curto período de indisponibilidade ocorre durante a migração. Você pode controlar quando a indisponibilidade ocorre migrando proativamente a instância antes da data de vencimento da manutenção. Em casos raros, a migração com reinicialização não é possível e a instância é encerrada.
Reconstruir no local (tempo de inatividade longo)
Esta ação de manutenção não move a instância. No horário programado, a instância é interrompida, reconstruída no mesmo hardware físico e reiniciada. Um período de indisponibilidade de várias horas ocorre durante o processo de manutenção.
Uma recriação no local preserva as propriedades da instância vinculadas ao hardware físico, como o endereço MAC ou o número de identificação universal. Uma recriação no local também permite que você mantenha o SSD baseado em NVMe anexado localmente em uma instância com alta densidade de Entrada/Saída.
Para VMs, se quiser minimizar o período de indisponibilidade e excluir o SSD baseado em NVMe anexado localmente, você poderá reinicializar proativamente a instância antes do horário de manutenção programado. Será feito na instância o processo de migração com reinicialização para um host íntegro e o SSD será excluído permanentemente. Um curto período de indisponibilidade ocorre durante a migração.
Migração Manual
Para instâncias de VM nas quais as ações anteriores não estão disponíveis, você deve mover a instância manualmente. Esse método requer que você exclua (encerre) a instância e, em seguida, inicie uma nova instância com base no volume de inicialização retido. As instâncias que têm VNICs adicionais, endereços IP secundários, volumes em blocos remotos anexados, o Módulo de Plataforma Confiável (TPM) ativado ou que pertencem a um conjunto de backend de um balanceador de carga exigem etapas adicionais.
Em casos raros, não é possível recuperar uma instância de VM no mesmo host físico. O Oracle Cloud Infrastructure notifica você para excluir (encerrar) a instância em até 14 dias. Se você não excluir a instância antes do prazo, o Oracle Cloud Infrastructure desativará a instância no prazo e a excluirá dentro dos próximos sete dias. O volume de inicialização e o volume de dados anexados remoto são preservados.
Manutenção Planejada
Identificando Instâncias com Manutenção Planejada
Se uma instância suportar migração com reinicialização ou recriação no local, clique na guia Manutenção. A página de detalhes da manutenção indica quando a manutenção planejada está programada para ser iniciada. As horas inicial e final da manutenção são mostradas na coluna Programado para Iniciar. Para instâncias que suportam apenas a migração manual, o Oracle Cloud Infrastructure envia uma notificação e um evento de manutenção é mostrado na página de detalhes da manutenção.
Para identificar as instâncias programadas para manutenção, execute um dos seguintes procedimentos:
- Abra o menu de navegação e clique em Compute. Em Compute, clique em Manutenção de Instâncias.
Uma lista de instâncias programadas para manutenção é exibida.
- Clique na instância na qual você está interessado e, em seguida, clique na guia Manutenção da instância. Essa data e hora de início e término são exibidas para qualquer evento de manutenção.
Use a operação InstanceMaintenanceEvents para listar eventos. Forneça um campo de compartimento para listar todas as instâncias com eventos de manutenção em um determinado compartimento. Filtre os resultados usando opções como instanceAction ou lifecycleState para restringir a pesquisa.
- Na barra de navegação superior, selecione Procurar recursos, serviços, documentação e Marketplace e, em seguida, selecione Consulta avançada de recursos.
- Clique em Selecionar Consulta de Amostra e depois clique em Consultar todas as instâncias que têm uma próxima reinicialização programada de manutenção.
Veja a seguir um exemplo de consulta:
query instancemaintenanceevent resources where (timeWindowStart > 'Now' && lifecycleState = 'SCHEDULED') - Clique em Pesquisar.
Uma lista de instâncias correspondentes é exibida.
Uma instância não é mais afetada por um evento de manutenção quando a guia Manutenção está vazia.
Estendendo o Prazo de Manutenção
Você pode estender a data de vencimento da manutenção para instâncias que estão programadas para manutenção ou encerramento. A extensão do prazo é suportada para a manutenção de migração de reinicialização, que geralmente é programada em instâncias de VM e bare metal que usam formas padrão ou flexíveis. A OCI determina a última hora possível para a qual a data de vencimento pode ser estendida.
- Abra o menu de navegação e selecione Compute. Em Compute, selecione Instâncias.
- Clique na instância desejada, clique na guia Manutenção e, em seguida, clique em Reprogramar.
- Clique em Estender prazo.
- Na caixa Novo prazo, selecione uma nova data e um novo horário.
-
Clique em Salvar alterações.
A data de vencimento da manutenção foi prorrogada. Dentro de 24 horas após o vencimento da manutenção, a instância é interrompida, migrada para um host íntegro e reiniciada. Um curto período de indisponibilidade ocorre durante a migração.
- Verifique o horário mais recente possível até o qual a data de vencimento pode ser prorrogada usando a operação GetInstanceMaintenanceReboot.
-
Prorrogue a data de vencimento da manutenção executando um dos seguintes procedimentos:
-
VMs e instâncias bare metal: Use a operação InstanceAction, especificando o valor
REBOOTMIGRATEcomo a ação a ser executada. No atributotimeScheduled, forneça a data de vencimento atualizada. -
VMs: Use a operação UpdateInstance, especificando a data do vencimento atualizada no atributo
timeMaintenanceRebootDue.
A data de vencimento da manutenção foi prorrogada. Dentro de 24 horas após o vencimento da manutenção, a instância é interrompida, migrada para um host íntegro e reiniciada. Um curto período de indisponibilidade ocorre durante a migração.
-
VMs e instâncias bare metal: Use a operação InstanceAction, especificando o valor
Recuperando uma Instância
Quando a infraestrutura subjacente de uma instância não está íntegra, o Oracle Cloud Infrastructure tenta recuperar automaticamente a instância. A ação de manutenção depende do tipo de instância.
- Instâncias de máquina virtual (VM): Quando possível, a instância é migrada ao vivo para um host físico íntegro. Se a migração ao vivo não for possível, a instância passará pelo processo de migração com reinicialização ou será recriada no local, dependendo da forma.
- Instâncias bare metal: Quando possível, a instância é reinicializada e migrada para um host físico íntegro. Se a migração com reinicialização não for possível, você deverá migrar manualmente a instância.
Manutenção Planejada para Instâncias de VM
Quando um evento da manutenção da infraestrutura afeta as instâncias da VM, o Oracle Cloud Infrastructure migra em tempo real as instâncias da VM suportadas do host da VM física que necessita de manutenção para um novo host da VM com o mínimo de interrupção nas instâncias em execução
Se uma instância de VM não pode ser resumida ou não dá suporte à migração ao vivo, o Oracle Cloud Infrastructure programa um prazo de manutenção dentro de 14 a 16 dias e envia uma notificação descrevendo o tipo de ação de manutenção necessária, como a migração com reinicialização . Uma migração ao vivo poderá não ser bem-sucedida se algum dos seguintes eventos ocorrer durante a migração: há muita atividade na instância, uma alteração na instância foi feita usando a API ou ocorre erro interno não relacionado à instância.
Se uma instância da VM estiver programada para manutenção, você poderá reinicializar proativamente a migração da instância a qualquer momento antes do prazo da manutenção programada. A migração com reinicialização proativa permite controlar como e quando os aplicativos passam pelo tempo de inatividade. Se você Não reinicializar proativamente a migração da instância antes do prazo, a instância será reinicializada migrada ou recriada para você, dependendo da forma.
A manutenção gerenciada pelo cliente para instâncias da VM é suportada em formas de instância de E/S padrão e densa, incluindo imagens da plataforma e imagens personalizadas que foram importadas de fora do Oracle Cloud Infrastructure.
Para formas padrão e DenseIO, você pode estender o prazo da manutenção.
Em alguns casos, como um evento de manutenção relacionado à segurança, talvez você não consiga estender a data.
Após uma migração, por padrão, a instância é recuperada para o mesmo estado do ciclo de vida anterior ao evento de manutenção. Se você tiver um processo alternativo para recuperar a instância, poderá, opcionalmente, configurá-la para permanecer interrompida após a migração com reinicialização para um hardware íntegro.
Manutenção Planejada para Instâncias Bare Metal
Quando um evento do serviço de manutenção da infraestrutura afeta instâncias bare metal, o Oracle Cloud Infrastructure migra novamente instâncias bare metal suportadas do host físico que necessita de manutenção para um host íntegro. O Oracle Cloud Infrastructure programa um prazo para a manutenção dentro de 14 a 16 dias e envia uma notificação descrevendo o tipo de ação de Manutenção necessário, como a migração com reinicialização. Dentro de 24 horas após o vencimento da manutenção, a instância bare metal é interrompida, migrada para um host íntegro e reiniciada. Um curto período de indisponibilidade ocorre durante a migração.
Se uma instância bare metal estiver programada para manutenção, você poderá reinicializar proativamente a instância a qualquer momento antes da data de vencimento da manutenção programada. A reinicialização proativa permite controlar como e quando seus aplicativos passam por tempo de inatividade. Se você não reinicializar a instância proativamente antes da data de vencimento, será feito para você o processo de migração com reinicialização da instância.
Existe suporte para a migração com reinicialização para instâncias bare metal em formas de instância padrão que usam imagens de plataforma baseadas em Linux. Não há suporte para a migração com reinicialização para instâncias bare metal em instâncias que usam imagens do Windows ou personalizadas, instâncias protegidas, instâncias que têm VNICs secundárias criadas e configuradas na NIC física com índice 1 ou em instâncias que não usam o comando padrão sanboot no script iPXE.
Para formas padrão, você pode prorrogar a data de vencimento da manutenção.
Se você optar por não reinicializar antes do horário programado, o Oracle Cloud Infrastructure migrará ou recriará a instância. Após uma migração, por padrão, a instância é recuperada para o mesmo estado do ciclo de vida anterior ao evento de manutenção. Se houver um processo alternativo para recuperar a instância, você poderá, se preferir, configurá-la para permanecer interrompida após a migração com reinicialização para um hardware íntegro.
Recuperação de VM em Decorrência de Falha de Infraestrutura
Quando a infraestrutura subjacente de uma instância da VM falha por causa de problemas de software ou hardware, a Oracle Cloud Infrastructure tenta recuperar a instância automaticamente.
As instâncias de VM padrão são recuperadas usando uma migração com reinicialização, que restaura automaticamente a VM em um host íntegro, seja ele o host físico original ou outro host físico. A falha da VM é detectada um minuto após a ocorrência. Se o host não puder ser recuperado imediatamente, ocorrerá uma movimentação íntegra, em que a VM será movida para outro host. Nesse cenário, o processo de migração e reinicialização em um host íntegro é iniciado automaticamente em cinco minutos. Durante a reinicialização, as propriedades da instância, como endereços IP públicos privados e efêmeros, volumes em blocos anexados e VNICs, são preservadas.
As instâncias da VM DenseIO são recuperadas ao reinicializar a instância no mesmo host físico. Se a recuperação de uma instância do DenseIO no mesmo host físico não estiver possível, o Oracle Cloud Infrastructure notificará você para reinicializar a migração ou exclusão (encerrar) da instância em 14 dias. Se a migração de reinicialização for usada, os dados NVMe locais ainda serão perdidos. Se você não excluir a instância antes do prazo, o Oracle Cloud Infrastructure desativará a instância no prazo e a excluirá dentro dos próximos sete dias. O volume de inicialização e o volume de dados anexados remoto são preservados.
O Oracle Cloud Infrastructure notifica você por e-mail ou anúncios de quaisquer eventos de falha da infraestrutura da VM, com o status da ação da recuperação que foi executada. Você também pode monitorar a métrica de status da instância para ficar ciente de qualquer reinicialização inesperada.
Você não tem a opção de reiniciar suas VMs automaticamente configurando suas instâncias para permanecerem interrompidas depois de recuperadas.
Métricas de Integridade da Infraestrutura
Você pode usar métricas, alarmes e notificações para monitorar o status de manutenção da infraestrutura na qual as suas instâncias de computação são executadas. As principais métricas a serem consideradas para a manutenção da infraestrutura são as métricas de integridade da infraestrutura:
- Status de integridade (ativação/desativação) da instância: A métrica
instance_statuspermite verificar se uma instância da VM está disponível (ativação) ou indisponível (desativação) no estado de execução. Se a instância ficar indisponível por mais de 30 minutos, entre em contato com o suporte. - Status de manutenção da instituição: A métrica
maintenance_statuspermite monitorar se uma instância de VM ou bare metal está programada para manutenção planejada de infraestrutura. - Status da integridade de uma infraestrutura Bare metal: A métrica
health_statusajuda a monitorar aintegridade da infraestrutura para instâncias bare metal, incluindo componentes de hardware, como CPU e memória.
Exibindo o Status da Instância e as Notificações de Manutenção na Console
Você pode exibir as notificações de reinicialização da instância e de manutenção na Console na página Detalhes da Instância. Para ver estes campos:
- Abra o menu de navegação e selecione Compute. Em Compute, selecione Instâncias.
- Clique na instância em que você está interessado.
- Na guia Informações da Instância, na seção Detalhes da Instância, consulte os campos Status da Instância e Reinicialização da manutenção.Observação
O campo Status da instância só será exibido caso a instância não tenha estado disponível no mês passado.