Operações de Manutenção do Nó de Computação

Para operações de manutenção, incluindo upgrade ou aplicação de patches de software do Private Cloud Appliance, e quando o reparo de hardware é necessário, os nós de computação devem ser colocados no modo de manutenção. Isso requer a evacuação de instâncias de computação em execução e o bloqueio do nó de qualquer outra operação do sistema.

Evacuando um Nó de Computação

Algumas operações de nó de computação só poderão ser executadas se o nó de computação não tiver instâncias de computação em execução. Os administradores podem migrar todas as instâncias em execução de um nó de computação, também conhecido como evacuação do nó de computação.

Por padrão, se houver recursos suficientes disponíveis, as instâncias em execução serão migradas ao vivo para outros nós de computação no mesmo domínio de falha.

Importante

Antes de executar uma evacuação do nó de computação, verifique qual será o comportamento de qualquer instância que não possa ser migrada ao vivo para outro nó de computação no mesmo domínio de falha.

Este tópico e a Configuração de Alta Disponibilidade para Instâncias do Serviço Compute descrevem como verificar definições e como as instâncias são tratadas para diferentes definições.

Não há suporte para a migração dinâmica entre diferentes tipos de nós de computação. Por exemplo, você não pode migrar instâncias de computação de um Oracle Server X10 para um Oracle Server X11.

Verifique se a aplicação rigorosa do domínio de falha está definida.

  • Quando a imposição estrita do domínio de falha está desativada (o FD estrito está definido como Desativado na IU da Web do Serviço ou Strict FD Enabled é false na CLI do Serviço), as instâncias que não podem ser migradas ao vivo para outro nó de computação no mesmo domínio de falha são migradas ao vivo para outro domínio de falha se houver recursos suficientes disponíveis nesse domínio de falha.

  • Quando a imposição rigorosa do domínio de falha está ativada (o FD rigoroso está definido como Ativado na IU da Web do Serviço ou Strict FD Enabled é true na CLI do Serviço), as instâncias que não podem ser migradas ao vivo para outro nó de computação no mesmo domínio de falha não são migradas; essas instâncias ainda estão em execução no nó de computação que você deseja evacuar.

Ative ou desative a imposição rigorosa do domínio de falha para definir se as instâncias que não podem migrar ao vivo para outros nós de computação no mesmo domínio de falha serão migradas ao vivo para outro domínio de falha ou ainda serão executadas no mesmo nó de computação depois que você tentar evacuar o nó de computação.

Se algumas instâncias não puderem ser migradas ao vivo, seja porque o domínio de falha atual não pode acomodá-las e a aplicação estrita do domínio de falha estiver ativada ou porque a aplicação estrita do domínio de falha está desativada, mas outros domínios de falha também não podem acomodar as instâncias, você poderá executar novamente a operação de migração com a opção de imposição especificada. Quando a opção de imposição é especificada, o serviço Compute interrompe todas as instâncias que não conseguem fazer a migração dinâmica, permitindo que a evacuação continue.

Reiniciar instâncias interrompidas. Se as instâncias tiverem sido interrompidas pelo serviço Compute (não interrompidas manualmente por um administrador) e você quiser que elas sejam restauradas automaticamente para execução quando os recursos estiverem disponíveis, verifique se a propriedade Recuperação Automática do serviço Compute está ativada e se a ação de recuperação de disponibilidade da instância está definida como RESTORE_INSTANCE. Consulte Exibindo e Definindo a Configuração do Serviço Compute e Configurando o Estado de Recuperação de uma Instância Interrompida.

As instâncias poderão ser interrompidas pelo serviço Compute se a opção force for usada quando um administrador evacuar um nó de computação ou em resposta a uma interrupção não planejada do nó de computação. Você pode alterar a definição de Recuperação Automática a qualquer momento antes ou depois que os recursos se tornarem disponíveis após uma manutenção administrativa ou uma interrupção não planejada para reiniciar as instâncias interrompidas pelo serviço Compute. Se a ação de recuperação de disponibilidade da instância for definida como STOP_INSTANCE, a instância permanecerá interrompida mesmo que a propriedade Recuperação Automática esteja ativada. Se a ação de recuperação de disponibilidade da instância for alterada posteriormente para RESTORE_INSTANCE, uma passagem de Recuperação Automática subsequente reiniciará a instância.

Retornar instâncias realocadas. Se as instâncias forem migradas ao vivo para outro domínio de falha (deslocadas) e você quiser que elas sejam retornadas ao domínio de falha selecionado (o domínio de falha especificado na configuração da instância) quando os recursos estiverem disponíveis, verifique se a propriedade Resolução Automática do serviço Compute está ativada. Consulte Exibindo e Definindo a Configuração do Serviço Compute e Comandos de Configuração do Serviço Compute. Você pode definir a propriedade Resolver Automaticamente a qualquer momento antes ou depois da conclusão da evacuação do nó de computação para realocar qualquer instância deslocada.

Use os procedimentos a seguir para executar a operação de migração.

Evacuação do Nó de Computação: Antes de Começar
  1. Verifique o domínio de falha e os recursos do nó de computação. Consulte Monitorando a Capacidade do Sistema. Com base nessas informações, decida se deve executar qualquer uma das seguintes ações:

    • Encerre as instâncias que não são mais necessárias.

    • Reconfigure algumas instâncias para usar menos recursos. Por exemplo, especifique outra forma.

    • Reconfigure algumas instâncias para especificar outro domínio de falha.

    • Interrompa algumas instâncias enquanto executa a evacuação do nó de computação.

    • Faça shutdown de instâncias não migráveis. Veja o próximo passo.

    • Especifique a opção de imposição na operação de migração para interromper todas as instâncias que não podem ser migradas ao vivo. Consulte a discussão acima sobre a ação de recuperação de disponibilidade da instância e a configuração de Recuperação Automática.

  2. Embora seja possível especificar a opção force na operação vmMigrate para interromper suavemente qualquer instância que não possa ser migrada ao vivo, a melhor prática é fazer shutdown normal de instâncias não migráveis antes da migração para que todas as cargas de trabalho em execução na instância fiquem em bom estado.

    1. Exibir a lista de instâncias não migráveis.

      Copie o ID das instâncias em execução para poder desativá-las.

      PCA-ADMIN> getNonMigratableInstances
      Data:
        id                           Display Name  Compute Node Id  Domain State
        --                           ------------  ---------------  ------------
        ocid1.instance.unique_ID     instance202   CN_ID            running
        ocid1.instance.unique_ID     kqh027        CN_ID            shut off
    2. Desligue as instâncias em execução.

      Consulte Interrompendo, Iniciando e Redefinindo uma Instância.

  3. Desative o provisionamento no nó de computação.

    Consulte Desativando o Provisionamento do Nó de Computação.

Usando a UI da Web de Serviço
  1. No menu de navegação, clique em Unidades de rack.

  2. Na tabela Unidades de Rack, localize o nome do host do nó de computação que você deseja evacuar. Clique no menu Ações desse host e clique na opção Migrar Todos os Vms.

    Como alternativa, na tabela Unidades de Rack, clique no nome do host do nó de computação que você deseja evacuar para exibir a página de detalhes desse nó de computação. Clique no menu Controles e clique na opção Migrar Todas as Vms.

  3. Na caixa de diálogo Confirmar Migração de VMs, escolha se deseja forçar a interrupção de qualquer instância que não possa ser migrada.

    Por padrão, a opção de imposição de interrupção não está ativada e as instâncias que não podem ser migradas ainda estarão em execução no nó após a conclusão da operação de migração. Para forçar a interrupção de instâncias que não podem ser migradas, ative a opção de interrupção de imposição na caixa de diálogo Confirmar Migração de VMs.

  4. Na caixa de diálogo Confirmar Migração de VMs, clique no botão Migrar.

    O serviço Compute migra as instâncias em execução para outros nós de computação se houver recursos suficientes disponíveis e as definições de Alta Disponibilidade forem configuradas para permitir isso. Se a opção Forçar tiver sido especificada, todas as instâncias que não puderam ser migradas serão interrompidas temporariamente. Se nenhuma instância puder ser migrada e a imposição não tiver sido especificada, essas instâncias permanecerão em execução no nó de computação que você está tentando evacuar.

Usando a CLI do Serviço
  1. Exiba a lista de nós de computação.

    Copie o ID do nó de computação que você deseja evacuar.

    PCA-ADMIN> list ComputeNode
    Data:
      id                                     name       provisioningState   provisioningType
      --                                     ----       -----------------   ----------------
      3e62bf25-a26c-407e-ab8b-df01a4ad98b6   pcacn002   Provisioned         KVM
      f7b8356b-052f-4911-babb-447e6ab9c78d   pcacn003   Provisioned         KVM
      4e06ebdf-faed-484e-996d-d77af786f123   pcacn001   Provisioned         KVM
  2. Use o comando migrateVm para migrar todas as instâncias de computação em execução fora do nó de computação. Para interromper todas as instâncias que não foram migradas, defina a opção force:

    PCA-ADMIN> migrateVm id=7a0236f4-b00e-461d-93a0-b22673a18d9c force=true
    JobId: 6f1e94bc-7d5b-4002-ada9-7d4b504a2599

    O serviço Compute migra as instâncias em execução para outros nós de computação se houver recursos suficientes disponíveis e as definições de Alta Disponibilidade forem configuradas para permitir isso. Se force=true tiver sido especificado, todas as instâncias que não puderam ser migradas serão interrompidas temporariamente. Se não for possível migrar instâncias e force=true não tiver sido especificado, essas instâncias permanecerão em execução no nó de computação que você está tentando evacuar.

    Use o ID do job para verificar o status do comando migrateVm.

    PCA-ADMIN> show Job id=6f1e94bc-7d5b-4002-ada9-7d4b504a2599
    [...]
      Done = true
      Name = MODIFY_TYPE
      Run State = Succeeded

Desativando o Provisionamento do Nó de Computação

Várias operações de nó de computação só podem ser executadas com a condição de que o provisionamento tenha sido desativado. Siga estas instruções para impor e liberar um bloqueio de provisionamento.

Usando a UI da Web de Serviço
  1. No menu de navegação, clique em Unidades de rack.

  2. Na tabela Unidades de Rack, clique no nome do host do nó de computação ao qual você deseja fazer alterações.

    A página de detalhes do nó de computação é exibida.

  3. No canto superior direito da página, clique em Controles e selecione o comando Bloqueio de Provisionamento.

    Quando a janela de confirmação for exibida, clique em Bloquear para continuar.

    Após a conclusão bem-sucedida, a guia Informações do Nó de Computação mostra Provisionamento Bloqueado = Sim.

  4. Para liberar o bloqueio de provisionamento, clique em Controles e selecione o comando Desbloqueio de Provisionamento.

    Quando a janela de confirmação for exibida, clique em Desbloquear para continuar.

    Após a conclusão bem-sucedida, a guia Informações do Nó de Computação mostra Provisionamento Bloqueado = Não.

Usando a CLI do Serviço
  1. Exiba a lista de nós de computação.

    Copie o ID do nó de computação cujas operações de provisionamento você deseja desativar.

    PCA-ADMIN> list ComputeNode
    Data:
      id                                     name       provisioningState   provisioningType
      --                                     ----       -----------------   ----------------
      3e62bf25-a26c-407e-ab8b-df01a4ad98b6   pcacn002   Provisioned         KVM
      f7b8356b-052f-4911-babb-447e6ab9c78d   pcacn003   Provisioned         KVM
      4e06ebdf-faed-484e-996d-d77af786f123   pcacn001   Provisioned         KVM
  2. Defina um bloqueio de provisionamento no nó de computação.

    PCA-ADMIN> provisioningLock id=f7b8356b-052f-4911-babb-447e6ab9c78d
    JobId: 6ee78c8a-e227-4d31-a770-9b9c96085f3f

    Use o ID do job para verificar o status do seu comando.

    PCA-ADMIN> show Job id=6ee78c8a-e227-4d31-a770-9b9c96085f3f
    [...]
      Done = true
      Name = MODIFY_TYPE
      Run State = Succeeded
  3. Quando o job for concluído, confirme se o nó de computação está sob bloqueio de provisionamento.

    PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d
    [...]
      Provisioning State = Provisioned
      [...]
      Provisioning Locked = true
      Maintenance Locked = false

    Todas as operações de provisionamento agora ficam desativadas até que o bloqueio seja liberado.

  4. Para liberar o bloqueio de provisionamento, use este comando:

    PCA-ADMIN> provisioningUnlock id=f7b8356b-052f-4911-babb-447e6ab9c78d
    JobId: 523892e8-c2d4-403c-9620-2f3e94015b46

    Use o ID do job para verificar o status do seu comando.

    PCA-ADMIN> show Job id=523892e8-c2d4-403c-9620-2f3e94015b46
    [...]
      Done = true
      Name = MODIFY_TYPE
      Run State = Succeeded
  5. Quando o job for concluído, confirme se o bloqueio de provisionamento foi liberado.

    PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d
    [...]
      Provisioning State = Provisioned
      [...]
      Provisioning Locked = false
      Maintenance Locked = false

Bloqueando um Nó de Computação para Manutenção

Para operações de manutenção, os nós de computação devem ser colocados no modo de manutenção. Siga estas instruções para impor e liberar um bloqueio de manutenção. Para poder bloquear um nó de computação para manutenção, desative o provisionamento primeiro. As operações de manutenção só poderão ser executadas se o nó de computação não tiver instâncias de computação em execução.

Cuidado

Dependendo da configuração de alta disponibilidade do serviço Compute, as migrações automáticas de instância podem impedir o bloqueio bem-sucedido de um nó de computação. Consulte Configuração de Alta Disponibilidade para Instâncias do Serviço Compute. Esta situação é mais provável de ocorrer quando a capacidade de computação disponível é limitada.

  • As operações de recuperação ou migração da instância após uma interrupção do nó de computação podem causar falha em um bloqueio de manutenção. Os nós de computação envolvidos nas migrações de instâncias rejeitarão o bloqueio de manutenção até que as migrações sejam concluídas.

  • As instâncias deslocadas poderão ser migradas de volta ao domínio de falha original quando um bloqueio de manutenção do nó de computação for liberado. Um nó de computação do qual uma instância deslocada é migrada de volta rejeitará o bloqueio de manutenção até que a migração seja concluída.

  • A migração de uma instância geralmente não leva mais de 30 segundos. No entanto, instâncias grandes e cargas de trabalho pesadas aumentam o tempo necessário.

  • No caso de uma instância ficar presa no estado de movimentação e a migração falhar na conclusão, seu nó de computação do host não poderá ser bloqueado para manutenção. Entre em contato com a Oracle para obter assistência.

Usando a UI da Web de Serviço
  1. Certifique-se de que o provisionamento tenha sido desativado no nó de computação.

  2. Certifique-se de que o nó de computação não tenha instâncias ativas. Eles devem ser migrados ou desligados.

  3. No menu de navegação, clique em Unidades de rack.

  4. Na tabela Unidades de Rack, clique no nome do host do nó de computação que requer manutenção.

    A página de detalhes do nó de computação é exibida.

  5. No canto superior direito da página, clique em Controles e selecione o comando Bloqueio de Manutenção.

    Quando a janela de confirmação for exibida, clique em Bloquear para continuar.

    Após a conclusão bem-sucedida, a guia Informações do Nó de Computação mostra Manutenção Bloqueada = Sim.

  6. Para liberar o bloqueio de manutenção, clique em Controles e selecione o comando Desbloqueio de Manutenção.

    Quando a janela de confirmação for exibida, clique em Desbloquear para continuar.

    Após a conclusão bem-sucedida, a guia Informações do Nó de Computação mostra Manutenção Bloqueada = Não.

Usando a CLI do Serviço
  1. Exiba a lista de nós de computação.

    Copie o ID do nó de computação que requer manutenção.

    PCA-ADMIN> list ComputeNode
    Data:
      id                                     name       provisioningState   provisioningType
      --                                     ----       -----------------   ----------------
      3e62bf25-a26c-407e-ab8b-df01a4ad98b6   pcacn002   Provisioned         KVM
      f7b8356b-052f-4911-babb-447e6ab9c78d   pcacn003   Provisioned         KVM
      4e06ebdf-faed-484e-996d-d77af786f123   pcacn001   Provisioned         KVM
  2. Certifique-se de que o provisionamento tenha sido desativado no nó de computação.

  3. Bloqueie o nó de computação para manutenção.

    PCA-ADMIN> maintenanceLock id=f7b8356b-052f-4911-babb-447e6ab9c78d
    JobId: e46f6603-2af2-4df4-a0db-b15156491f88

    Use o ID do job para verificar o status do seu comando.

    PCA-ADMIN> show Job id=e46f6603-2af2-4df4-a0db-b15156491f88
    [...]
      Done = true
      Name = MODIFY_TYPE
      Run State = Succeeded
  4. Quando o job for concluído, confirme se o nó de computação foi bloqueado para manutenção.

    PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d
    [...]
      Provisioning State = Provisioned
      [...]
      Provisioning Locked = true
      Maintenance Locked = true

    O nó de computação agora está pronto para manutenção.

  5. Para liberar o bloqueio de manutenção, use este comando:

    PCA-ADMIN> maintenanceUnlock id=f7b8356b-052f-4911-babb-447e6ab9c78d
    JobId: 625af20e-4b49-4201-879f-41d4405314c7

    Use o ID do job para verificar o status do seu comando.

    PCA-ADMIN> show Job id=625af20e-4b49-4201-879f-41d4405314c7
    [...]
      Done = true
      Name = MODIFY_TYPE
      Run State = Succeeded
  6. Quando o job for concluído, confirme se o bloqueio de provisionamento foi liberado.

    PCA-ADMIN> show ComputeNode id=f7b8356b-052f-4911-babb-447e6ab9c78d
    [...]
      Provisioning State = Provisioned
      [...]
      Provisioning Locked = true
      Maintenance Locked = false