Verificando o Status e o Andamento do Plano de Upgrade do Private Cloud Appliance

O Upgrader no Private Cloud Appliance gera um plano de upgrade e o usa para orquestrar todas as operações de upgrade necessárias. Você pode exibir o status do upgrade atual a qualquer momento.

Nas versões de software 3.0.2-b892153 e posteriores, o Upgrader usa um plano de upgrade como um tipo de lista de verificação para executar todas as operações de upgrade, o que implica upgrades de cluster de gerenciamento completo, bem como upgrades de componentes individuais. O conceito dessa abordagem é descrito em mais detalhes em Plano de Atualização e Histórico.

O plano de upgrade é gerado quando o próprio Upgrader é atualizado para a versão mais recente. O plano se baseia em uma comparação dos componentes instalados atualmente no rack e das versões do componente de destino e dos pacotes mais recentes baixados no armazenamento compartilhado durante a preparação do ambiente de upgrade. O plano de upgrade resultante mostra para quais componentes um procedimento de upgrade precisa ser executado na próxima fase.

Todos os componentes devem ser atualizados em uma ordem prescrita. O plano de upgrade impedirá que um procedimento de upgrade de componente seja iniciado se as atualizações anteriores não tiverem sido concluídas. Uma mensagem de erro informa ao administrador quais componentes precisam ser submetidos a upgrade primeiro.

Observação

Em geral, o firmware pode ser atualizado sempre que novas versões forem disponibilizadas para o sistema. As atualizações de firmware podem ser aplicadas em nenhuma ordem específica e independentemente de outros componentes. O ZFS Storage Appliance é uma exceção: seu firmware deve ser atualizado antes de todos os outros componentes.

Esta é a ordem das operações impostas por meio do plano de atualização:

  1. Preparar ambiente de upgrade (Upgrade PreConfig)

  2. Atualizar o Upgrader (PreUpgrade)

  3. Firmware do ZFS Storage Appliance

  4. Nós de computação

  5. Sistema operacional host dos nós de gerenciamento

  6. MySQL banco de dados de cluster

  7. Serviço secreto (incluindo Etcd e Vault)

  8. Pacotes de orquestração de contêineres do Kubernetes (camada de plataforma)

  9. Microsserviços conteinerizados

  10. Imagens do Oracle Cloud Infrastructure

Verificar o Plano de Atualização

Após a preparação do ambiente de upgrade, todas as operações de upgrade necessárias para atualizar o sistema serão listadas no plano de upgrade. Sempre que um procedimento de upgrade for concluído com sucesso, o plano de upgrade será atualizado com o status mais recente: para componentes submetidos a upgrade, as versões de origem e de destino são idênticas e o flag "upgrade obrigatório" é desativado.

A qualquer momento, você pode verificar até que ponto o sistema progrediu no plano de atualização. Indica quais componentes já estão atualizados e quais ainda necessitam de atualização. O plano de atualização fornece uma visualização instantânea, que é precisa e útil no momento em que você a consulta. Para ver o andamento detalhado da atividade de upgrade, use a estrutura de jobs.

O plano de atualização pode ser exibido de duas maneiras:

  • Na IU da Web do Serviço, vá para Manutenção no menu de navegação e selecione Plano de Atualização.

  • Na CLI do Serviço, digite o seguinte comando:

    PCA-ADMIN> getUpgradePlan
    Data: 
      id                          component    currentBuild     targetBuild      currentVersion                   targetVersion                              requireReboot   timeEstimation (min)   requireUpgrade   impactedInfra   
      --                          ---------    ------------     -----------      --------------                   -------------                              -------------   --------------------   --------------   -------------   
      generic                     zfssa        3.0.2-b1300385   3.0.2-b1300385   2013.06.05.8.73.1-2.73.5701.1    2013.06.05.8.73.1-2.73.5701.1              false           45                     false            host,compute    
      100.96.2.64                 compute      3.0.2-b1300130   3.0.2-b1300385   oraclelinux-release-7.9-1.0.9    3.0.202.3.11.0.0.0.5.7ea3f4ccbf3e17fc...   true            50                     true             compute         
      100.96.2.65                 compute      3.0.2-b1300130   3.0.2-b1300385   oraclelinux-release-7.9-1.0.9    3.0.202.3.11.0.0.0.5.7ea3f4ccbf3e17fc...   true            50                     true             compute         
      100.96.2.66                 compute      3.0.2-b1300130   3.0.2-b1300385   oraclelinux-release-7.9-1.0.9    3.0.202.3.11.0.0.0.5.7ea3f4ccbf3e17fc...   true            50                     true             compute         
      100.96.2.33                 host         3.0.2-b1300130   3.0.2-b1300385   oraclelinux-release-7.9-1.0.13   3.0.202.3.11.0.0.0.5.7ea3f4ccbf3e17fc...   true            40                     true             host            
      100.96.2.34                 host         3.0.2-b1300130   3.0.2-b1300385   oraclelinux-release-7.9-1.0.13   3.0.202.3.11.0.0.0.5.7ea3f4ccbf3e17fc...   true            40                     true             host            
      100.96.2.35                 host         3.0.2-b1300130   3.0.2-b1300385   oraclelinux-release-7.9-1.0.13   3.0.202.3.11.0.0.0.5.7ea3f4ccbf3e17fc...   true            40                     true             host            
      generic                     mysql        3.0.2-b1300385   3.0.2-b1300385   8.0.36-1.1                       8.0.36-1.1                                 false           15                     false            host            
      generic                     etcd         3.0.2-b1300385   3.0.2-b1300385   3.5.6                            3.5.6                                      false           5                      false            host            
      generic                     vault        3.0.2-b1300385   3.0.2-b1300385   v1.7.1-3.10.0.0.0.4.g5f2d5af     v1.7.1-3.10.0.0.0.4.g5f2d5af               false           5                      false            host            
      generic                     kubernetes   3.0.2-b1300385   3.0.2-b1300385   1.25.16-2                        1.25.16-2                                  false           60                     false            host,compute    
      generic                     platform     3.0.2-b1300130   3.0.2-b1300385   None                             None                                       false           40                     true             host,compute    
      Oracle-Linux-7.9            ociImages    3.0.2-b1300130   3.0.2-b1300385   None                             2024.07.31_0                               false           5                      true             host            
      Oracle-Linux8-OKE-1.28.8    ociImages    3.0.2-b1300130   3.0.2-b1300385   None                             20241201                                   false           5                      true             host            
      Oracle-Solaris-11           ociImages    3.0.2-b1300130   3.0.2-b1300385   None                             2024.08.26_0                               false           5                      true             host            
      Oracle-Linux8-OKE-1.27.12   ociImages    3.0.2-b1300130   3.0.2-b1300385   None                             20241201                                   false           5                      true             host            
      Oracle-Linux8-OKE-1.26.15   ociImages    3.0.2-b1300130   3.0.2-b1300385   None                             20241201                                   false           5                      true             host            
      Oracle-Linux-9              ociImages    3.0.2-b1300130   3.0.2-b1300385   None                             2024.07.31_0                               false           5                      true             host            
      Oracle-Linux-8              ociImages    3.0.2-b1300130   3.0.2-b1300385   None                             2024.07.31_0                               false           5                      true             host            
      100.96.0.33                 ilom         3.0.2-b1300130   3.0.2-b1300385   5.1.4.20                         5.1.4.25                                   true            10                     true             host,compute    
      100.96.0.34                 ilom         3.0.2-b1300130   3.0.2-b1300385   5.1.4.20                         5.1.4.25                                   true            10                     true             host,compute    
      100.96.0.35                 ilom         3.0.2-b1300130   3.0.2-b1300385   5.1.4.20                         5.1.4.25                                   true            10                     true             host,compute    
      100.96.0.64                 ilom         3.0.2-b1300130   3.0.2-b1300385   5.1.4.20                         5.1.4.25                                   true            10                     true             host,compute    
      100.96.0.65                 ilom         3.0.2-b1300130   3.0.2-b1300385   5.1.4.20                         5.1.4.25                                   true            10                     true             host,compute    
      100.96.0.66                 ilom         3.0.2-b1300130   3.0.2-b1300385   5.1.4.20                         5.1.4.25                                   true            10                     true             host,compute    
      leaf                        switch       3.0.2-b1300385   3.0.2-b1300385   10.3.4a                          10.3.4a                                    false           60                     false            host,compute    
      spine                       switch       3.0.2-b1300385   3.0.2-b1300385   10.3.4a                          10.3.4a                                    false           60                     false            host,compute    
      mgmt                        switch       3.0.2-b1300385   3.0.2-b1300385   10.3.4a                          10.3.4a                                    false           60                     false            host,compute    

Procurar na Estrutura de Jobs

O Upgrader é integrado com a estrutura de trabalho do software controlador do appliance. Cada operação resulta em uma solicitação de serviço que aciona um ou mais jobs. Essas solicitações de serviço e jobs podem ser consultados. Seu status e propriedades detalhadas fornecem insights sobre a atividade do Upgrader no sistema.

Quando você insere um comando da CLI de Serviço, um ID de job e um ID de solicitação de serviço são retornados. Isso permite verificar o status, recuperar mais detalhes, localizar trabalhos relacionados no mesmo workflow e assim por diante. Quando você cria uma solicitação de upgrade (ou patch) usando a UI do Service Web, esses IDs não são exibidos na tela, mas você pode encontrá-los na tabela Jobs de Upgrade. A partir daí, você também pode fazer drill-down nas solicitações de serviço e jobs.

Usando a UI da Web de Serviço

Para executar uma operação de upgrade na UI da Web do Serviço, use o menu de navegação principal, vá para Manutenção e clique em Upgrade e Aplicação de Patches. Isso abre a página Jobs de Upgrade, que exibe todos os jobs de upgrade recentes em uma tabela, e permite que você crie uma nova solicitação de upgrade (ou patch) clicando no botão no canto superior direito.

A tabela Jobs de Upgrade permite que você navegue por todas as solicitações e jobs do Upgrader, para que você possa usá-la para rastrear o andamento da atividade do Upgrader atual, passada e programada.

  • A exibição de tabela padrão mostra os jobs com o comando associado, a solicitação de workflow, os timestamps e o resultado. O ID da Tarefa e o ID da Solicitação são hiperlinks para páginas com informações mais detalhadas.

    O menu Ações no lado direito de cada linha da tabela tem opções equivalentes aos hiperlinks e também permite copiar o ID do job ou da solicitação.

  • Quando filtrada por ID de solicitação, a tabela Jobs de Upgrade mostra apenas os jobs que foram criados como parte da solicitação de upgrade selecionada. Use-o para rastrear workflows de vários componentes e verificar quais jobs estão concluídos ou pendentes. Se ocorrer uma falha, você poderá ver qual job não foi concluído conforme esperado.

    Para retornar à exibição de tabela padrão, clique em Limpar filtro.

  • Para exibir os detalhes de um job, clique em seu ID de job na tabela Fazer Upgrade de Jobs. Além das informações mostradas na tabela de jobs, a página de detalhes Fazer Upgrade do Job contém o local do arquivo de log, os detalhes da execução do job e a lista de tarefas executadas como parte do job de upgrade.

    Se o job de upgrade não tiver sido concluído, você poderá eliminá-lo clicando no botão no canto superior direito da página.

  • Para exibir os detalhes de uma solicitação de upgrade, clique no ID da solicitação na tabela Jobs de Upgrade. Além das informações mostradas na tabela de jobs, a página de detalhes Status do Upgrade contém builds de origem e destino, detalhes do workflow e uma lista de jobs de upgrade associados.

    A lista de jobs de upgrade é igual à tabela principal Jobs de Upgrade filtrada por ID de solicitação. Ele também permite acessar a página de detalhes de cada job clicando no ID do job.

    Além da lista de jobs, a seção Recursos da página Status de Upgrade permite exibir para quais componentes o job foi concluído e quais componentes ainda estão pendentes.

Usando a CLI do Serviço

Quando você executa uma operação de upgrade na CLI do Serviço, uma solicitação é criada. O ID do job e o ID da solicitação de upgrade são retornados imediatamente. Use esses IDs para consultar jobs e solicitações e encontrar os detalhes necessários.

  • Ao trabalhar na CLI de Serviço, os IDs de solicitação do Serviço de Workflow do Upgrader são o elemento principal para acessar informações sobre a atividade do Upgrader. Caso você não tenha anotado o ID da solicitação ao inserir o comando ou esteja pesquisando dados de workflows anteriores, use o comando getUpgradeRequests para procurar o que deseja investigar.

    PCA-ADMIN> getUpgradeRequests
    Data:
      id
      --
      PREUPGRADE-61b56867-7966-4096-9c74-08efe8d2d0ad
      UWS-496e26aa-2923-46f1-a485-c086a005077a
      UWS-da5d70ba-09ea-4ef0-b8ea-84d9f44c5e62
      PREUPGRADE-a6aa2c0e-ceff-4de4-aa23-de7d21b06668
    [...]
  • Com o ID de solicitação de upgrade correto, você pode verificar o status e o andamento do workflow de upgrade. Use o comando getUpgradeStatus para exibir os detalhes do workflow, incluindo a lista de jobs, os componentes concluídos e pendentes.

    PCA-ADMIN> getUpgradeStatus requestId=UWS-910dd8fd-28b3-4f97-a909-02c26085266c
    Data:
      Request id = UWS-910dd8fd-28b3-4f97-a909-02c26085266c
      Status = Failed
      Composition ID = fullrack
      Type = ISO
      Previous Build = 3.0.2-b1333709
      Target Build = 3.0.2-b1337789
      Jobs 1 = 1741252377283-zfssa-81712
      Jobs 2 = 1741253904337-compute-72870
    [...]
      Jobs 13 = 1741269765197-platform-663307
      Completed Components 1 = zfssa(generic)
      Completed Components 2 = compute(100.96.2.64)
    [...]
      Pending Components 1 = compute(100.96.2.68)
      Pending Components 2 = host(100.96.2.33)
    [...]
  • Usando o ID da solicitação de upgrade, você também pode listar os jobs associados à solicitação e verificá-la em busca de status, andamento e possíveis problemas. Use o comando getUpgradeJobs para exibir a lista de jobs.

    PCA-ADMIN> getUpgradeJobs requestId=UWS-910dd8fd-28b3-4f97-a909-02c26085266c
    Data:
      id                                Upgrade Request Id                         Command Name   Result
      --                                ------------------                         ------------   ------
      1741269765197-platform-663307     UWS-910dd8fd-28b3-4f97-a909-02c26085266c   platform       Failed
      1741269703036-kubernetes-656961   UWS-910dd8fd-28b3-4f97-a909-02c26085266c   kubernetes     Passed
      1741267992739-host-422432         UWS-910dd8fd-28b3-4f97-a909-02c26085266c   host           Passed
      1741266155984-host-161315         UWS-910dd8fd-28b3-4f97-a909-02c26085266c   host           Passed
      1741264266152-host-11547          UWS-910dd8fd-28b3-4f97-a909-02c26085266c   host           Passed
      1741264201476-compute-87720       UWS-910dd8fd-28b3-4f97-a909-02c26085266c   compute        Passed
      1741264136546-compute-81124       UWS-910dd8fd-28b3-4f97-a909-02c26085266c   compute        Passed
      1741264070151-compute-74130       UWS-910dd8fd-28b3-4f97-a909-02c26085266c   compute        Passed
      1741252377283-zfssa-81712         UWS-910dd8fd-28b3-4f97-a909-02c26085266c   zfssa          Passed
  • Para investigar uma falha ou exibir informações mais detalhadas sobre um job específico, use o comando getUpgradeJob. Os detalhes do job incluem o caminho para o arquivo de log, a lista de tarefas completa e as mensagens de erro capturadas durante a execução.

    PCA-ADMIN> getUpgradeJob upgradeJobId=1741269765197-platform-663307
    Data:
      Upgrade Request Id = UWS-910dd8fd-28b3-4f97-a909-02c26085266c
      Composition Id = fullrack
      Name = platform
      Pid = 663307
      Host = pcamn01
      Log File = /nfs/shared_storage/pca_upgrader/log/pca-upgrader_platform_services_2025_03_06-14.02.45.log
      Arguments = {"component_names":null,"diagnostics":false,"display_task_plan":false,"dry_run_tasks":false,"expected_iso_checksum":null,[...]}
      Status = Failed
      Execution Time(sec) = 4068
      Tasks 1 - Name = Validate Upgrader Version
    [...]
      Tasks 31 - Name = Network Controllers Upgrade
      Tasks 31 - Description = Upgrade Network Controllers.
      Tasks 31 - Message = [{'name': 'auxiliary-metadata', 'version': 2, [...]
          Error: UPGRADE FAILED: release pcaswitchmgr failed, and has been rolled back due to atomic being set: 
          pre-upgrade hooks failed: timed out waiting for the condition }]
      Tasks 31 - Status = Failed
      Tasks 31 - Reason Phrase = Failed
      Tasks 31 - Execution Time(sec) = 1834
    [...]