Falha no Registro da Instância ou Estação de Gerenciamento

Uma instância ou estação de gerenciamento pode falhar ao se registrar no OS Management Hub por vários motivos.

Mensagens de erro comum do osmh-agent.log

Para solucionar problemas de registro, comece examinando o arquivo osmh-agent.log das mensagens de erro a seguir. Consulte Examinando Arquivos de Log em uma Instância para identificar a localização do arquivo de log.

Código e Mensagem Possível causa e solução

Http Status Code: 400. Error Code: MissingParameter.

Message: Registration profile is required for on-boarding instances, but none was provided.

Causa: Para a nuvem local ou de terceiros, o /etc/osmh-profile está ausente ou é inválido. Para instâncias do OCI, não havia um perfil padrão compatível no registro.

Resolução: Identifique e use um perfil compatível. Consulte Perfil inválido usado.

Http Status Code: 404. Error Code: NotAuthorizedOrNotFound.

Message: Authorization failed or requested resource not found.

Causa: As políticas atuais não permitem que o OS Management Hub acesse a instância. Geralmente, o grupo dinâmico não inclui regras de correspondência para o compartimento que contém a instância. Ou há uma instrução de política ausente ou incorreta.

Resolução: Verifique se as políticas estão corretas. Consulte Instrução de política incorreta ou regra de grupo dinâmico ausente.

Http Status Code: 409. Error Code: Conflict.

Message: Managed Instance location ON_PREMISE is not compatible with a Profile registration type of: OCI_LINUX

Causa: O perfil tem o tipo de instância errado. Por exemplo, a instância está localizada on-premises ou em uma nuvem de terceiros, mas o perfil é para um tipo de instância do OCI.

Resolução: Identifique e use um perfil compatível. Consulte Perfil inválido usado.

Http Status Code: 409. Error Code: Conflict.

Message: Invalid Managed Instance osFamily ORACLE_LINUX_8 does not match Profile osFamily: ORACLE_LINUX_7

Causa: O perfil tem o sistema operacional errado. Por exemplo, a instância é o Oracle Linux 8, mas o perfil é o Oracle Linux 7.

Resolução: Identifique e use um perfil compatível. Consulte Perfil inválido usado.

Http Status Code: 409. Error Code: IncorrectState.

Message: Station already has an instance associated

Causa: O perfil é para uma estação de gerenciamento e já está sendo usado por outra estação. Um perfil de estação de gerenciamento só pode ser usado uma vez.

Resolução: Identifique e use um perfil compatível para /etc/osmh-profile. Consulte Perfil inválido usado. Em seguida, tente novamente o registro.

TokenRefreshAuthenticationException: Token refresh failed due to authentication issues due to AuthenticationException

HTTP 401: NotAuthenticated

Unable to authenticate the request for ocid1.managementagent.oc1.iad.<ocid>

Causa: O agente do Management Agent Cloud Service (MACS) não está sendo executado conforme esperado.

Resolução: Verifique se o agente MACS está configurado corretamente e reinicie o agente. Consulte Diagnosticando e Solucionando Problemas do MACS.

Mensagens Comuns de Erro do Agente do Oracle Cloud

Para instâncias do OCI, use o status de plug-in do OS Management Hub Agent para solucionar problemas de registro. Na Console, na guia Oracle Cloud Agent da página de detalhes da instância do serviço Compute, você poderá ver uma das mensagens de erro a seguir.

Mensagem de Erro Possível causa e solução

O Agente do Hub de Gerenciamento do SO de Plug-in não está presente para a instância ocid1.instance.oc1.iad.<ocid>

Causa: O agente do OS Management Hub não está instalado na instância. Isso geralmente ocorre quando o serviço não pode acessar a instância por causa de um problema de política.

Resolução: Verifique se as suas instruções de política estão corretas e se a instância está incluída no grupo dinâmico. Consulte Instrução de política incorreta ou regra de grupo dinâmico ausente.

falha ao iniciar osmh-agent com [falha na imagem de pesquisa]. A instância não pôde se registrar no OS Management Hub.

Causa: O agente do OS Management Hub não pode ser iniciado na instância. Isso geralmente ocorre quando o serviço não pode acessar a instância por causa de um problema de política.

Resolução: Verifique se as suas instruções de política estão corretas e se a instância está incluída no grupo dinâmico. Se não estiver usando o domínio de identidades padrão, verifique se você especificou o domínio de identidades nas instruções de política. Consulte Instrução de política incorreta ou regra de grupo dinâmico ausente.

O perfil inválido foi usado

Verifique o arquivo osmh-agent.log e identifique o perfil correto

  1. Determinar a localização do arquivo osmh-agent.log.
  2. Examine o arquivo de log, procurando a palavra-chave "Error Code" para determinar se existe um erro de perfil. Consulte Mensagens de Erro Common osmh-agent.log.

    Por exemplo, para uma instância do Oracle Linux OCI:

    sudo grep -i "error code" /var/lib/oracle-cloud-agent/plugins/oci-osmh/osmh-agent/stateDir/log/osmh-agent.log

    Por exemplo, para uma instância local:

    sudo grep  -i "error code" /opt/oracle/mgmt_agent/plugins/osmh/stateDir/log/osmh-agent.log

    Por exemplo, para uma instância do Windows:

    Get-Content C:\Windows\ServiceProfiles\OCAOSMH\AppData\Local\OracleCloudAgent\plugins\oci-osmh\osmh-agent\stateDir\log\osmh-agent.log | Select-String -Pattern "Error Code"
  3. Identifique (ou crie) um perfil que corresponda à versão, à arquitetura e ao local do sistema operacional da instância que você está registrando.

Para atualizar o perfil das instâncias do OCI

  1. Abra o menu de navegação e selecione Observabilidade e Gerenciamento. Em OS Management Hub, selecione Instâncias.
  2. Em Escopo da lista, selecione o compartimento que contém a instância.
  3. Selecione o nome da instância.
  4. Selecione Definir perfil.
  5. Selecione o compartimento e o perfil correto a ser usado para registro.
  6. Selecione Definir.

    Pode levar alguns minutos para que o status da instância seja atualizado.

Para atualizar o perfil para instâncias de nuvem locais ou de terceiros:

  1. Veja os detalhes do perfil.
  2. Copie o conteúdo /etc/osmh-profile.
  3. Faça log-in na instância como um usuário com privilégios sudo.
  4. Substitua /etc/osmh-profile pelo perfil corrigido. A instância será registrada na próxima vez que o plug-in do OS Management Hub fizer check-in com o serviço.

Instrução de política incorreta ou regra de grupo dinâmico ausente

Se você encontrar os erros a seguir ao registrar uma instância, isso poderá indicar que as instruções de política ou as regras de grupo dinâmico não estão definidas corretamente.

O osmh-agent.log contém:

ERROR: failed to update managed instance: Error returned by  Service. Http Status Code: 404.
                    Error Code: NotAuthorizedOrNotFound. Opc request id: <requestID>. Message: Authorization failed or requested resource not found.
                    ...
                    Request Endpoint: PUT https://osmh.<region>.oci.oraclecloud.com/20220901/agent/managedInstances/ocid1.managementagent.oc1.iad.<ocid>

Ou a guia Oracle Cloud Agent na página de detalhes da instância do serviço Compute mostra uma das seguintes mensagens:

Plugin OS Management Hub Agent not present for instance ocid1.instance.oc1.iad.<ocid>
failed to start osmh-agent with [lookup image failed. The instance could not register with OS Management Hub.

Para resolver o problema, verifique se você configurou corretamente as instruções de política e as regras de grupo dinâmico. Geralmente, o grupo dinâmico não inclui a instância.

Verifique o seguinte:

  • Certifique-se de ter incluído uma regra de grupo dinâmico para cada compartimento e subcompartimento que contém instâncias que você deseja gerenciar pelo serviço. Os grupos dinâmicos não são compatíveis com herança de compartimento.
  • Se não estiver usando o domínio de identidades default, certifique-se de que cada instrução de política tenha o domínio de identidades antes do nome do grupo ou do grupo dinâmico (por exemplo, <identity_domain_name>/<dynamic_group_name>).

Consulte também: Solução de Problemas: Problemas de Política.

O sistema não pode ler /etc/sudoers.d

Para estações de gerenciamento, instâncias locais ou de nuvem de terceiros, o arquivo /etc/sudoers deve incluir /etc/sudoers.d para o Management Agent Cloud Service (MACS) para implantar o plug-in do OS Management Hub.

Isso é indicado pelo seguinte erro:

/opt/oracle/mgmt_agent/agent_inst/bin/setup.sh opts=/tmp/input.rsp
...
Starting plugin deployment for: [osmh]
Deploying service plugin(s)...Failed.
        Requested external plugins [osmh] could not be deployed

Onde /opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log mostra o seguinte:

[/bin/sudo, -n, /opt/oracle/mgmt_agent/agent_inst/bin/chown_recursive_ep.sh, chown_recursive, root:mgmt_agent, osmh], timeout=PT5M]

Para resolver o problema:

  1. Edite o arquivo /etc/sudoers.
    sudo visudo
  2. Adicione as seguintes linhas e salve o arquivo.
    ## Read drop-in files from /etc/sudoers.d (the # here does not mean a comment)
    #includedir /etc/sudoers.d
  3. Execute novamente o setup.sh. Consulte Registrando uma Instância Não OCI ou Registrando uma Estação de Gerenciamento.

A instância não foi registrada anteriormente

Se você tiver cancelado o registro de uma instância anteriormente no OS Management Hub, haverá etapas adicionais para registrá-la novamente no serviço. O processo depende do local da ocorrência.

Instâncias do OCI

O novo registro de uma instância do OCI não registrada falhará até que você remova o arquivo de cancelamento de registro na instância. Esse arquivo impede que a instância se registre no serviço. Quando você tenta registrar uma instância que contém esse arquivo, o plug-in do agente exibe o seguinte erro: started oci-osmh under unregistered mode.

Remova o seguinte arquivo antes de registrar a instância:

  • Oracle Linux

    /var/lib/oracle-cloud-agent/plugins/oci-osmh/osmh-agent-unregister
  • Windows 2019 e 2022

    C:\Windows\ServiceProfiles\OCAOSMH\AppData\Local\OracleCloudAgent\plugins\oci-osmh\osmh-agent-unregister
  • Windows 2016

    C:\Users\OCAOSMH\AppData\Local\OracleCloudAgent\plugins\oci-osmh\osmh-agent-unregister

Instâncias de nuvem locais ou de terceiros

O novo registro de uma instância que não é do OCI que foi registrada anteriormente pode exigir a instalação do Management Agent ou a implantação manual do plug-in do agente do OS Management Hub.

Para registrar novamente a instância:

  1. Faça log-in na instância como um usuário com privilégios sudo.
  2. Verifique o status do Agente de Gerenciamento.

    sudo systemctl status mgmt_agent
  3. Se o mgmt_agent não for encontrado, registre a instância como se fosse nova. Consulte Registrando uma Instância Não OCI. Ignore as demais etapas deste procedimento.
  4. Se o mgmt_agent estiver presente, inicie o agente e crie o arquivo /etc/osmh-profile:
    1. Inicie o mgmt_agent:

      sudo systemctl start mgmt_agent
    2. Crie o arquivo /etc/osmh-profile usando um editor de texto. Verifique se o nome do arquivo não tem extensão de arquivo.

      sudo vi /etc/osmh-profile
  5. Na Console, implante o plug-in do agente do OS Management Hub na instância.

    1. Na Console, navegue até Observabilidade e Gerenciamento. Em Management Agent, selecione Agentes.
    2. Em Escopo, selecione seu compartimento.
    3. Localize o agente correto localizando o nome do host na coluna Nome. Selecione o nome do agente na lista.
    4. Selecione Implantar plug-ins.
    5. Selecione OS Management Hub e, em seguida, Atualizar.
    6. Aguarde alguns minutos e, em seguida, verifique se a instância foi registrada.

SO não definido como hora atual

OS erros de timeout no registro podem ocorrer quando o horário na instância é diferente do horário usado no serviço OS Management Hub. Um desvio de relógio de mais de 5 minutos pode causar esses tipos de erros.

Durante o registro da estação de gerenciamento ou da instância, o seguinte erro é relatado ao executar o script /opt/oracle/mgmt_agent/agent_inst/bin/setup.sh:
Starting plugin deployment for: [osmh] 
Deploying service plugin(s)..............................Timed out.
Agent is unable to check if it deployed requested service plugin(s) successfully or not. Please check back later on the console.
  1. Determine se existe desvio de relógio verificando a data do ponto final do serviço managementagent em relação à instância ou à estação de gerenciamento.
    curl -s --head https://managementagent.<region>.oci.oraclecloud.com | grep Date
    date -u 

    Por exemplo:

    $ curl -s --head https://managementagent.us-phoenix-1.oci.oraclecloud.com | grep Date
    Date: Tue, 13 Jun 2023 15:42:17 GMT
    $ date -u
    Tue Jun 13 15:42:19 UTC 2023
  2. Se a data ou a hora na instância ou na estação de gerenciamento for diferente da hora relatada pelo serviço, atualize a hora do SO para corresponder ao serviço.

    Se forem usados recursos de sincronização de tempo, como Chrony ou NTP (Network Time Protocol), verifique sua configuração e operação.

    Por exemplo, execute os seguintes comandos para verificar a configuração:

    chronyc sources -a
    chronyc tracking