Monitorando Clusters

Descubra como monitorar os clusters, pools de nós e nós que você criou usando o Kubernetes Engine (OKE).

Depois de criar um cluster, você pode monitorar o status do próprio cluster e dos nós e pools de nós que estão nele.

Além de monitorar o status geral de clusters, pools de nós e nós, você pode monitorar a integridade, a capacidade e o desempenho deles em um nível mais granular usando métricas, alarmes e notificações. Consulte Métricas do Kubernetes Engine (OKE).

Usando a Console

Para monitorar um cluster do Kubernetes:

  1. Abra o menu de navegação e selecione Serviços ao Desenvolvedor. Em Contêineres e Artefatos, selecione Clusters do Kubernetes (OKE).
  2. Escolha um Compartimento no qual você tem permissão para trabalhar.

    A coluna Status na página Lista de Clusters mostra um status resumido de cada cluster individual e seus nós de plano de controle. Os clusters podem ter um dos seguintes status:

    Status do Cluster Explicação Possível Motivo
    Criando O cluster está em processo de criação. O aplicativo está sendo implantado.
    Ativo O cluster está sendo executado normalmente. Os nós de plano de controle estão sendo executados normalmente.
    Com falha O cluster não está em execução por causa de um erro irrecuperável.

    Possíveis motivos:

    • um problema ao configurar balanceadores de carga
    • conflitos em faixas de rede
    Excluindo O cluster está em processo de exclusão. O aplicativo não é mais necessário; portanto, os recursos estão no processo de liberação. O aplicativo não é mais necessário; portanto, os recursos estão no processo de liberação.
    Excluído O cluster foi excluído. O aplicativo não é mais necessário; portanto, os recursos foram liberados. O aplicativo não é mais necessário; portanto, os recursos foram liberados.
    Atualizando A versão do Kubernetes nos nós de plano de controle está no processo de upgrade. Uma versão recém-suportada do Kubernetes ficou disponível.

    Observe que o status resumido do cluster não está necessariamente relacionado de forma direta ao status dos pools de nós e nós no cluster.

  3. Na página Lista de clusters, selecione o nome do cluster para o qual você deseja ver o status detalhado.

  4. Exiba a guia Métricas do cluster para ver informações mais detalhadas sobre a integridade, a capacidade e o desempenho do cluster. Consulte Métricas do OKE (Kubernetes Engine).
  5. Exiba a guia Pools de Nós para ver o status resumido de cada pool de nós do cluster.
  6. Na guia Pool de Nós, selecione o nome de um pool de nós para o qual você deseja ver o status detalhado.

    Os status dos pools de nós incluem o seguinte:

    Status do Pool de Nós Explicação Possível Motivo
    Criando O pool de nós está no processo de criação. O cluster está em processo de criação.
    Ativo O pool de nós está sendo executado normalmente. Os nós de trabalho no pool de nós estão em execução normalmente.
    Excluído O pool de nós foi excluído. O aplicativo não é mais necessário; portanto, os recursos foram liberados.
    Requer atenção Pelo menos um dos nós no pool de nós tem um problema que requer investigação. Falha na tentativa de encerrar um nó no pool de nós (por exemplo, para reduzir o pool de nós) porque o nó não pôde ser drenado e conectado dentro do período de tolerância de remoção. Consulte Cordonando e Drenando Nós Gerenciados Antes de Encerrar ou Encerrar.
  7. Exiba a guia Métricas do pool de nós para ver informações mais detalhadas sobre a integridade, a capacidade e o desempenho do pool de nós. Consulte Métricas do OKE (Kubernetes Engine).
  8. Exiba a guia Nós para ver o status resumido de cada nó de trabalho do pool de nós.

    Os nós de trabalho podem ter um dos seguintes status:

    Status do Nó Explicação Possível Motivo
    Criando O nó está sendo criado. Instância de computação no processo de criação.
    Ativo O nó está sendo executado normalmente. O nó está sendo executado normalmente.
    Atualizando O nó está em processo de atualização.

    O Kubernetes Engine está executando uma operação no nó.

     
    Excluindo O nó está em processo de exclusão. O aplicativo não é mais necessário; portanto, os recursos estão no processo de liberação.
    Excluído O nó foi excluído. O aplicativo não é mais necessário; portanto, os recursos foram liberados.
    Inativo O nó ainda existe, mas não está em execução. O recurso de computação está com o status Interrompido, Interrompendo ou Indisponível para Manutenção.
  9. Selecione Exibir Métricas ao lado de um nó de trabalho para ver informações mais granulares sobre a integridade, a capacidade e a performance desse nó. Consulte Métricas do OKE (Kubernetes Engine).