Métricas do Kubernetes Engine (OKE)

Saiba mais sobre as métricas emitidas pelo Kubernetes Engine (OKE).

Você pode monitorar a integridade, a capacidade e o desempenho dos clusters do Kubernetes gerenciados pelo Kubernetes Engine usando métricas , alarmes e notificações.

Este tópico descreve as métricas emitidas pelo Kubernetes Engine no namespace de métricas oci_oke.

Recursos: clusters, nós de trabalho

Visão Geral das Métricas do Serviço Kubernetes Engine (OKE)

As métricas do serviço Kubernetes Engine ajudam a monitorar clusters do Kubernetes, além de pools de nós e nós de trabalho individuais. Você pode usar dados de métricas para diagnosticar e solucionar problemas de cluster e pools de nós.

Enquanto a frequência varia por métrica, as métricas de serviço padrão geralmente têm uma frequência de 60 segundos (ou seja, pelo menos um ponto de dados publicado por minuto).

Para exibir um conjunto padrão de gráficos de métricas na Console, navegue até o cluster desejado e clique em Métricas. Você também pode usar o serviço Monitoring para criar consultas personalizadas. Consulte Criando Consultas de Métricas.

Pré-requisitos

Políticas do serviço IAM: Para monitorar recursos, você deve ter o tipo necessário de acesso em uma política gravada por um administrador, quer esteja usando a Console ou a API REST com um SDK, CLI ou outra ferramenta. A política deve permitir acesso aos serviços de monitoramento e aos recursos que estão sendo monitorados. Se você tentar executar uma ação e receber uma mensagem de que não tem permissão ou não está autorizado, entre em contato com o administrador para descobrir em que tipo de acesso foi concedido e em qual compartimento você precisa trabalhar. Para obter mais informações sobre autorizações do usuário para monitoramento, consulte Políticas do Serviço IAM.

Métricas Disponíveis: oci_oke

As métricas listadas nas tabelas a seguir estão automaticamente disponíveis para quaisquer clusters do Kubernetes que você criar. Você não precisa ativar o monitoramento no recurso para obter essas métricas.

As métricas do serviço Kubernetes Engine incluem as seguintes dimensões:

RESOURCEID
O OCID  do recurso ao qual a métrica se aplica.
RESOURCEDISPLAYNAME
O nome do recurso ao qual a métrica se aplica.
RESPONSECODE
O código de resposta enviado do servidor de API do Kubernetes.
RESPONSEGROUP
O grupo de códigos de resposta, com base no primeiro dígito do código de resposta (por exemplo, 2xx, 3xx, 4xx, 5xx).
CLUSTERID
O OCID  do cluster ao qual a métrica se aplica.
NODEPOOLID
O OCID  do pool de nós ao qual a métrica se aplica.
NODESTATE
O estado da instância de computação que hospeda o nó de trabalho. Por exemplo, ACTIVE, CREATING, DELETING, DELETED, FAILED, UPDATING, INACTIVE.
NODECONDITION
A condição do nó de trabalho, conforme indicado pelo servidor de API do Kubernetes. Por exemplo, Ready, MemoryPressure, PIDPressure, DiskPressure, NetworkUnavailable.
AVAILABILITYDOMAIN
O domínio de disponibilidade em que a instância de computação reside.
FAULTDOMAIN
O domínio de falha em que a instância de computação reside.
Métrica Nome para Exibição da Métrica Unidade Descrição Dimensões
APIServerRequestCount Solicitações do Servidor de API contagem Número de solicitações recebidas pelo Servidor de API do Kubernetes.

resourceId

resourceDisplayName

APIServerResponseCount Contagem de Respostas do Servidor de API contagem Número de diferentes respostas que não sejam 200 (respostas de erro) enviadas do servidor de API do Kubernetes. resourceId

resourceDisplayName

responseCode

responseGroup

UnschedulablePods Pods Não Programáveis contagem Número de pods que o scheduler do Kubernetes não consegue programar. Não disponível em clusters que executam versões do Kubernetes anteriores à versão do 1.15.x. resourceId

resourceDisplayName

NodeState Estado do Nó contagem Número de nós de computação em diferentes estados. resourceId

clusterId

nodepoolId

resourceDisplayName

nodeState

nodeCondition

availabilityDomain

faultDomain

KubernetesNodeCondition Condição do Nó do Kubernetes contagem

Número de nós de trabalho em condições diferentes, conforme indicado pelo servidor de API do Kubernetes.

resourceId

clusterId

nodepoolId

resourceDisplayName

nodeCondition

Usando a Console

Para exibir gráficos de métricas padrão para um único cluster
  1. Abra o menu de navegação e clique em Serviços ao Desenvolvedor. Em Contêineres e Artefatos, clique em Clusters do Kubernetes (OKE).
  2. Selecione a região que você está usando o Kubernetes Engine.
  3. Selecione o compartimento que contém o cluster cujas métricas você deseja exibir.

    A página Clusters mostra todos os clusters no compartimento selecionado.

  4. Clique no nome do cluster para o qual deseja exibir métricas.
  5. Em Recursos, clique em Métricas.

    A guia Métricas exibe um gráfico para cada métrica do cluster emitida pelo namespace de métricas do Kubernetes Engine. Para ver as métricas de um pool de nós no cluster, exiba a guia Pools de Nós, clique no nome do pool de nós e exiba a guia Métricas. Para ver as métricas de um nó de trabalho no pool de nós, exiba a guia Nós e clique no link Exibir Métricas ao lado do nome do nó de trabalho. Para obter mais informações sobre as métricas emitidas, consulte Métricas Disponíveis: oci_oke.

    Para obter mais informações sobre o monitoramento de métricas e o uso de alarmes, consulte Visão Geral do Serviço Monitoring. Para obter informações sobre notificações de alarmes, consulte Visão Geral do Serviço Notifications.

Não está vendo os dados de métricas esperados do cluster?

Se você não vir os dados de métricas esperados para um cluster, consulte as possíveis causas e resoluções a seguir.

Problema Possível Causa Como verificar Resolução

Sei que o servidor de API do Kubernetes retornou algumas respostas de erro, mas o gráfico Contagem de Respostas do Servidor da API não as mostra.

As respostas podem ter sido retornadas fora do período coberto pelo gráfico Contagem de Respostas do Servidor da API. Confirme que o Horário Inicial e o Horário Final abrangem o período em que as respostas foram retornadas. Ajuste o Horário Inicial e o Horário Final conforme necessário.
Sei que o servidor de API do Kubernetes retornou algumas respostas de erro, mas o gráfico Contagem de respostas do servidor da API não as mostra, mesmo que as respostas tenham sido retornadas entre o Horário Inicial e o Horário Final. Embora as respostas tenham sido retornadas entre o Horário Inicial e o Horário Final, o eixo x (janela de exibição de dados) pode estar excluindo as respostas. Confirme se o eixo x (janela de exibição de dados) abrange o período em que as respostas foram retornadas. Ajuste o eixo x (janela de exibição de dados) conforme necessário.
Quero ver dados nos gráficos como uma linha contínua ao longo do tempo, mas a linha tem lacunas. Esse é o comportamento esperado. Se não houver dados de métricas para mostrar no intervalo selecionado, a linha de dados será descontínua. Aumente o Intervalo (por exemplo, de 1 minuto para 5 minutos ou de 1 minuto para 1 hora). Ajuste o Intervalo conforme necessário.