Métricas do Kubernetes Engine (OKE)
Saiba mais sobre as métricas emitidas pelo Kubernetes Engine (OKE).
Você pode monitorar a integridade, a capacidade e o desempenho dos clusters do Kubernetes gerenciados pelo Kubernetes Engine usando métricas , alarmes e notificações.
Este tópico descreve as métricas emitidas pelo Kubernetes Engine no namespace de métricas oci_oke
.
Recursos: clusters, nós de trabalho
Visão Geral das Métricas do Serviço Kubernetes Engine (OKE)
As métricas do serviço Kubernetes Engine ajudam a monitorar clusters do Kubernetes, além de pools de nós e nós de trabalho individuais. Você pode usar dados de métricas para diagnosticar e solucionar problemas de cluster e pools de nós.
Enquanto a frequência varia por métrica, as métricas de serviço padrão geralmente têm uma frequência de 60 segundos (ou seja, pelo menos um ponto de dados publicado por minuto).
Para exibir um conjunto padrão de gráficos de métricas na Console, navegue até o cluster desejado e clique em Métricas. Você também pode usar o serviço Monitoring para criar consultas personalizadas. Consulte Criando Consultas de Métricas.
Pré-requisitos
Políticas do serviço IAM: Para monitorar recursos, você deve ter o tipo necessário de acesso em uma política gravada por um administrador, quer esteja usando a Console ou a API REST com um SDK, CLI ou outra ferramenta. A política deve permitir acesso aos serviços de monitoramento e aos recursos que estão sendo monitorados. Se você tentar executar uma ação e receber uma mensagem de que não tem permissão ou não está autorizado, entre em contato com o administrador para descobrir em que tipo de acesso foi concedido e em qual compartimento você precisa trabalhar. Para obter mais informações sobre autorizações do usuário para monitoramento, consulte Políticas do Serviço IAM.
Métricas Disponíveis: oci_oke
As métricas listadas nas tabelas a seguir estão automaticamente disponíveis para quaisquer clusters do Kubernetes que você criar. Você não precisa ativar o monitoramento no recurso para obter essas métricas.
As métricas do serviço Kubernetes Engine incluem as seguintes dimensões:
- RESOURCEID
- O OCID do recurso ao qual a métrica se aplica.
- RESOURCEDISPLAYNAME
- O nome do recurso ao qual a métrica se aplica.
- RESPONSECODE
- O código de resposta enviado do servidor de API do Kubernetes.
- RESPONSEGROUP
- O grupo de códigos de resposta, com base no primeiro dígito do código de resposta (por exemplo, 2xx, 3xx, 4xx, 5xx).
- CLUSTERID
- O OCID do cluster ao qual a métrica se aplica.
- NODEPOOLID
- O OCID do pool de nós ao qual a métrica se aplica.
- NODESTATE
- O estado da instância de computação que hospeda o nó de trabalho. Por exemplo, ACTIVE, CREATING, DELETING, DELETED, FAILED, UPDATING, INACTIVE.
- NODECONDITION
- A condição do nó de trabalho, conforme indicado pelo servidor de API do Kubernetes. Por exemplo, Ready, MemoryPressure, PIDPressure, DiskPressure, NetworkUnavailable.
- AVAILABILITYDOMAIN
- O domínio de disponibilidade em que a instância de computação reside.
- FAULTDOMAIN
- O domínio de falha em que a instância de computação reside.
Métrica | Nome para Exibição da Métrica | Unidade | Descrição | Dimensões |
---|---|---|---|---|
APIServerRequestCount
|
Solicitações do Servidor de API | contagem | Número de solicitações recebidas pelo Servidor de API do Kubernetes. |
|
APIServerResponseCount
|
Contagem de Respostas do Servidor de API | contagem | Número de diferentes respostas que não sejam 200 (respostas de erro) enviadas do servidor de API do Kubernetes. | resourceId
|
UnschedulablePods
|
Pods Não Programáveis | contagem | Número de pods que o scheduler do Kubernetes não consegue programar. Não disponível em clusters que executam versões do Kubernetes anteriores à versão do 1.15.x. | resourceId
|
NodeState
|
Estado do Nó | contagem | Número de nós de computação em diferentes estados. | resourceId
|
KubernetesNodeCondition
|
Condição do Nó do Kubernetes | contagem |
Número de nós de trabalho em condições diferentes, conforme indicado pelo servidor de API do Kubernetes. |
resourceId
|
Usando a Console
- Abra o menu de navegação e clique em Serviços ao Desenvolvedor. Em Contêineres e Artefatos, clique em Clusters do Kubernetes (OKE).
- Selecione a região que você está usando o Kubernetes Engine.
-
Selecione o compartimento que contém o cluster cujas métricas você deseja exibir.
A página Clusters mostra todos os clusters no compartimento selecionado.
- Clique no nome do cluster para o qual deseja exibir métricas.
-
Em Recursos, clique em Métricas.
A guia Métricas exibe um gráfico para cada métrica do cluster emitida pelo namespace de métricas do Kubernetes Engine. Para ver as métricas de um pool de nós no cluster, exiba a guia Pools de Nós, clique no nome do pool de nós e exiba a guia Métricas. Para ver as métricas de um nó de trabalho no pool de nós, exiba a guia Nós e clique no link Exibir Métricas ao lado do nome do nó de trabalho. Para obter mais informações sobre as métricas emitidas, consulte Métricas Disponíveis: oci_oke.
Para obter mais informações sobre o monitoramento de métricas e o uso de alarmes, consulte Visão Geral do Serviço Monitoring. Para obter informações sobre notificações de alarmes, consulte Visão Geral do Serviço Notifications.
Se você não vir os dados de métricas esperados para um cluster, consulte as possíveis causas e resoluções a seguir.
Problema | Possível Causa | Como verificar | Resolução |
---|---|---|---|
Sei que o servidor de API do Kubernetes retornou algumas respostas de erro, mas o gráfico Contagem de Respostas do Servidor da API não as mostra. |
As respostas podem ter sido retornadas fora do período coberto pelo gráfico Contagem de Respostas do Servidor da API. | Confirme que o Horário Inicial e o Horário Final abrangem o período em que as respostas foram retornadas. | Ajuste o Horário Inicial e o Horário Final conforme necessário. |
Sei que o servidor de API do Kubernetes retornou algumas respostas de erro, mas o gráfico Contagem de respostas do servidor da API não as mostra, mesmo que as respostas tenham sido retornadas entre o Horário Inicial e o Horário Final. | Embora as respostas tenham sido retornadas entre o Horário Inicial e o Horário Final, o eixo x (janela de exibição de dados) pode estar excluindo as respostas. | Confirme se o eixo x (janela de exibição de dados) abrange o período em que as respostas foram retornadas. | Ajuste o eixo x (janela de exibição de dados) conforme necessário. |
Quero ver dados nos gráficos como uma linha contínua ao longo do tempo, mas a linha tem lacunas. | Esse é o comportamento esperado. Se não houver dados de métricas para mostrar no intervalo selecionado, a linha de dados será descontínua. | Aumente o Intervalo (por exemplo, de 1 minuto para 5 minutos ou de 1 minuto para 1 hora). | Ajuste o Intervalo conforme necessário. |
Usando a API
Para obter informações sobre como usar a API e assinar solicitações, consulte a documentação da API REST e Credenciais de Segurança. Para obter informações sobre SDKs, consulte SDKs e a CLI.
- API Monitoring para métricas e alarmes
- API Notifications para notificações (usada com alarmes)