Métricas do Kubernetes Engine (OKE)

Saiba mais sobre as métricas emitidas pelo Kubernetes Engine (OKE).

Você pode monitorar a integridade, a capacidade e o desempenho dos clusters do Kubernetes gerenciados pelo Kubernetes Engine usando métricas , alarmes e notificações.

Este tópico descreve as métricas emitidas pelo Kubernetes Engine no namespace de métricas oci_oke.

Recursos: clusters, nós de trabalho

Visão Geral das Métricas do Serviço Kubernetes Engine (OKE)

As métricas do serviço Kubernetes Engine ajudam a monitorar clusters do Kubernetes, além de pools de nós e nós de trabalho individuais. Você pode usar dados de métricas para diagnosticar e solucionar problemas de cluster e pools de nós.

Enquanto a frequência varia por métrica, as métricas de serviço padrão geralmente têm uma frequência de 60 segundos (ou seja, pelo menos um ponto de dados publicado por minuto).

Para exibir um conjunto padrão de gráficos de métricas de um cluster na Console, selecione o cluster na página de lista Clusters e, em seguida, selecione a guia Monitoramento. Você também pode usar o serviço Monitoring para criar consultas personalizadas. Consulte Criando Consultas de Métricas.

Pré-requisitos

Políticas do IAM: Para monitorar recursos, você deve receber o tipo necessário de acesso em uma política gravada por um administrador, independentemente de você estar usando a Console ou a API REST com um SDK, uma CLI ou outra ferramenta. A política deve conceder acesso aos serviços e aos recursos de monitoramento. Se você tentar executar uma ação e receber uma mensagem de que não tem permissão ou que não está autorizado, entre em contato com o administrador para descobrir em qual tipo de acesso você recebeu e em qual compartimento você precisa trabalhar. Para obter mais informações sobre autorizações de usuário para monitoramento, consulte Políticas do IAM.

Por exemplo, para observar a condição dos nós em um cluster do Kubernetes, você deve ter recebido acesso usando uma instrução de política semelhante à seguinte:

Allow group <group-name> to read metrics in <location>

Métricas Disponíveis: oci_oke

As métricas listadas nas tabelas a seguir estão automaticamente disponíveis para quaisquer clusters do Kubernetes que você criar. Você não precisa ativar o monitoramento no recurso para obter essas métricas.

As métricas do serviço Kubernetes Engine incluem as seguintes dimensões:

RESOURCEID: O OCID do recurso ao qual a métrica se aplica.
RESOURCEDISPLAYNAME: O nome do recurso ao qual a métrica se aplica.
RESPONSECODE: O código de resposta enviado do servidor de API do Kubernetes.
RESPONSEGROUP: O grupo de códigos de resposta, com base no primeiro dígito do código de resposta (por exemplo, 2xx, 3xx, 4xx, 5xx).
CLUSTERID: O OCID do cluster ao qual a métrica se aplica.
NODEPOOLID: O OCID do pool de nós ao qual a métrica se aplica.
NODESTATE: O estado da instância de computação que hospeda o nó de trabalho. Por exemplo, ACTIVE, CREATING, DELETING, DELETED, FAILED, UPDATING, INACTIVE.
NODECONDITION: A condição do nó de trabalho, conforme indicado pelo servidor de API do Kubernetes. Por exemplo, Ready, MemoryPressure, PIDPressure, DiskPressure, NetworkUnavailable.
AVAILABILITYDOMAIN: O domínio de disponibilidade em que a instância de computação reside.
FAULTDOMAIN: O domínio de falha em que a instância de computação reside.


Métrica	Nome para Exibição da Métrica	Unidade	Descrição	Dimensões
`APIServerRequestCount`	Solicitações do Servidor de API	contagem	Número de solicitações recebidas pelo Servidor de API do Kubernetes.	`resourceId` `resourceDisplayName`
`APIServerResponseCount`	Contagem de Respostas do Servidor de API	contagem	Número de diferentes respostas que não sejam 200 (respostas de erro) enviadas do servidor de API do Kubernetes.	`resourceId` `resourceDisplayName` `responseCode` `responseGroup`
`UnschedulablePods`	Unschedulable Pods	contagem	Número de pods que o scheduler do Kubernetes não consegue programar. Não disponível em clusters que executam versões do Kubernetes anteriores à versão do 1.15.x.	`resourceId` `resourceDisplayName`
`NodeState`	Estado do Nó	contagem	Número de nós de computação em diferentes estados.	`resourceId` `clusterId` `nodepoolId` `resourceDisplayName` `nodeState` `nodeCondition` `availabilityDomain` `faultDomain`
`KubernetesNodeCondition`	Condição do Nó do Kubernetes	contagem	Número de nós de trabalho em condições diferentes, conforme indicado pelo servidor de API do Kubernetes.	`resourceId` `clusterId` `nodepoolId` `resourceDisplayName` `nodeCondition`

Usando a Console

Para exibir gráficos de métricas padrão para um único cluster

Na página da lista Clusters, selecione o nome do cluster cujas métricas você deseja exibir. Se precisar de ajuda para localizar a página de lista ou o cluster, consulte Listando Clusters.
Selecione a guia Monitoramento.

A guia Monitoramento exibe um gráfico para cada métrica do cluster emitida pelo namespace de métrica do Kubernetes Engine. Para ver métricas de um pool de Nós no cluster, exiba a guia Pools de nós, selecione o nome do pool de Nós e exiba a guia Monitoramento. Para ver as métricas de um nó de trabalho no pool de nós, exiba a guia Nós e selecione Exibir métricas no menu Ações (três pontos) ao lado do nó de trabalho. Para obter mais informações sobre as métricas emitidas, consulte Métricas Disponíveis: oci_oke.

Para obter mais informações sobre o monitoramento de métricas e o uso de alarmes, consulte Visão Geral do Serviço Monitoring. Para obter informações sobre notificações de alarmes, consulte Visão Geral do Serviço Notifications.

Não está vendo os dados de métricas esperados do cluster?

Se você não vir os dados de métricas esperados para um cluster, consulte as possíveis causas e resoluções a seguir.


Problema	Possível Causa	Como verificar	Resolução
Sei que o servidor de API do Kubernetes retornou algumas respostas de erro, mas o gráfico Contagem de Respostas do Servidor da API não as mostra.	As respostas podem ter sido retornadas fora do período coberto pelo gráfico Contagem de Respostas do Servidor da API.	Confirme se o Horário Inicial e o Horário Final abrangem o período em que as respostas foram retornadas.	Ajuste o Horário Inicial e o Horário Final conforme necessário.
Sei que o servidor de API do Kubernetes retornou algumas respostas de erro, mas o gráfico Contagem de respostas do servidor da API não as mostra, mesmo que as respostas tenham sido retornadas entre o Horário Inicial e o Horário Final.	Embora as respostas tenham sido retornadas entre o Horário Inicial e o Horário Final, o eixo x (janela de exibição de dados) pode estar excluindo as respostas.	Confirme se o eixo x (janela de exibição de dados) abrange o período em que as respostas foram retornadas.	Ajuste o eixo x (janela de exibição de dados) conforme necessário.
Quero ver dados nos gráficos como uma linha contínua ao longo do tempo, mas a linha tem lacunas.	Esse é o comportamento esperado. Se não houver dados de métricas para mostrar no intervalo selecionado, a linha de dados será descontínua.	Aumente o Intervalo (por exemplo, de 1 minuto para 5 minutos ou de 1 minuto para 1 hora).	Ajuste o Intervalo conforme necessário.

Usando a API

Para obter informações sobre como usar a API e assinar solicitações, consulte a documentação da API REST e Credenciais de Segurança. Para obter informações sobre SDKs, consulte SDKs e a CLI.

Use as seguintes APIs para monitoramento:

API Monitoring para métricas e alarmes
API Notifications para notificações (usada com alarmes)