Metriche OKE (Kubernetes Engine)

Scopri le metriche emesse da Kubernetes Engine (OKE).

Puoi monitorare lo stato, la capacità e le prestazioni dei cluster Kubernetes gestiti da Kubernetes Engine utilizzando metriche , allarmi e notifiche.

Questo argomento descrive le metriche emesse da Kubernetes Engine nello spazio di nomi delle metriche oci_oke.

Risorse: cluster, nodi di lavoro

Panoramica delle metriche dei servizi OKE (Kubernetes Engine)

Le metriche del motore Kubernetes ti aiutano a monitorare i cluster Kubernetes, insieme ai pool di nodi e ai singoli nodi di lavoro. È possibile utilizzare i dati delle metriche per diagnosticare e risolvere i problemi relativi a cluster e pool di nodi.

Mentre la frequenza varia in base alla metrica, le metriche di servizio predefinite in genere hanno una frequenza di 60 secondi, ovvero almeno un datapoint inviato al minuto.

Per visualizzare un set predefinito di grafici delle metriche nella console, andare al cluster a cui si è interessati, quindi selezionare Metriche. È inoltre possibile utilizzare il servizio di monitoraggio per creare query personalizzate. Vedere Creazione di query sulle metriche.

Prerequisiti

Criteri IAM: per monitorare le risorse, è necessario disporre del tipo di accesso richiesto in un criterio scritto da un amministratore, indipendentemente dal fatto che si stia utilizzando la console o l'API REST con un SDK, un'interfaccia CLI o un altro strumento. Il criterio deve consentire l'accesso sia ai servizi di monitoraggio che alle risorse monitorate. Se si tenta di eseguire un'azione e si riceve un messaggio che informa che non si dispone dell'autorizzazione o che non si è autorizzati, contattare l'amministratore per scoprire il tipo di accesso concesso e il compartimento in cui è necessario lavorare. Per ulteriori informazioni sulle autorizzazioni utente per il monitoraggio, vedere Criteri IAM.

Ad esempio, per osservare la condizione dei nodi in un cluster Kubernetes, è necessario disporre dell'accesso mediante un'istruzione criterio simile alla seguente:

Allow group <group-name> to read metrics in <location>

Metriche disponibili: oci_oke

Le metriche elencate nelle tabelle seguenti sono automaticamente disponibili per qualsiasi cluster Kubernetes creato. Non è necessario abilitare il monitoraggio sulla risorsa per ottenere queste metriche.

I parametri del motore Kubernetes includono le dimensioni riportate di seguito.

RESOURCEID
L'OCID della risorsa a cui si applica la metrica.
NOME RIPRODUZIONE RISORSE
Nome della risorsa a cui viene applicata la metrica.
CODICE RISPOSTA
Codice di risposta inviato dal server API Kubernetes.
GRUPPO DI RISPOSTE
Gruppo di codici di risposta, basato sulla prima cifra del codice di risposta (ad esempio, 2xx, 3xx, 4xx, 5xx).
CLUSTERID
L'OCID del cluster a cui si applica la metrica.
NODEPOOLID
OCID del pool di nodi a cui si applica la metrica.
NODESTATE
Stato dell'istanza di computazione che ospita il nodo di lavoro. Ad esempio, ACTIVE, CREATING, DELETING, DELETED, FAILED, UPDATING, INACTIVE.
NODECONDIZIONE
Condizione del nodo di lavoro, come indicato dal server API Kubernetes. Ad esempio, Pronto, MemoryPressure, PIDPressure, DiskPressure, NetworkUnavailable.
DOMINIO DI DISPONIBILITÀ
Il dominio di disponibilità in cui risiede l'istanza di computazione.
DOMINIO DI ERRORE
Il dominio di errore in cui risiede l'istanza di computazione.
Parametro Nome visualizzato metrica Unità descrizione; Dimensioni
APIServerRequestCount Richieste server API Conteggio Numero di richieste ricevute dal server API Kubernetes.

resourceId

resourceDisplayName

APIServerResponseCount Conteggio risposte server API Conteggio Numero di risposte diverse non 200 (ovvero risposte di errore) inviate dal server API Kubernetes. resourceId

resourceDisplayName

responseCode

responseGroup

UnschedulablePods Pod non pianificabili Conteggio Numero di pod che lo scheduler Kubernetes non è in grado di pianificare. Non disponibile nei cluster su cui sono in esecuzione le versioni di Kubernetes precedenti alla 1.15.x. resourceId

resourceDisplayName

NodeState Stato nodo Conteggio Numero di nodi di calcolo con stati diversi. resourceId

clusterId

nodepoolId

resourceDisplayName

nodeState

nodeCondition

availabilityDomain

faultDomain

KubernetesNodeCondition Condizione nodo Kubernetes Conteggio

Numero di nodi di lavoro in condizioni diverse, come indicato dal server API Kubernetes.

resourceId

clusterId

nodepoolId

resourceDisplayName

nodeCondition

Utilizzo di Console

Per visualizzare i grafici delle metriche predefiniti per un singolo cluster
  1. Aprire il menu di navigazione e selezionare Developer Services. In Container e artifact, selezionare Cluster Kubernetes (OKE).
  2. Seleziona l'area che stai utilizzando con Kubernetes Engine.
  3. Selezionare il compartimento contenente il cluster per il quale si desidera visualizzare le metriche.

    La pagina Cluster mostra tutti i cluster nel compartimento selezionato.

  4. Selezionare il nome del cluster per il quale si desidera visualizzare le metriche.
  5. In Risorse, selezionare Metriche.

    La scheda Metriche visualizza un grafico per ogni metrica per il cluster emessa dallo spazio di nomi delle metriche del motore Kubernetes. Per visualizzare le metriche per un pool di nodi nel cluster, visualizzare la scheda Pool di nodi, selezionare il nome del pool di nodi e visualizzare la scheda Metriche. Per visualizzare le metriche per un nodo di lavoro nel pool di nodi, visualizzare la scheda Nodi e selezionare il collegamento Visualizza metriche accanto al nome del nodo di lavoro. Per ulteriori informazioni sulle metriche emesse, vedere Metriche disponibili: oci_oke.

    Per ulteriori informazioni sulle metriche di monitoraggio e sull'uso degli allarmi, vedere Panoramica del monitoraggio. Per informazioni sulle notifiche per gli allarmi, vedere Panoramica delle notifiche.

I dati delle metriche cluster previsti non vengono visualizzati?

Se i dati delle metriche per un cluster previsti non vengono visualizzati, vedere le possibili cause e risoluzioni riportate di seguito.

problema Causa possibile Modalità di verifica Risoluzione

So che il server API Kubernetes ha restituito alcune risposte di errore, ma il grafico Conteggio risposte server API non le mostra.

Le risposte potrebbero essere state restituite al di fuori del periodo di tempo coperto dal grafico Conteggio risposte server API. Confermare l'ora di inizio e l'ora di fine per il periodo in cui sono state restituite le risposte. Se necessario, modificare le opzioni Ora inizio e Ora fine.
So che il server API Kubernetes ha restituito alcune risposte di errore, ma il grafico Conteggio risposte server API non le mostra, anche se le risposte sono state restituite tra l'ora di inizio e l'ora di fine. Sebbene le risposte siano state restituite tra l'ora di inizio e l'ora di fine, è possibile che l'asse x (finestra di visualizzazione dei dati) escluda le risposte. Verificare che l'asse x (finestra di visualizzazione dei dati) copra il periodo in cui sono state restituite le risposte. Se necessario, modificare l'asse x (finestra di visualizzazione dati).
Voglio vedere i dati nei grafici come una linea continua nel tempo, ma la linea ha delle lacune. Si tratta di un comportamento conosciuto. Se non sono presenti dati delle metriche da visualizzare nell'intervallo selezionato, la linea dati è discontinua. Aumentare l'intervallo (ad esempio, da 1 minuto a 5 minuti o da 1 minuto a 1 ora). Adeguare l'intervallo in base alle esigenze.