Metriche OKE (Kubernetes Engine)

Scopri le metriche emesse da Kubernetes Engine (OKE).

Puoi monitorare lo stato, la capacità e le prestazioni dei cluster Kubernetes gestiti da Kubernetes Engine utilizzando metriche , allarmi e notifiche.

Questo argomento descrive le metriche emesse da Kubernetes Engine nello spazio di nomi delle metriche oci_oke.

Risorse: cluster, nodi di lavoro

Panoramica delle metriche dei servizi OKE (Kubernetes Engine)

Le metriche del motore Kubernetes ti aiutano a monitorare i cluster Kubernetes, insieme ai pool di nodi e ai singoli nodi di lavoro. È possibile utilizzare i dati delle metriche per diagnosticare e risolvere i problemi relativi a cluster e pool di nodi.

Mentre la frequenza varia in base alla metrica, le metriche di servizio predefinite in genere hanno una frequenza di 60 secondi, ovvero almeno un datapoint inviato al minuto.

Per visualizzare un set predefinito di grafici delle metriche per un cluster nella console, selezionare il cluster nella pagina della lista Cluster, quindi selezionare la scheda Monitoraggio. È inoltre possibile utilizzare il servizio di monitoraggio per creare query personalizzate. Vedere Creazione di query sulle metriche.

Prerequisiti

Criteri IAM: per monitorare le risorse, è necessario disporre del tipo di accesso richiesto in un criterio scritto da un amministratore, indipendentemente dal fatto che si stia utilizzando la console o l'API REST con un SDK, un'interfaccia CLI o un altro strumento. Il criterio deve consentire l'accesso sia ai servizi di monitoraggio che alle risorse monitorate. Se si tenta di eseguire un'azione e si riceve un messaggio che informa che non si dispone dell'autorizzazione o che non si è autorizzati, contattare l'amministratore per scoprire il tipo di accesso concesso e il compartimento in cui è necessario lavorare. Per ulteriori informazioni sulle autorizzazioni utente per il monitoraggio, vedere Criteri IAM.

Ad esempio, per osservare la condizione dei nodi in un cluster Kubernetes, è necessario disporre dell'accesso mediante un'istruzione criterio simile alla seguente:

Allow group <group-name> to read metrics in <location>

Metriche disponibili: oci_oke

Le metriche elencate nelle tabelle seguenti sono automaticamente disponibili per qualsiasi cluster Kubernetes creato. Non è necessario abilitare il monitoraggio sulla risorsa per ottenere queste metriche.

I parametri del motore Kubernetes includono le dimensioni riportate di seguito.

RESOURCEID: L'OCID della risorsa a cui si applica la metrica.
NOME RIPRODUZIONE RISORSE: Nome della risorsa a cui viene applicata la metrica.
CODICE RISPOSTA: Codice di risposta inviato dal server API Kubernetes.
GRUPPO DI RISPOSTE: Gruppo di codici di risposta, basato sulla prima cifra del codice di risposta (ad esempio, 2xx, 3xx, 4xx, 5xx).
CLUSTERID: L'OCID del cluster a cui si applica la metrica.
NODEPOOLID: OCID del pool di nodi a cui si applica la metrica.
NODESTATE: Stato dell'istanza di computazione che ospita il nodo di lavoro. Ad esempio, ACTIVE, CREATING, DELETING, DELETED, FAILED, UPDATING, INACTIVE.
NODECONDIZIONE: Condizione del nodo di lavoro, come indicato dal server API Kubernetes. Ad esempio, Pronto, MemoryPressure, PIDPressure, DiskPressure, NetworkUnavailable.
DOMINIO DI DISPONIBILITÀ: Il dominio di disponibilità in cui risiede l'istanza di computazione.
DOMINIO DI ERRORE: Il dominio di errore in cui risiede l'istanza di computazione.


Parametro	Nome visualizzato metrica	Unità	descrizione;	Dimensioni
`APIServerRequestCount`	Richieste server API	Conteggio	Numero di richieste ricevute dal server API Kubernetes.	`resourceId` `resourceDisplayName`
`APIServerResponseCount`	Conteggio risposte server API	Conteggio	Numero di risposte diverse non 200 (ovvero risposte di errore) inviate dal server API Kubernetes.	`resourceId` `resourceDisplayName` `responseCode` `responseGroup`
`UnschedulablePods`	Pod non pianificabili	Conteggio	Numero di pod che lo scheduler Kubernetes non è in grado di pianificare. Non disponibile nei cluster su cui sono in esecuzione le versioni di Kubernetes precedenti alla 1.15.x.	`resourceId` `resourceDisplayName`
`NodeState`	Stato nodo	Conteggio	Numero di nodi di calcolo con stati diversi.	`resourceId` `clusterId` `nodepoolId` `resourceDisplayName` `nodeState` `nodeCondition` `availabilityDomain` `faultDomain`
`KubernetesNodeCondition`	Condizione nodo Kubernetes	Conteggio	Numero di nodi di lavoro in condizioni diverse, come indicato dal server API Kubernetes.	`resourceId` `clusterId` `nodepoolId` `resourceDisplayName` `nodeCondition`

Utilizzo di Console

Per visualizzare i grafici delle metriche predefiniti per un singolo cluster

Nella pagina della lista Cluster, selezionare il nome del cluster per il quale si desidera visualizzare le metriche. Se è necessaria assistenza per trovare la pagina della lista o il cluster, vedere Elenca cluster.
Selezionare la scheda Monitoraggio.

La scheda Monitoraggio visualizza un grafico per ogni metrica per il cluster emessa dallo spazio di nomi delle metriche del motore Kubernetes. Per visualizzare le metriche per un pool di nodi nel cluster, visualizzare la scheda Pool di nodi, selezionare il nome del pool di nodi e visualizzare la scheda Monitoraggio. Per visualizzare le metriche per un nodo di lavoro nel pool di nodi, visualizzare la scheda Nodi e selezionare Visualizza metriche dal menu Azioni (tre punti) accanto al nodo di lavoro. Per ulteriori informazioni sulle metriche emesse, vedere Metriche disponibili: oci_oke.

Per ulteriori informazioni sulle metriche di monitoraggio e sull'uso degli allarmi, vedere Panoramica del monitoraggio. Per informazioni sulle notifiche per gli allarmi, vedere Panoramica delle notifiche.

I dati delle metriche cluster previsti non vengono visualizzati?

Se i dati delle metriche per un cluster previsti non vengono visualizzati, vedere le possibili cause e risoluzioni riportate di seguito.


problema	Causa possibile	Modalità di verifica	Risoluzione
So che il server API Kubernetes ha restituito alcune risposte di errore, ma il grafico Conteggio risposte server API non le mostra.	Le risposte potrebbero essere state restituite al di fuori del periodo di tempo coperto dal grafico Conteggio risposte server API.	Confermare che l'ora di inizio e l'ora di fine coprono il periodo in cui sono state restituite le risposte.	Adeguare l'ora di inizio e l'ora di fine in base alle esigenze.
So che il server API Kubernetes ha restituito alcune risposte di errore, ma il grafico Conteggio risposte server API non le mostra, anche se le risposte sono state restituite tra l'ora di inizio e l'ora di fine.	Sebbene le risposte siano state restituite tra l'ora di inizio e l'ora di fine, è possibile che l'asse x (finestra di visualizzazione dei dati) escluda le risposte.	Confermare che l'asse x (finestra di visualizzazione dei dati) copra il periodo in cui sono state restituite le risposte.	Modificare l'asse x (finestra di visualizzazione dei dati) in base alle esigenze.
Voglio vedere i dati nei grafici come una linea continua nel tempo, ma la linea ha delle lacune.	Si tratta di un comportamento conosciuto. Se non sono presenti dati delle metriche da visualizzare nell'intervallo selezionato, la linea dati è discontinua.	Aumentare l'intervallo (ad esempio, da 1 minuto a 5 minuti o da 1 minuto a 1 ora).	Adeguare l'intervallo in base alle esigenze.

Uso dell'API

Per informazioni sull'uso dell'API e delle richieste di firma, consulta la documentazione dell'API REST e le credenziali di sicurezza. Per informazioni sugli SDK, vedere SDK e l'interfaccia CLI.

Utilizzare le seguenti API per il monitoraggio:

Monitoraggio dell'API per metriche e allarmi
API Notifiche per le notifiche (utilizzata con gli allarmi)