Metriche OKE (Kubernetes Engine)
Scopri le metriche emesse da Kubernetes Engine (OKE).
Puoi monitorare lo stato, la capacità e le prestazioni dei cluster Kubernetes gestiti da Kubernetes Engine utilizzando metriche , allarmi e notifiche.
Questo argomento descrive le metriche emesse da Kubernetes Engine nello spazio di nomi delle metriche oci_oke
.
Risorse: cluster, nodi di lavoro
Panoramica delle metriche dei servizi OKE (Kubernetes Engine)
Le metriche del motore Kubernetes ti aiutano a monitorare i cluster Kubernetes, insieme ai pool di nodi e ai singoli nodi di lavoro. È possibile utilizzare i dati delle metriche per diagnosticare e risolvere i problemi relativi a cluster e pool di nodi.
Mentre la frequenza varia in base alla metrica, le metriche di servizio predefinite in genere hanno una frequenza di 60 secondi, ovvero almeno un datapoint inviato al minuto.
Per visualizzare un set predefinito di grafici delle metriche nella console, andare al cluster a cui si è interessati, quindi selezionare Metriche. È inoltre possibile utilizzare il servizio di monitoraggio per creare query personalizzate. Vedere Creazione di query sulle metriche.
Prerequisiti
Criteri IAM: per monitorare le risorse, è necessario disporre del tipo di accesso richiesto in un criterio scritto da un amministratore, indipendentemente dal fatto che si stia utilizzando la console o l'API REST con un SDK, un'interfaccia CLI o un altro strumento. Il criterio deve consentire l'accesso sia ai servizi di monitoraggio che alle risorse monitorate. Se si tenta di eseguire un'azione e si riceve un messaggio che informa che non si dispone dell'autorizzazione o che non si è autorizzati, contattare l'amministratore per scoprire il tipo di accesso concesso e il compartimento in cui è necessario lavorare. Per ulteriori informazioni sulle autorizzazioni utente per il monitoraggio, vedere Criteri IAM.
Ad esempio, per osservare la condizione dei nodi in un cluster Kubernetes, è necessario disporre dell'accesso mediante un'istruzione criterio simile alla seguente:
Allow group <group-name> to read metrics in <location>
Metriche disponibili: oci_oke
Le metriche elencate nelle tabelle seguenti sono automaticamente disponibili per qualsiasi cluster Kubernetes creato. Non è necessario abilitare il monitoraggio sulla risorsa per ottenere queste metriche.
I parametri del motore Kubernetes includono le dimensioni riportate di seguito.
- RESOURCEID
- L'OCID della risorsa a cui si applica la metrica.
- NOME RIPRODUZIONE RISORSE
- Nome della risorsa a cui viene applicata la metrica.
- CODICE RISPOSTA
- Codice di risposta inviato dal server API Kubernetes.
- GRUPPO DI RISPOSTE
- Gruppo di codici di risposta, basato sulla prima cifra del codice di risposta (ad esempio, 2xx, 3xx, 4xx, 5xx).
- CLUSTERID
- L'OCID del cluster a cui si applica la metrica.
- NODEPOOLID
- OCID del pool di nodi a cui si applica la metrica.
- NODESTATE
- Stato dell'istanza di computazione che ospita il nodo di lavoro. Ad esempio, ACTIVE, CREATING, DELETING, DELETED, FAILED, UPDATING, INACTIVE.
- NODECONDIZIONE
- Condizione del nodo di lavoro, come indicato dal server API Kubernetes. Ad esempio, Pronto, MemoryPressure, PIDPressure, DiskPressure, NetworkUnavailable.
- DOMINIO DI DISPONIBILITÀ
- Il dominio di disponibilità in cui risiede l'istanza di computazione.
- DOMINIO DI ERRORE
- Il dominio di errore in cui risiede l'istanza di computazione.
Parametro | Nome visualizzato metrica | Unità | descrizione; | Dimensioni |
---|---|---|---|---|
APIServerRequestCount
|
Richieste server API | Conteggio | Numero di richieste ricevute dal server API Kubernetes. |
|
APIServerResponseCount
|
Conteggio risposte server API | Conteggio | Numero di risposte diverse non 200 (ovvero risposte di errore) inviate dal server API Kubernetes. | resourceId
|
UnschedulablePods
|
Pod non pianificabili | Conteggio | Numero di pod che lo scheduler Kubernetes non è in grado di pianificare. Non disponibile nei cluster su cui sono in esecuzione le versioni di Kubernetes precedenti alla 1.15.x. | resourceId
|
NodeState
|
Stato nodo | Conteggio | Numero di nodi di calcolo con stati diversi. | resourceId
|
KubernetesNodeCondition
|
Condizione nodo Kubernetes | Conteggio |
Numero di nodi di lavoro in condizioni diverse, come indicato dal server API Kubernetes. |
resourceId
|
Utilizzo di Console
- Aprire il menu di navigazione e selezionare Developer Services. In Container e artifact, selezionare Cluster Kubernetes (OKE).
- Seleziona l'area che stai utilizzando con Kubernetes Engine.
-
Selezionare il compartimento contenente il cluster per il quale si desidera visualizzare le metriche.
La pagina Cluster mostra tutti i cluster nel compartimento selezionato.
- Selezionare il nome del cluster per il quale si desidera visualizzare le metriche.
-
In Risorse, selezionare Metriche.
La scheda Metriche visualizza un grafico per ogni metrica per il cluster emessa dallo spazio di nomi delle metriche del motore Kubernetes. Per visualizzare le metriche per un pool di nodi nel cluster, visualizzare la scheda Pool di nodi, selezionare il nome del pool di nodi e visualizzare la scheda Metriche. Per visualizzare le metriche per un nodo di lavoro nel pool di nodi, visualizzare la scheda Nodi e selezionare il collegamento Visualizza metriche accanto al nome del nodo di lavoro. Per ulteriori informazioni sulle metriche emesse, vedere Metriche disponibili: oci_oke.
Per ulteriori informazioni sulle metriche di monitoraggio e sull'uso degli allarmi, vedere Panoramica del monitoraggio. Per informazioni sulle notifiche per gli allarmi, vedere Panoramica delle notifiche.
Se i dati delle metriche per un cluster previsti non vengono visualizzati, vedere le possibili cause e risoluzioni riportate di seguito.
problema | Causa possibile | Modalità di verifica | Risoluzione |
---|---|---|---|
So che il server API Kubernetes ha restituito alcune risposte di errore, ma il grafico Conteggio risposte server API non le mostra. |
Le risposte potrebbero essere state restituite al di fuori del periodo di tempo coperto dal grafico Conteggio risposte server API. | Confermare l'ora di inizio e l'ora di fine per il periodo in cui sono state restituite le risposte. | Se necessario, modificare le opzioni Ora inizio e Ora fine. |
So che il server API Kubernetes ha restituito alcune risposte di errore, ma il grafico Conteggio risposte server API non le mostra, anche se le risposte sono state restituite tra l'ora di inizio e l'ora di fine. | Sebbene le risposte siano state restituite tra l'ora di inizio e l'ora di fine, è possibile che l'asse x (finestra di visualizzazione dei dati) escluda le risposte. | Verificare che l'asse x (finestra di visualizzazione dei dati) copra il periodo in cui sono state restituite le risposte. | Se necessario, modificare l'asse x (finestra di visualizzazione dati). |
Voglio vedere i dati nei grafici come una linea continua nel tempo, ma la linea ha delle lacune. | Si tratta di un comportamento conosciuto. Se non sono presenti dati delle metriche da visualizzare nell'intervallo selezionato, la linea dati è discontinua. | Aumentare l'intervallo (ad esempio, da 1 minuto a 5 minuti o da 1 minuto a 1 ora). | Adeguare l'intervallo in base alle esigenze. |
Uso dell'API
Per informazioni sull'uso dell'API e delle richieste di firma, consulta la documentazione dell'API REST e le credenziali di sicurezza. Per informazioni sugli SDK, vedere SDK e l'interfaccia CLI.
- Monitoraggio dell'API per metriche e allarmi
- API Notifiche per le notifiche (utilizzata con gli allarmi)