Visualizzazione e interpretazione dei dati di monitoraggio in Grafana

Il livello di servizi dell'infrastruttura di Private Cloud Appliance, che si basa sulla piattaforma e abilita tutte le funzionalità di utenti e amministratori del cloud, può essere monitorato attraverso un'ampia raccolta di dashboard Grafana.

Questi microservizi vengono distribuiti nei tre nodi di gestione nei container Kubernetes, quindi il loro monitoraggio si basa in gran parte sulle metriche dei nodi e dei pod Kubernetes. Il cluster Kubernetes si estende anche ai nodi di calcolo, in cui i nodi di lavoro Kubernetes raccolgono dati aggiuntivi vitali per il funzionamento e il monitoraggio del sistema.

I dashboard descritti in questa sezione forniscono un buon punto di partenza per il monitoraggio dello stato dei microservizi. È possibile preferire utilizzare dashboard, metriche e visualizzazioni diverse. I dati necessari, raccolti nell'intero sistema, vengono memorizzati in Prometheus e possono essere interrogati e presentati tramite Grafana in molti modi.

Cartella Grafana

Dashboard

Descrizione

Monitoraggio servizio

ClusterLabs Dettagli cluster HA

Questo dashboard utilizza un esportatore Prometheus su misura per visualizzare i dati per i cluster HA basati su Pacemaker. Su ogni richiesta HTTP ispeziona localmente lo stato del cluster, analizzando i dati distribuiti preesistenti forniti dagli strumenti dei componenti del cluster.

I dati di monitoraggio includono il riepilogo del cluster Pacemaker, i nodi e le statistiche delle risorse, gli errori di anello Corosync e i voti quorum.

Monitoraggio servizio

Esportatore MySQL Cluster

Questo dashboard visualizza i dettagli delle prestazioni per il cluster di database MySQL. I dati includono metriche del servizio di database quali il tempo di attività, le statistiche di connessione, il numero di lock delle tabelle, nonché informazioni più generali sugli oggetti MySQL, le connessioni, il traffico di rete, la memoria e l'uso della CPU e così via.

Monitoraggio servizio

Livello di Servizio

Questo dashboard mostra informazioni dettagliate sulle richieste RabbitMQ ricevute dai servizi dell'appliance fondamentale. Consente di monitorare il numero di richieste, la latenza delle richieste e qualsiasi richiesta che ha causato un errore.

Monitoraggio servizio

Statistiche VM

Questo dashboard completo visualizza le informazioni sul consumo delle risorse nelle istanze di computazione nel proprio ambiente. Include grafici per l'utilizzo della CPU e della memoria, l'attività del disco, il traffico di rete e così via.

I pannelli di questo dashboard visualizzano un gran numero di serie temporali in un unico grafico. È possibile fare clic per visualizzare una singola serie temporale oppure passare il puntatore del mouse sul grafico per visualizzare i dati dettagliati in un punto specifico dell'asse temporale.

Consulente assistenza PCA 3.0

Endpoint Kube

Questo dashboard è incentrato in modo specifico sugli endpoint Kubernetes e fornisce avvisi sugli endpoint. Questi avvisi possono essere inviati a un canale di notifica di tua scelta.

Consulente assistenza PCA 3.0

Ingresso Kube

Questo dashboard fornisce dati sul traffico in entrata ai servizi Kubernetes e ai relativi pod. Due avvisi sono integrati e possono essere inviati a un canale di notifica di tua scelta.

Consulente assistenza PCA 3.0

Nodo Kube

Questo dashboard visualizza i dati delle metriche per tutti i nodi server, ovvero i nodi di gestione e computazione, che appartengono al cluster Kubernetes e ai pod di microservizi host. È possibile monitorare il numero di pod, l'uso della CPU e della memoria e così via. I pannelli delle metriche visualizzano le informazioni per tutti i nodi. Nei pannelli basati su grafici è possibile fare clic per visualizzare le informazioni per un solo nodo.

Consulente assistenza PCA 3.0

Pod Kube

Questo dashboard visualizza i dati delle metriche a livello dei pod di microservizi, consentendoti di visualizzare il numero totale di pod in generale e il modo in cui vengono distribuiti tra i nodi. È possibile monitorarne lo stato per spazio di nomi e per servizio e verificare se sono stati attivati avvisi.

Consulente assistenza PCA 3.0

Servizio Kube

Questo dashboard visualizza i dati delle metriche a livello di servizio Kubernetes. I dati possono essere filtrati per servizi specifici, ma vengono visualizzati tutti per impostazione predefinita. Due avvisi sono integrati e possono essere inviati a un canale di notifica di tua scelta.

Monitoraggio Kubernetes

Container di monitoraggio Kubernetes

Nodo di monitoraggio Kubernetes

(tutti)

Queste cartelle contengono una raccolta ampia e diversificata di dashboard con una vasta gamma di dati di monitoraggio che coprono la maggior parte delle operazioni del cluster Kubernetes del sistema Private Cloud Appliance. Ad esempio, queste metriche forniscono informazioni sulla distribuzione, l'ingresso e l'uso di CPU, disco, memoria e risorse di rete.

Monitoraggio OKE

CAPO

Questo dashboard mostra le metriche del provider API cluster per OCI, che è un componente del motore Kubernetes di Private Cloud Appliance (OKE). Questo dashboard monitora i codici di stato delle richieste e i tempi di risposta per le risorse utilizzate da OKE, ad esempio le istanze di computazione e i load balancer.

Le informazioni sulla riconciliazione del controller sono destinate al Supporto Oracle.

Monitoraggio OKE

Monitoraggio tempo cluster

Questo dashboard mostra il tempo impiegato per operazioni quali la creazione o l'aggiornamento di un determinato cluster o pool di nodi OKE. Viene visualizzato anche il tempo medio per queste operazioni in tutti i cluster e i pool di nodi.

Monitoraggio OKE

Misuratore metriche

Questo dashboard mostra lo stato delle varie destinazioni utilizzate dal servizio OKE, ad esempio Cluster API Provider, Cluster API Provider per OCI, OKE e prometheus-k8s.

Monitoraggio OKE

Servizio OKE

Questo dashboard mostra le metriche del livello di servizio per OKE. Esempi di metriche in questo dashboard includono conteggi di richieste quali creazione, aggiornamento ed eliminazione di cluster e pool di nodi e conteggi di codici di eccezione per varie richieste. I conteggi dei codici di eccezione consentono di esporre eventuali pattern in caso di errori di richiesta.