Monitoringdaten in Grafana anzeigen und interpretieren
Die Infrastruktur-Services-Schicht von Private Cloud Appliance, die auf der Plattform basiert und alle Cloud-Benutzer- und Administratorfunktionen ermöglicht, kann über eine umfangreiche Sammlung von Grafana-Dashboards überwacht werden.
Diese Microservices werden auf den drei Managementknoten in Kubernetes-Containern bereitgestellt, sodass ihre Überwachung weitgehend auf Kubernetes-Knoten- und -Podmetriken basiert. Das Kubernetes-Cluster wird auch auf die Compute Nodes erweitert, auf denen Kubernetes-Worker-Knoten wichtige zusätzliche Daten für den Systembetrieb und die Systemüberwachung erfassen.
Die in diesem Abschnitt beschriebenen Dashboards bieten einen guten Ausgangspunkt für die Überwachung des Zustands von Microservices. Sie können stattdessen verschiedene Dashboards, Metriken und Visualisierungen verwenden. Die notwendigen Daten, die über das gesamte System gesammelt werden, werden in Prometheus gespeichert und können über Grafana in vielerlei Hinsicht abgefragt und dargestellt werden.
|
Grafana-Ordner |
Dashboard |
Beschreibung |
|---|---|---|
|
Servicemonitoring |
ClusterLabs HA-Clusterdetails |
Dieses Dashboard verwendet einen maßgeschneiderten Prometheus-Exporteur, um Daten für HA-Cluster basierend auf Pacemaker anzuzeigen. Bei jeder HTTP-Anforderung wird der Clusterstatus lokal geprüft, indem bereits vorhandene verteilte Daten geparst werden, die von den Tools der Clusterkomponenten bereitgestellt werden. Zu den Überwachungsdaten gehören eine Zusammenfassung des Pacemaker-Clusters, Knoten und Ressourcenstatistiken sowie Corosync-Ringfehler und Quorumstimmen. |
|
Servicemonitoring |
MySQL Cluster-Exporteur |
In diesem Dashboard werden Performancedetails für das Datenbankcluster MySQL angezeigt. Zu den Daten gehören Datenbankservicemetriken wie Betriebszeit, Verbindungsstatistiken, Anzahl der Tabellensperren sowie allgemeinere Informationen zu MySQL-Objekten, Verbindungen, Netzwerkverkehr, Speicher- und CPU-Auslastung usw. |
|
Servicemonitoring |
Servicegrad |
In diesem Dashboard werden detaillierte Informationen zu RabbitMQ-Anforderungen angezeigt, die von den grundlegenden Appliance-Services empfangen werden. Damit können Sie die Anzahl der Anforderungen, die Anforderungslatenz und alle Anforderungen überwachen, die einen Fehler verursacht haben. |
|
Servicemonitoring |
VM-Statistiken |
In diesem umfassenden Dashboard werden Informationen zur Ressourcennutzung für alle Compute-Instanzen in Ihrer Umgebung angezeigt. Sie enthält Diagramme für CPU- und Speicherauslastung, Datenträgeraktivität, Netzwerkverkehr usw. In den Panels in diesem Dashboard wird eine große Anzahl von Zeitreihen in einem einzigen Diagramm angezeigt. Sie können auf eine einzelne Zeitreihe klicken oder den Mauszeiger über das Diagramm bewegen, um detaillierte Daten zu einem bestimmten Zeitpunkt auf der Zeitachse anzuzeigen. |
|
PCA 3.0-Serviceberater |
Kube-Endpunkt |
Dieses Dashboard konzentriert sich speziell auf die Kubernetes-Endpunkte und stellt Endpunktalerts bereit. Diese Alerts können an einen Benachrichtigungskanal Ihrer Wahl gesendet werden. |
|
PCA 3.0-Serviceberater |
Kube-Ingress |
Dieses Dashboard enthält Daten zum Ingress-Traffic zu den Kubernetes-Services und den zugehörigen Pods. Zwei Alerts sind integriert und können an einen Benachrichtigungskanal Ihrer Wahl gesendet werden. |
|
PCA 3.0-Serviceberater |
Kube-Knoten |
In diesem Dashboard werden Metrikdaten für alle Serverknoten angezeigt, d.h. Management- und Compute Nodes, die zum Kubernetes-Cluster und Host-Microservices-Pods gehören. Sie können die Podanzahl, CPU- und Arbeitsspeicherauslastung usw. überwachen. In den Metrikbereichen werden Informationen für alle Knoten angezeigt. In den grafikbasierten Panels können Sie klicken, um Informationen nur für einen einzelnen Knoten anzuzeigen. |
|
PCA 3.0-Serviceberater |
Kube Pod |
In diesem Dashboard werden Metrikdaten auf der Ebene der Microservices-Pods angezeigt. So können Sie die Gesamtanzahl der Pods insgesamt und ihre Verteilung auf die Knoten anzeigen. Sie können ihren Status pro Namespace und pro Service überwachen und prüfen, ob sie Alerts ausgelöst haben. |
|
PCA 3.0-Serviceberater |
Kube-Service |
In diesem Dashboard werden Metrikdaten auf Kubernetes-Serviceebene angezeigt. Die Daten können nach bestimmten Services gefiltert werden, werden jedoch standardmäßig alle angezeigt. Zwei Alerts sind integriert und können an einen Benachrichtigungskanal Ihrer Wahl gesendet werden. |
|
Kubernetes-Monitoring Kubernetes-Monitoringcontainer Kubernetes-Überwachungsknoten |
(alle) |
Diese Ordner enthalten eine große und vielfältige Sammlung von Dashboards mit einer breiten Palette von Überwachungsdaten, die den größten Teil der Vorgänge des Kubernetes-Clusters des Private Cloud Appliance-Systems abdecken. Beispiel: Diese Metriken enthalten Informationen zum Deployment, Ingress und zur Nutzung von CPU-, Datenträger-, Speicher- und Netzwerkressourcen. |
|
OKE-Monitoring |
CAPOCI |
In diesem Dashboard werden Metriken des Cluster-API-Providers für OCI angezeigt, der eine Komponente der Private Cloud Appliance Kubernetes Engine (OKE) ist. Dieses Dashboard überwacht Anforderungsstatuscodes und Antwortzeiten für Ressourcen, die von OKE verwendet werden, wie Compute-Instanzen und Load Balancer. Die Informationen zur Controller Reconciliation sind an Oracle Support gerichtet. |
|
OKE-Monitoring |
Clusterzeitüberwachung |
Dieses Dashboard zeigt die Zeit an, die für Vorgänge wie das Erstellen oder Aktualisieren eines bestimmten OKE-Clusters oder -Knotenpools benötigt wird. Die durchschnittliche Zeit für diese Vorgänge in allen Clustern und Knotenpools wird ebenfalls angezeigt. |
|
OKE-Monitoring |
Kennzahlenzähler |
In diesem Dashboard wird der Zustand verschiedener Ziele angezeigt, die vom OKE-Service verwendet werden, wie Cluster-API-Provider, Cluster-API-Provider für OCI, OKE und prometheus-k8s. |
|
OKE-Monitoring |
OKE-Service |
In diesem Dashboard werden die Servicegradmetriken für OKE angezeigt. Beispiele für Metriken in diesem Dashboard sind die Anzahl der Anforderungen, wie das Erstellen, Aktualisieren und Löschen von Clustern und Knotenpools, sowie die Anzahl der Ausnahmecodes für verschiedene Anforderungen. Die Anzahl der Ausnahmecodes hilft dabei, Muster bei Anforderungsfehlern anzuzeigen. |