Metriken der Kubernetes-Engine (OKE)

Informieren Sie sich über die von der Kubernetes Engine (OKE) ausgegebenen Metriken.

Sie können den Zustand, die Kapazität und die Performance von Kubernetes-Clustern, die von der Kubernetes-Engine verwaltet werden, mit Metriken, Alarmen und Benachrichtigungen überwachen.

In diesem Thema werden die von der Kubernetes-Engine ausgegebenen Metriken im Metrik-Namespace oci_oke beschrieben.

Ressourcen: Cluster, Worker-Knoten

Überblick über die Metriken des Kubernetes-Engine-(OKE-)Service

Mit den Metriken der Kubernetes-Engine können Sie Kubernetes-Cluster zusammen mit Knotenpools und einzelnen Worker-Knoten überwachen. Mit Metrikdaten können Sie Cluster- und Knotenpoolprobleme diagnostizieren und beheben.

Während die Häufigkeit je nach Metrik variiert, weisen Standardservicemetriken im Allgemeinen eine Häufigkeit von 60 Sekunden auf (d.h. pro Minute wird mindestens ein Datenpunkt gepostet).

Um ein Standardset von Metrikdiagrammen für ein Cluster in der Konsole anzuzeigen, wählen Sie das Cluster auf der Listenseite Cluster aus, und wählen Sie dann die Registerkarte Monitoring aus. Mit dem Monitoring-Service können Sie auch benutzerdefinierte Abfragen erstellen. Siehe Metrikabfragen erstellen.

Voraussetzungen

IAM-Policys: Um Ressourcen zu überwachen, benötigen Sie den erforderlichen Zugriffstyp in einer von einem Administrator geschriebenen Policy , unabhängig davon, ob Sie die Konsole oder die REST-API mit einem SDK, einer CLI oder einer anderen Toolanwendung verwenden. Die Policy muss Ihnen Zugriff auf die Monitoringservices und die überwachten Ressourcen erteilen. Wenn Sie versuchen, eine Aktion auszuführen, und eine Meldung erhalten, dass Sie keine Berechtigung haben oder nicht autorisiert sind, fragen Sie bitte den Administrator, welche Art von Zugriff Ihnen erteilt wurden und in welchem Compartment Sie arbeiten müssen. Weitere Informationen zu Benutzerautorisierungen für Monitoring finden Sie unter IAM-Policys.

Beispiel: Um die Bedingung von Knoten in einem Kubernetes-Cluster zu beobachten, muss Ihnen der Zugriff mit einer Policy-Anweisung wie der folgenden erteilt worden sein:

Allow group <group-name> to read metrics in <location>

Verfügbare Metriken: oci_oke

Die Metriken in den folgenden Tabellen sind automatisch für alle von Ihnen erstellten Kubernetes-Cluster verfügbar. Sie müssen Monitoring für die Ressource nicht aktivieren, um diese Metriken abzurufen.

Metriken der Kubernetes-Engine enthalten die folgenden Dimensionen:

RESOURCEID: Die OCID der Ressource, für die die Metrik gilt.
RESOURCEDISPLAYNAME: Der Name der Ressource, auf die sich die Metrik bezieht.
RESPONSECODE: Der vom Kubernetes-API-Server gesendete Antwortcode.
RESPONSEGROUP: Die Antwortcodegruppe basierend auf der ersten Ziffer des Antwortcodes (Beispiel: 2xx, 3xx, 4xx, 5xx).
CLUSTERID: Die OCID des Clusters, für das die Metrik gilt.
NODEPOOLID: Die OCID des Knotenpools, für den die Metrik gilt.
NODESTATE: Der Status der Compute-Instanz, die den Worker-Knoten hostet. Beispiel: ACTIVE, CREATING, DELETING, DELETED, FAILED, UPDATING, INACTIVE.
NODECONDITION: Die Bedingung des Worker-Knotens, wie vom Kubernetes-API-Server angegeben. Beispiel: Ready, MemoryPressure, PIDPressure, DiskPressure, NetworkUnavailable.
AVAILABILITYDOMAIN: Die Availability-Domain, in der sich die Compute-Instanz befindet.
FAULTDOMAIN: Die Faultdomain, in der sich die Compute-Instanz befindet.


Metrik	Metrikanzeigename	Einheit	Beschreibung	Dimensionen
`APIServerRequestCount`	API-Serveranforderungen	Anzahl	Anzahl der vom Kubernetes-API-Server empfangenen Anforderungen.	`resourceId` `resourceDisplayName`
`APIServerResponseCount`	Anzahl Antworten von API-Server	Anzahl	Anzahl unterschiedlicher Nicht-200-Antworten (d.h. Fehlerantworten), die vom Kubernetes-API-Server gesendet wurden.	`resourceId` `resourceDisplayName` `responseCode` `responseGroup`
`UnschedulablePods`	Nicht terminierbare Pods	Anzahl	Anzahl der Pods, die vom Kubernetes-Scheduler nicht geplant werden können. Nicht in Clustern verfügbar, in denen Kubernetes-Versionen vor 1.15.x ausgeführt werden.	`resourceId` `resourceDisplayName`
`NodeState`	Knotenstatus	Anzahl	Anzahl der Compute Nodes in verschiedenen Status.	`resourceId` `clusterId` `nodepoolId` `resourceDisplayName` `nodeState` `nodeCondition` `availabilityDomain` `faultDomain`
`KubernetesNodeCondition`	Kubernetes-Knotenbedingung	Anzahl	Anzahl der Worker-Knoten in unterschiedlichen Bedingungen, wie vom Kubernetes-API-Server angegeben.	`resourceId` `clusterId` `nodepoolId` `resourceDisplayName` `nodeCondition`

Konsole verwenden

So zeigen Sie Standardmetrikdiagramme für ein einzelnes Cluster an

Wählen Sie auf der Listenseite Cluster den Namen des Clusters aus, für das Sie Metriken anzeigen möchten. Wenn Sie Hilfe beim Suchen der Listenseite oder des Clusters benötigen, finden Sie weitere Informationen unter Cluster auflisten.
Wählen Sie das Register Monitoring.

In der Registerkarte Monitoring wird ein Diagramm für jede Metrik des Clusters angezeigt, die von dem Metrik-Namespace für Kubernetes Engine ausgegeben wird. Um Metriken für einen Knotenpool im Cluster anzuzeigen, öffnen Sie die Registerkarte Knotenpools, wählen den Namen des Knotenpools aus und zeigen die Registerkarte Monitoring an. Um Metriken für einen Worker-Knoten im Knotenpool anzuzeigen, zeigen Sie die Registerkarte Knoten an, und wählen Sie im Menü Aktionen (drei Punkte) neben dem Worker-Knoten die Option Metriken anzeigen aus. Weitere Informationen zu den ausgegebenen Metriken finden Sie unter Verfügbare Metriken: oci_oke.

Weitere Informationen zu Monitoringmetriken und zur Verwendung von Alarmen finden Sie in Überblick über Monitoring. Informationen zu Benachrichtigungen für Alarme finden Sie unter Überblick über Benachrichtigungen.

Die erwarteten Clustermetrikdaten werden nicht angezeigt?

Wenn die erwarteten Metrikdaten für ein Cluster nicht angezeigt werden, lesen Sie die folgenden möglichen Ursachen und Lösungen.


Problem	Mögliche Ursache	Prüfung	Lösung
Ich weiß, dass der Kubernetes-API-Server einige Fehlerantworten zurückgegeben hat, aber diese werden im Diagramm Anzahl Antworten von API-Server nicht angezeigt.	Die Antworten wurden möglicherweise außerhalb des Zeitraums zurückgegeben, der vom Diagramm Anzahl Antworten von API-Server abgedeckt wird.	Prüfen Sie, ob Startzeit und Endzeit den Zeitraum abdecken, in dem die Antworten zurückgegeben wurden.	Passen Sie die Startzeit und die Endzeit gegebenenfalls an.
Ich weiß, dass der Kubernetes-API-Server einige Fehlerantworten zurückgegeben hat, aber diese werden im Diagramm Anzahl Antworten von API-Server nicht angezeigt, obwohl die Antworten zwischen Startzeit und Endzeit zurückgegeben wurden.	Auch wenn die Antworten zwischen der Startzeit und der Endzeit zurückgegeben wurden, kann es sein, dass die X-Achse (Datenanzeigefenster) die Antworten nicht enthält.	Bestätigen Sie, dass die X-Achse (Datenanzeigefenster) den Zeitraum abdeckt, in dem die Antworten zurückgegeben wurden.	Passen Sie die X-Achse (Datenanzeigefenster) nach Bedarf an.
Ich möchte Daten in den Diagrammen als fortlaufende Zeitstrahllinie anzeigen, diese weist jedoch Lücken auf.	Dies ist ein erwartetes Verhalten. Wenn es für das ausgewählte Intervall keine Metrikdaten gibt, wird keine fortlaufende Datenlinie angezeigt.	Erhöhen Sie das Intervall (z.B. von 1 Minute auf 5 Minuten oder von 1 Minute auf 1 Stunde).	Passen Sie das Intervall nach Bedarf an.

API verwenden

Informationen zur Verwendung der API und zu Signieranforderungen finden Sie unter REST-API-Dokumentation und Sicherheitszugangsdaten. Informationen zu SDKs finden Sie unter SDKs und die CLI.

Verwenden Sie die folgenden APIs für das Monitoring:

Monitoring-API für Metriken und Alarme
Notifications-API für Benachrichtigungen (umfasst Alarme)