Metriken der Kubernetes-Engine (OKE)
Informieren Sie sich über die von der Kubernetes Engine (OKE) ausgegebenen Metriken.
Sie können den Zustand, die Kapazität und die Performance von Kubernetes-Clustern, die von der Kubernetes-Engine verwaltet werden, mit Metriken, Alarmen und Benachrichtigungen überwachen.
In diesem Thema werden die von der Kubernetes-Engine ausgegebenen Metriken im Metrik-Namespace oci_oke
beschrieben.
Ressourcen: Cluster, Worker-Knoten
Überblick über die Metriken des Kubernetes-Engine-(OKE-)Service
Mit den Metriken der Kubernetes-Engine können Sie Kubernetes-Cluster zusammen mit Knotenpools und einzelnen Worker-Knoten überwachen. Mit Metrikdaten können Sie Cluster- und Knotenpoolprobleme diagnostizieren und beheben.
Während die Häufigkeit je nach Metrik variiert, weisen Standardservicemetriken im Allgemeinen eine Häufigkeit von 60 Sekunden auf (d.h. pro Minute wird mindestens ein Datenpunkt gepostet).
Um ein Standardset von Metrikdiagrammen in der Konsole anzuzeigen, navigieren Sie zum gewünschten Cluster, und klicken Sie auf Metriken. Mit dem Monitoring-Service können Sie auch benutzerdefinierte Abfragen erstellen. Siehe Metrikabfragen erstellen.
Voraussetzungen
IAM-Policys: Um Ressourcen zu überwachen, benötigen Sie den erforderlichen Zugriffstyp in einer von einem Administrator geschriebenen Policy . Geben Sie dabei an, ob Sie die Konsole oder die REST-API mit einem SDK, einer CLI oder einem anderen Tool verwenden. Die Policy muss Ihnen Zugriff sowohl auf die Monitoring-Services als auch auf die überwachten Ressourcen erteilen. Wenn Sie versuchen, eine Aktion auszuführen, und eine Nachricht erhalten, dass Sie keine Berechtigung haben oder nicht autorisiert sind, wenden Sie sich an den Administrator, um herauszufinden, welcher Zugriffstyp Ihnen erteilt wurde und in welchem Compartment Sie arbeiten müssen. Weitere Informationen zu Benutzerautorisierungen für Monitoring finden Sie unter IAM -Policys.
Beispiel: Um die Bedingung von Knoten in einem Kubernetes-Cluster zu beobachten, muss Ihnen der Zugriff mit einer Policy-Anweisung wie der folgenden erteilt worden sein:
Allow group <group-name> to read metrics in <location>
Verfügbare Metriken: oci_oke
Die Metriken in den folgenden Tabellen sind automatisch für alle von Ihnen erstellten Kubernetes-Cluster verfügbar. Sie müssen Monitoring für die Ressource nicht aktivieren, um diese Metriken abzurufen.
Metriken der Kubernetes-Engine enthalten die folgenden Dimensionen:
- RESOURCEID
- Die OCID der Ressource, für die die Metrik gilt.
- RESOURCEDISPLAYNAME
- Der Name der Ressource, auf die sich die Metrik bezieht.
- RESPONSECODE
- Der vom Kubernetes-API-Server gesendete Antwortcode.
- RESPONSEGROUP
- Die Antwortcodegruppe basierend auf der ersten Ziffer des Antwortcodes (Beispiel: 2xx, 3xx, 4xx, 5xx).
- CLUSTERID
- Die OCID des Clusters, für das die Metrik gilt.
- NODEPOOLID
- Die OCID des Knotenpools, für den die Metrik gilt.
- NODESTATE
- Der Status der Compute-Instanz, die den Worker-Knoten hostet. Beispiel: ACTIVE, CREATING, DELETING, DELETED, FAILED, UPDATING, INACTIVE.
- NODECONDITION
- Die Bedingung des Worker-Knotens, wie vom Kubernetes-API-Server angegeben. Beispiel: Ready, MemoryPressure, PIDPressure, DiskPressure, NetworkUnavailable.
- AVAILABILITYDOMAIN
- Die Availability-Domain, in der sich die Compute-Instanz befindet.
- FAULTDOMAIN
- Die Faultdomain, in der sich die Compute-Instanz befindet.
Metrik | Metrikanzeigename | Einheit | Beschreibung | Dimensionen |
---|---|---|---|---|
APIServerRequestCount
|
API-Serveranforderungen | Anzahl | Anzahl der vom Kubernetes-API-Server empfangenen Anforderungen. |
|
APIServerResponseCount
|
Anzahl Antworten von API-Server | Anzahl | Anzahl unterschiedlicher Nicht-200-Antworten (d.h. Fehlerantworten), die vom Kubernetes-API-Server gesendet wurden. | resourceId
|
UnschedulablePods
|
Nicht terminierbare Pods | Anzahl | Anzahl der Pods, die vom Kubernetes-Scheduler nicht geplant werden können. Nicht in Clustern verfügbar, in denen Kubernetes-Versionen vor 1.15.x ausgeführt werden. | resourceId
|
NodeState
|
Knotenstatus | Anzahl | Anzahl der Compute Nodes in verschiedenen Status. | resourceId
|
KubernetesNodeCondition
|
Kubernetes-Knotenbedingung | Anzahl |
Anzahl der Worker-Knoten in unterschiedlichen Bedingungen, wie vom Kubernetes-API-Server angegeben. |
resourceId
|
Konsole verwenden
- Öffnen Sie das Navigationsmenü , und wählen Sie Entwicklerservices aus. Wählen Sie unter Container und Artefakte die Option Kubernetes-Cluster (OKE) aus.
- Wählen Sie die Region aus, die Sie mit der Kubernetes-Engine verwenden.
-
Wählen Sie das Compartment mit dem Cluster aus, für das Sie Metriken anzeigen möchten.
Auf der Seite Cluster werden alle Cluster im ausgewählten Compartment angezeigt.
- Klicken Sie auf den Namen des Clusters, für das Sie Metriken anzeigen möchten.
-
Klicken Sie unter Ressourcen auf Metriken.
Auf der Registerkarte Metriken wird ein Diagramm für jede Metrik des Clusters angezeigt, die vom Kubernetes-Engine-Metrik-Namespace ausgegeben wird. Zum Anzeigen von Metriken für einen Knotenpool im Cluster öffnen Sie die Registerkarte Knotenpools. Klicken Sie dann auf den Namen des Knotenpools, und zeigen Sie die Registerkarte Metriken an. Zum Anzeigen von Metriken für einen Worker-Knoten im Knotenpool öffnen Sie die Registerkarte Knoten. Klicken Sie dann neben dem Namen des Worker-Knotens auf den Link Metriken anzeigen. Weitere Informationen zu den ausgegebenen Metriken finden Sie unter Verfügbare Metriken: oci_oke.
Weitere Informationen zu Monitoringmetriken und zur Verwendung von Alarmen finden Sie in Überblick über Monitoring. Informationen zu Benachrichtigungen für Alarme finden Sie unter Überblick über Benachrichtigungen.
Wenn die erwarteten Metrikdaten für ein Cluster nicht angezeigt werden, lesen Sie die folgenden möglichen Ursachen und Lösungen.
Problem | Mögliche Ursache | Prüfung | Lösung |
---|---|---|---|
Ich weiß, dass der Kubernetes-API-Server einige Fehlerantworten zurückgegeben hat, aber diese werden im Diagramm Anzahl Antworten von API-Server nicht angezeigt. |
Die Antworten wurden möglicherweise außerhalb des Zeitraums zurückgegeben, der vom Diagramm Anzahl Antworten von API-Server abgedeckt wird. | Bestätigen Sie, dass Startzeit und Endzeit den Zeitraum abdecken, in dem die Antworten zurückgegeben wurden. | Passen Sie die Startzeit und die Endzeit nach Bedarf an. |
Ich weiß, dass der Kubernetes-API-Server einige Fehlerantworten zurückgegeben hat, aber diese werden im Diagramm Anzahl Antworten von API-Server nicht angezeigt, obwohl die Antworten zwischen Startzeit und Endzeit zurückgegeben wurden. | Auch wenn die Antworten zwischen der Startzeit und der Endzeit zurückgegeben wurden, kann es sein, das die X-Achse (Datenanzeigefenster) die Antworten ausschließt. | Bestätigen Sie, dass die X-Achse (Datenanzeigefenster) den Zeitraum abdeckt, in dem die Antworten zurückgegeben wurden. | Passen Sie die X-Achse (Datenanzeigefenster) nach Bedarf an. |
Ich möchte Daten in den Diagrammen als fortlaufende Zeitstrahllinie anzeigen, diese weist jedoch Lücken auf. | Dies ist ein erwartetes Verhalten. Wenn es für das ausgewählte Intervall keine Metrikdaten gibt, wird keine fortlaufende Datenlinie angezeigt. | Erhöhen Sie das Intervall (z.B. von 1 Minute auf 5 Minuten oder von 1 Minute auf 1 Stunde). | Passen Sie das Intervall nach Bedarf an. |
API verwenden
Informationen zur Verwendung der API und zu Signieranforderungen finden Sie unter REST-API-Dokumentation und Sicherheitszugangsdaten. Informationen zu SDKs finden Sie unter SDKs und die CLI.
- Monitoring-API für Metriken und Alarme
- Notifications-API für Benachrichtigungen (umfasst Alarme)