Metriken der Kubernetes-Engine (OKE)

Informieren Sie sich über die von der Kubernetes Engine (OKE) ausgegebenen Metriken.

Sie können den Zustand, die Kapazität und die Performance von Kubernetes-Clustern, die von der Kubernetes-Engine verwaltet werden, mit Metriken, Alarmen und Benachrichtigungen überwachen.

In diesem Thema werden die von der Kubernetes-Engine ausgegebenen Metriken im Metrik-Namespace oci_oke beschrieben.

Ressourcen: Cluster, Worker-Knoten

Überblick über die Metriken des Kubernetes-Engine-(OKE-)Service

Mit den Metriken der Kubernetes-Engine können Sie Kubernetes-Cluster zusammen mit Knotenpools und einzelnen Worker-Knoten überwachen. Mit Metrikdaten können Sie Cluster- und Knotenpoolprobleme diagnostizieren und beheben.

Während die Häufigkeit je nach Metrik variiert, weisen Standardservicemetriken im Allgemeinen eine Häufigkeit von 60 Sekunden auf (d.h. pro Minute wird mindestens ein Datenpunkt gepostet).

Um ein Standardset von Metrikdiagrammen in der Konsole anzuzeigen, navigieren Sie zum gewünschten Cluster, und klicken Sie auf Metriken. Mit dem Monitoring-Service können Sie auch benutzerdefinierte Abfragen erstellen. Siehe Metrikabfragen erstellen.

Voraussetzungen

IAM-Policys: Um Ressourcen zu überwachen, benötigen Sie den erforderlichen Zugriffstyp in einer von einem Administrator geschriebenen Policy . Geben Sie dabei an, ob Sie die Konsole oder die REST-API mit einem SDK, einer CLI oder einem anderen Tool verwenden. Die Policy muss Ihnen Zugriff sowohl auf die Monitoring-Services als auch auf die überwachten Ressourcen erteilen. Wenn Sie versuchen, eine Aktion auszuführen, und eine Nachricht erhalten, dass Sie keine Berechtigung haben oder nicht autorisiert sind, wenden Sie sich an den Administrator, um herauszufinden, welcher Zugriffstyp Ihnen erteilt wurde und in welchem Compartment Sie arbeiten müssen. Weitere Informationen zu Benutzerautorisierungen für Monitoring finden Sie unter IAM -Policys.

Beispiel: Um die Bedingung von Knoten in einem Kubernetes-Cluster zu beobachten, muss Ihnen der Zugriff mit einer Policy-Anweisung wie der folgenden erteilt worden sein:

Allow group <group-name> to read metrics in <location>

Verfügbare Metriken: oci_oke

Die Metriken in den folgenden Tabellen sind automatisch für alle von Ihnen erstellten Kubernetes-Cluster verfügbar. Sie müssen Monitoring für die Ressource nicht aktivieren, um diese Metriken abzurufen.

Metriken der Kubernetes-Engine enthalten die folgenden Dimensionen:

RESOURCEID
Die OCID  der Ressource, für die die Metrik gilt.
RESOURCEDISPLAYNAME
Der Name der Ressource, auf die sich die Metrik bezieht.
RESPONSECODE
Der vom Kubernetes-API-Server gesendete Antwortcode.
RESPONSEGROUP
Die Antwortcodegruppe basierend auf der ersten Ziffer des Antwortcodes (Beispiel: 2xx, 3xx, 4xx, 5xx).
CLUSTERID
Die OCID  des Clusters, für das die Metrik gilt.
NODEPOOLID
Die OCID  des Knotenpools, für den die Metrik gilt.
NODESTATE
Der Status der Compute-Instanz, die den Worker-Knoten hostet. Beispiel: ACTIVE, CREATING, DELETING, DELETED, FAILED, UPDATING, INACTIVE.
NODECONDITION
Die Bedingung des Worker-Knotens, wie vom Kubernetes-API-Server angegeben. Beispiel: Ready, MemoryPressure, PIDPressure, DiskPressure, NetworkUnavailable.
AVAILABILITYDOMAIN
Die Availability-Domain, in der sich die Compute-Instanz befindet.
FAULTDOMAIN
Die Faultdomain, in der sich die Compute-Instanz befindet.
Metrik Metrikanzeigename Einheit Beschreibung Dimensionen
APIServerRequestCount API-Serveranforderungen Anzahl Anzahl der vom Kubernetes-API-Server empfangenen Anforderungen.

resourceId

resourceDisplayName

APIServerResponseCount Anzahl Antworten von API-Server Anzahl Anzahl unterschiedlicher Nicht-200-Antworten (d.h. Fehlerantworten), die vom Kubernetes-API-Server gesendet wurden. resourceId

resourceDisplayName

responseCode

responseGroup

UnschedulablePods Nicht terminierbare Pods Anzahl Anzahl der Pods, die vom Kubernetes-Scheduler nicht geplant werden können. Nicht in Clustern verfügbar, in denen Kubernetes-Versionen vor 1.15.x ausgeführt werden. resourceId

resourceDisplayName

NodeState Knotenstatus Anzahl Anzahl der Compute Nodes in verschiedenen Status. resourceId

clusterId

nodepoolId

resourceDisplayName

nodeState

nodeCondition

availabilityDomain

faultDomain

KubernetesNodeCondition Kubernetes-Knotenbedingung Anzahl

Anzahl der Worker-Knoten in unterschiedlichen Bedingungen, wie vom Kubernetes-API-Server angegeben.

resourceId

clusterId

nodepoolId

resourceDisplayName

nodeCondition

Konsole verwenden

So zeigen Sie Standardmetrikdiagramme für ein einzelnes Cluster an
  1. Öffnen Sie das Navigationsmenü , und wählen Sie Entwicklerservices aus. Wählen Sie unter Container und Artefakte die Option Kubernetes-Cluster (OKE) aus.
  2. Wählen Sie die Region aus, die Sie mit der Kubernetes-Engine verwenden.
  3. Wählen Sie das Compartment mit dem Cluster aus, für das Sie Metriken anzeigen möchten.

    Auf der Seite Cluster werden alle Cluster im ausgewählten Compartment angezeigt.

  4. Klicken Sie auf den Namen des Clusters, für das Sie Metriken anzeigen möchten.
  5. Klicken Sie unter Ressourcen auf Metriken.

    Auf der Registerkarte Metriken wird ein Diagramm für jede Metrik des Clusters angezeigt, die vom Kubernetes-Engine-Metrik-Namespace ausgegeben wird. Zum Anzeigen von Metriken für einen Knotenpool im Cluster öffnen Sie die Registerkarte Knotenpools. Klicken Sie dann auf den Namen des Knotenpools, und zeigen Sie die Registerkarte Metriken an. Zum Anzeigen von Metriken für einen Worker-Knoten im Knotenpool öffnen Sie die Registerkarte Knoten. Klicken Sie dann neben dem Namen des Worker-Knotens auf den Link Metriken anzeigen. Weitere Informationen zu den ausgegebenen Metriken finden Sie unter Verfügbare Metriken: oci_oke.

    Weitere Informationen zu Monitoringmetriken und zur Verwendung von Alarmen finden Sie in Überblick über Monitoring. Informationen zu Benachrichtigungen für Alarme finden Sie unter Überblick über Benachrichtigungen.

Die erwarteten Clustermetrikdaten werden nicht angezeigt?

Wenn die erwarteten Metrikdaten für ein Cluster nicht angezeigt werden, lesen Sie die folgenden möglichen Ursachen und Lösungen.

Problem Mögliche Ursache Prüfung Lösung

Ich weiß, dass der Kubernetes-API-Server einige Fehlerantworten zurückgegeben hat, aber diese werden im Diagramm Anzahl Antworten von API-Server nicht angezeigt.

Die Antworten wurden möglicherweise außerhalb des Zeitraums zurückgegeben, der vom Diagramm Anzahl Antworten von API-Server abgedeckt wird. Bestätigen Sie, dass Startzeit und Endzeit den Zeitraum abdecken, in dem die Antworten zurückgegeben wurden. Passen Sie die Startzeit und die Endzeit nach Bedarf an.
Ich weiß, dass der Kubernetes-API-Server einige Fehlerantworten zurückgegeben hat, aber diese werden im Diagramm Anzahl Antworten von API-Server nicht angezeigt, obwohl die Antworten zwischen Startzeit und Endzeit zurückgegeben wurden. Auch wenn die Antworten zwischen der Startzeit und der Endzeit zurückgegeben wurden, kann es sein, das die X-Achse (Datenanzeigefenster) die Antworten ausschließt. Bestätigen Sie, dass die X-Achse (Datenanzeigefenster) den Zeitraum abdeckt, in dem die Antworten zurückgegeben wurden. Passen Sie die X-Achse (Datenanzeigefenster) nach Bedarf an.
Ich möchte Daten in den Diagrammen als fortlaufende Zeitstrahllinie anzeigen, diese weist jedoch Lücken auf. Dies ist ein erwartetes Verhalten. Wenn es für das ausgewählte Intervall keine Metrikdaten gibt, wird keine fortlaufende Datenlinie angezeigt. Erhöhen Sie das Intervall (z.B. von 1 Minute auf 5 Minuten oder von 1 Minute auf 1 Stunde). Passen Sie das Intervall nach Bedarf an.