Compute-Instanzmetriken

Sie können Zustand, Kapazität und Performance Ihrer Compute-Instanzen mit Metriken, Alarmen und Benachrichtigungen überwachen.

In diesem Thema werden die Metriken beschrieben, die vom Metrik-Namespace oci_computeagent (dem Compute Instance Monitoring-Plug-in auf Compute-Instanzen) ausgegeben werden.

Sie können diese Metriken für einzelne Compute-Instanzen und für alle Instanzen in einem Instanzpool anzeigen.

Ressourcen: Monitoringfähige Compute-Instanzen.

Überblick über Metriken für eine Instanz und zugehörige Ressourcen

Dieser Abschnitt gibt Ihnen ein Gesamtbild der verschiedenen Metriktypen, die für eine Instanz verfügbar sind, sowie deren Speicher- und Netzwerkgeräte. Eine Zusammenfassung finden Sie im folgenden Diagramm und in der folgenden Tabelle.

Diese Abbildung zeigt die für eine Instanz und zugehörige Komponenten verfügbaren Metriktypen.

Metrik-Namespace Ressourcen-ID Messung erfolgt Verfügbare Metriken
oci_computeagent Instanz-OCID In der Instanz. Die Metriken in diesem Namespace werden über alle zugehörigen Ressourcen in der Instanz aggregiert. Beispiel: DiskBytesRead wird über alle angehängten Speicher-Volumes der Instanz aggregiert und NetworkBytesIn über alle angehängten VNICs der Instanz.

Siehe Verfügbare Metriken: oci_computeagent.

oci_blockstore OCID des Boot- oder Block-Volumes Durch den Block-Volume-Service. Die Metriken gelten für ein einzelnes Volume (Boot- oder Block-Volume). Siehe Block-Volume-Metriken.
oci_vcn VNIC-OCID Durch den Networking-Service. Die Metriken gelten für eine einzelne VNIC.

Siehe VNIC-Metriken.

Bevor Sie beginnen

  • IAM-Policys: Um Ressourcen zu überwachen, benötigen Sie den erforderlichen Zugriffstyp in einer von einem Administrator geschriebenen Policy . Geben Sie dabei an, ob Sie die Konsole oder die REST-API mit einem SDK, einer CLI oder einem anderen Tool verwenden. Die Policy muss Ihnen Zugriff auf die Monitoringservices sowie auf die überwachten Ressourcen geben. Wenn Sie versuchen, eine Aktion auszuführen, und eine Meldung erhalten, dass Sie keine Berechtigung haben oder nicht autorisiert sind, wenden Sie sich an den Administrator, um herauszufinden, welcher Zugriffstyp Ihnen erteilt wurde und in welchem Compartment Sie arbeiten müssen. Weitere Informationen zu Benutzerautorisierungen für Monitoring finden Sie unter IAM -Policys.
  • Metriken sind in Monitoring vorhanden: Die Ressourcen, die Sie überwachen möchten, müssen Metriken an Monitoring ausgeben.
  • Compute-Instanzen: Um Metriken auszugeben, muss das Plug-in für das Compute-Instanzmonitoring auf der Instanz aktiviert sein, und Plug-ins müssen ausgeführt werden. Die Instanz muss außerdem über ein Servicegateway oder eine öffentliche IP-Adresse verfügen, um Metriken an den Monitoring-Service zu senden. Weitere Informationen finden Sie unter Monitoring für Compute-Instanzen aktivieren.

Verfügbare Metriken: oci_computeagent

Mit den Compute-Instanzmetriken können Sie Aktivitätsebene und Durchsatz von Compute-Instanzen messen. Die in der folgenden Tabelle aufgeführten Metriken sind für jede monitoringfähige Compute-Instanz verfügbar. Um diese Metriken abzurufen, aktivieren Sie Monitoring auf der Instanz.

Die Metriken in diesem Namespace werden über alle zugehörigen Ressourcen in der Instanz aggregiert. Beispiel: DiskBytesRead wird über alle angehängten Speicher-Volumes der Instanz aggregiert und NetworkBytesIn über alle angehängten VNICs der Instanz.

Für Metriken, die vom Metrik-Namespace oci_computeagent ausgegeben werden, werden Datenpunkte alle zehn Sekunden abgefragt. Pro Minute wird ein Batch von sechs Datenpunkten ausgegeben. Daher beträgt die Aggregatanzahl bei einer Granularität von einer Minute immer sechs, die aggregierte Summe ist die Summe der sechs Datenpunkte, und der aggregierte Durchschnitt ist der Durchschnitt der sechs Datenpunkte.

Mit dem Service Monitoring können Sie auch benutzerdefinierte Abfragen erstellen.

Jede Metrik umfasst die folgenden Dimensionen :

availabilityDomain
Die Availability-Domain , in der die Instanz gespeichert ist.
faultDomain
Die Faultdomain , in der die Instanz gespeichert ist.
imageId
Die OCID des Images  für die Instanz.
instancePoolId
Der Instanzpool, zu dem die Instanz gehört.
region
Die Region , in der die Instanz gespeichert ist.
resourceDisplayName
Der benutzerfreundliche Name der Instanz.
resourceId
Die OCID  der Instanz.
shape
Die Ausprägung  der Instanz.
Metrik Metrikanzeigename Einheit Beschreibung Dimensionen
CpuUtilization CPU-Auslastung Prozent

Aktivitätsebene aus CPU. Wird als Prozentsatz der Gesamtzeit ausgedrückt.

Bei Instanzpools wird der Durchschnittswert über alle Instanzen im Pool hinweg ermittelt.

availabilityDomain

faultDomain

imageId

instancePoolId

region

resourceDisplayName

resourceId

shape

DiskBytesRead1, 3 Datenträger-Lesevorgänge in Byte Byte Lesedurchsatz. Wird als Lesevorgänge pro Intervall in Byte ausgedrückt.
DiskBytesWritten1, 3 Datenträger-Schreibvorgänge in Byte Byte Schreibdurchsatz. Wird als Schreibvorgänge pro Intervall in Byte ausgedrückt.
DiskIopsRead1, 3 Datenträger-Lesevorgänge I/O Vorgänge Aktivitätsebene von I/O-Lesevorgängen. Wird als Lesevorgänge pro Intervall ausgedrückt.
DiskIopsWritten1, 3 Datenträger-Schreibvorgänge I/O Vorgänge Aktivitätsebene von I/O-Schreibvorgängen. Wird als Schreibvorgänge pro Intervall ausgedrückt.
LoadAverage Durchschnitt laden Anzahl von Prozessen Durchschnittliche Systemlast, die über einen Zeitraum von 1 Minute berechnet wurde.
MemoryAllocationStalls Speicherzuweisungsverzögerungen Anzahl der Verzögerungen Häufigkeit, mit der die Seitenfreigabe direkt aufgerufen wurde.
MemoryUtilization1 Speicherauslastung Prozent

Aktuell belegter Speicherplatz. Gemessen nach Seiten. Wird als Prozentsatz der verwendeten Seiten ausgedrückt.

Bei Instanzpools wird der Durchschnittswert über alle Instanzen im Pool hinweg ermittelt.

NetworksBytesIn1, 2 Netzwerk-Empfangsvorgänge in Byte Byte

Durchsatz für Netzwerkempfang. Wird als Empfangsvorgänge in Byte ausgedrückt.

NetworksBytesOut1, 2 Netzwerk-Übertragungsvorgänge in Byte Byte Durchsatz für Netzwerkübertragung. Wird als Übertragungsvorgänge in Byte ausgedrückt.

1 Diese Metrik ist ein kumulativer Zähler, der den monotonen Anstieg während jeder Session der Oracle Cloud Agent-Software zeigt und bei einem Neustart des Betriebssystems zurückgesetzt wird.

2 Der Networking-Service stellt weitere Metriken (im Metrik-Namespace oci_vcn) für jede VNIC auf der Instanz bereit. Weitere Informationen finden Sie unter Networking-Metriken.

3 Der Block Volume-Service stellt weitere Metriken (im Metrik-Namespace oci_blockstore) für jedes an die Instanz angehängte Volume bereit. Weitere Informationen finden Sie unter Block-Volume-Metriken.

Verfügbare Metriken: gpu_infrastructure_health

Mit den Compute-Instanzkennzahlen können Sie Aktivitätsebene und Durchsatz von Compute-Instanzen messen. Die in der folgenden Tabelle aufgeführten Metriken sind für jede monitoringfähige Compute-Instanz verfügbar. Um diese Metriken abzurufen, aktivieren Sie Monitoring auf der Instanz.

Die Metriken in diesem Namespace werden über alle zugehörigen Ressourcen in der Instanz aggregiert. Beispiel: DiskBytesRead wird über alle angehängten Speicher-Volumes der Instanz aggregiert und NetworkBytesIn über alle angehängten VNICs der Instanz.

Für Metriken, die vom Metrik-Namespace gpu_infrastructure_health ausgegeben werden, werden Datenpunkte alle zehn Sekunden abgefragt. Pro Minute wird ein Batch von sechs Datenpunkten ausgegeben. Daher beträgt die Aggregatanzahl bei einer Granularität von einer Minute immer sechs, die aggregierte Summe ist die Summe der sechs Datenpunkte, und der aggregierte Durchschnitt ist der Durchschnitt der sechs Datenpunkte.

Mit dem Service Monitoring können Sie auch benutzerdefinierte Abfragen erstellen.

Jede Metrik umfasst die folgenden Dimensionen :

Komponente
GPU oder rdma_nic
Zeitstempel
UTC-Zeit, wenn Payload/Heartbeat ausgegeben wird
Version
Die Payload-Versionsnummer für die Kompatibilität
Metrik Metrikanzeigename Einheit Beschreibung Dimensionen
GpuUtilization GPU-Auslastung Prozent

Aktivitätsebene aus GPU. Wird als Prozentsatz der Gesamtzeit ausgedrückt.

Bei Instanzpools wird der Durchschnittswert über alle Instanzen im Pool hinweg ermittelt.

availabilityDomain

faultDomain

gpuId

imageId

instancePoolId

region

resourceDisplayName

resourceId

shape

GpuMemoryUtilization GPU-Speicherauslastung Prozent Der Prozentsatz der verwendeten GPU-Speicherressource.
GpuPowerDraw GPU-Stromverbrauch Ganzzahl Die Menge der verwendeten GPU-Leistung.
GpuTemperature GPU-Temperatur Ganzzahl Die gemeldete GPU-Temperatur.
GpuEccSingleBitErrors GPU-Ein-Bit-Fehler Ganzzahl Die Anzahl der gemeldeten GPU-Einbit-ECC-Fehler.
GpuEccDoubleBitErrors GPU-Doppelbitfehler Ganzzahl Die Anzahl der gemeldeten GPU-Doppelbit-ECC-Fehler.

1 Diese Metrik ist ein kumulativer Zähler, der den monotonen Anstieg während jeder Session der Oracle Cloud Agent-Software zeigt und bei einem Neustart des Betriebssystems zurückgesetzt wird.

2 Der Networking-Service stellt weitere Metriken (im Metrik-Namespace oci_vcn) für jede VNIC auf der Instanz bereit. Weitere Informationen finden Sie unter Networking-Metriken.

3 Der Block Volume-Service stellt weitere Metriken (im Metrik-Namespace oci_blockstore) für jedes an die Instanz angehängte Volume bereit. Weitere Informationen finden Sie unter Block-Volume-Metriken.

Verfügbare Metriken: rdma_infrastructure_health

Mit den Compute-Instanzmetriken können Sie Aktivitätsebene und Durchsatz von Compute-Instanzen messen. Die in der folgenden Tabelle aufgeführten Metriken sind für jede monitoringfähige Compute-Instanz verfügbar. Um diese Metriken abzurufen, aktivieren Sie Monitoring auf der Instanz.

Die Metriken in diesem Namespace werden über alle zugehörigen Ressourcen in der Instanz aggregiert. Beispiel: DiskBytesRead wird über alle angehängten Speicher-Volumes der Instanz aggregiert und NetworkBytesIn über alle angehängten VNICs der Instanz.

Für Metriken, die vom Metrik-Namespace rdma_infrastructure_health ausgegeben werden, werden Datenpunkte alle zehn Sekunden abgefragt. Pro Minute wird ein Batch von sechs Datenpunkten ausgegeben. Daher beträgt die Aggregatanzahl bei einer Granularität von einer Minute immer sechs, die aggregierte Summe ist die Summe der sechs Datenpunkte, und der aggregierte Durchschnitt ist der Durchschnitt der sechs Datenpunkte.

Mit dem Service Monitoring können Sie auch benutzerdefinierte Abfragen erstellen.

Jede Metrik umfasst die folgenden Dimensionen :

Komponente
GPU oder rdma_nic
Zeitstempel
UTC-Zeit, wenn Payload/Heartbeat ausgegeben wird
Version
Die Payload-Versionsnummer für die Kompatibilität
Metrik Metrikanzeigename Einheit Beschreibung Dimensionen
RdmaTxBytes RDMA-Aggregatnetzwerk-Übertragungsvorgänge in Byte Byte Die auf der RDMA-Schnittstelle übertragenen Byte.

availabilityDomain

faultDomain

imageId

instancePoolId

rdmaId

region

resourceDisplayName

resourceId

shape

RdmaRxBytes RDMA-Aggregatnetzwerk-Empfangsvorgänge in Byte Byte Die auf der RDMA-Schnittstelle erhaltenen Byte.
RdmaTxPackets RDMA-Aggregatnetzwerk-Übertragungspakete Ganzzahl Die Anzahl der übermittelten RDMA-Schnittstellenpakete.
RdmaRxPackets RDMA-Aggregatnetzwerk-Empfangspakete Ganzzahl Die Anzahl der RDMA-Schnittstellenpakete, die empfangen wurden.

1 Diese Metrik ist ein kumulativer Zähler, der den monotonen Anstieg während jeder Session der Oracle Cloud Agent-Software zeigt und bei einem Neustart des Betriebssystems zurückgesetzt wird.

2 Der Networking-Service stellt weitere Metriken (im Metrik-Namespace oci_vcn) für jede VNIC auf der Instanz bereit. Weitere Informationen finden Sie unter Networking-Metriken.

3 Der Block Volume-Service stellt weitere Metriken (im Metrik-Namespace oci_blockstore) für jedes an die Instanz angehängte Volume bereit. Weitere Informationen finden Sie unter Block-Volume-Metriken.

Konsole verwenden

So zeigen Sie Standardmetrikdiagramme für eine Compute-Instanz an
  1. Öffnen Sie das Navigationsmenü, und klicken Sie auf Compute. Klicken Sie unter Compute auf Instanzen.
  2. Klicken Sie auf die gewünschte Instanz.
  3. Klicken Sie unter Ressourcen auf Metriken.
  4. Wählen Sie in der Liste Metrik-Namespace den Eintrag oci_computeagent aus.

    Auf der Seite "Metriken" wird eine Standardgruppe von Diagrammen für die aktuelle Instanz angezeigt.

    Die Metrikdiagramme für die Instanz werden nicht angezeigt?

    Wenn keine Metrikdiagramme angezeigt werden, gibt die Instanz möglicherweise keine Metriken aus. Nachfolgend sind mögliche Ursachen und Lösungen aufgeführt.

    Mögliche Ursache Prüfmethode Lösung
    Das Compute Instance Monitoring-Plug-in ist auf der Instanz deaktiviert, oder Plug-ins wurden gestoppt. Prüfen Sie die Instanzeigenschaften. Aktivieren Sie das Compute Instance Monitoring-Plug-in, und starten Sie alle Plug-ins.
    Die Instanz kann nicht auf den Monitoring-Service zugreifen, weil das VCN das Internet nicht verwendet. Prüfen Sie die IP-Adresse der Instanz. Wenn sie nicht öffentlich ist, ist ein Servicegateway erforderlich. Richten Sie ein Servicegateway ein.
    Die Instanz verwendet kein unterstütztes Image. Prüfen Sie die unterstützten Images. Erstellen Sie eine Instanz mit einem unterstützten Image.
    Ältere Images und benutzerdefinierte Images: Auf der Instanz ist keine Oracle Cloud Agent-Software vorhanden. Stellen Sie eine Verbindung zur Instanz her, und suchen Sie nach der Software. Installieren Sie die Oracle Cloud Agent-Software.
    Bei der Oracle Cloud Agent-Software ist ein anderer Fehler aufgetreten. (Nicht zutreffend) Befolgen Sie die Schritte zur Fehlerbehebung für Oracle Cloud Agent.

    Weitere Informationen zu Monitoringmetriken und zur Verwendung von Alarmen finden Sie in Überblick über Monitoring. Informationen zu Benachrichtigungen für Alarme finden Sie unter Überblick über Benachrichtigungen.

So zeigen Sie Standardmetrikdiagramme für alle Compute-Instanzen in einem Compartment an
  1. Öffnen Sie das Navigationsmenü, und klicken Sie auf Observability and Management. Klicken Sie unter Monitoring auf Servicemetriken.
  2. Wählen Sie ein Compartment aus.
  3. Wählen Sie unter Metrik-Namespace den Eintrag oci_computeagent aus.

    Die Seite Servicemetriken wird dynamisch aktualisiert und zeigt Diagramme für jede vom ausgewählten Metrik-Namespace ausgegebene Metrik an.

Weitere Informationen zu Monitoringmetriken und zur Verwendung von Alarmen finden Sie in Überblick über Monitoring. Informationen zu Benachrichtigungen für Alarme finden Sie unter Überblick über Benachrichtigungen.

So rufen Sie Standardmetrikdiagramme für die Instanzen in einem Instanzpool auf
  1. Öffnen Sie das Navigationsmenü, und klicken Sie auf Compute. Klicken Sie unter Compute auf Instanzpools.
  2. Klicken Sie auf den gewünschten Instanzpool.
  3. Klicken Sie unter Ressourcen auf Metriken.
  4. Wählen Sie in der Liste Metrik-Namespace den Eintrag oci_computeagent aus.

    Auf der Seite "Metriken" wird eine Standardgruppe von Diagrammen für den aktuellen Instanzpool angezeigt.

Weitere Informationen zu Monitoringmetriken und zur Verwendung von Alarmen finden Sie in Überblick über Monitoring. Informationen zu Benachrichtigungen für Alarme finden Sie unter Überblick über Benachrichtigungen.