Metriche delle istanze di computazione

Puoi monitorare lo stato, la capacità e le prestazioni delle istanze di computazione utilizzando le metriche, gli allarmi e le notifiche.

Questo argomento descrive le metriche emesse dallo spazio di nomi delle metriche oci_computeagent (il plugin Monitoraggio istanza di computazione nelle istanze di computazione).

Puoi visualizzare queste metriche per le singole istanze di computazione e per tutte le istanze di un pool di istanze.

Risorse: istanze di computazione abilitate per il monitoraggio.

Panoramica delle metriche per un'istanza e le risorse correlate

Questa sezione fornisce un quadro generale dei diversi tipi di metriche disponibili per un'istanza e dei relativi dispositivi di storage e di rete. Per un riepilogo, vedere il diagramma e la tabella riportati di seguito.

Questa immagine mostra i tipi di metriche disponibili per un'istanza e i componenti correlati.

Spazio di nomi metrica ID risorsa Dove misurato Parametri disponibili
oci_computeagent OCID istanza Sull'istanza. Le metriche in questo spazio di nomi vengono aggregate in tutte le risorse correlate nell'istanza. Ad esempio, DiskBytesRead viene aggregato in tutti i volumi di storage collegati dell'istanza e NetworkBytesIn viene aggregato in tutte le VNIC collegate all'istanza.

Vedere Metriche disponibili: oci_computeagent.

oci_blockstore OCID volume di avvio o a blocchi dal servizio per volumi a blocchi. Le metriche si riferiscono a un singolo volume (volume di avvio o volume a blocchi). Vedere Metriche dei volumi a blocchi.
oci_vcn OCID VNIC dal servizio di networking. Le metriche si riferiscono a una singola VNIC.

Vedere Metriche VNIC.

Informazioni preliminari

  • Criteri IAM: per monitorare le risorse, è necessario disporre del tipo di accesso richiesto in un criterio scritto da un amministratore, indipendentemente dal fatto che si stia utilizzando la console o l'API REST con un SDK, un'interfaccia CLI o un altro strumento. Il criterio deve consentire l'accesso sia ai servizi di monitoraggio che alle risorse monitorate. Se si tenta di eseguire un'azione e si riceve un messaggio che informa che non si dispone dell'autorizzazione o che non si è autorizzati, contattare l'amministratore per scoprire il tipo di accesso concesso e il compartimento in cui è necessario lavorare. Per ulteriori informazioni sulle autorizzazioni utente per il monitoraggio, vedere Criteri IAM.
  • Le metriche esistono nel servizio di monitoraggio: le risorse che si desidera monitorare devono emettere metriche nel servizio di monitoraggio.
  • Istanze di computazione: per emettere metriche, il plugin Monitoraggio istanza di computazione deve essere abilitato nell'istanza e i plugin devono essere in esecuzione. L'istanza deve inoltre disporre di un gateway di servizi o di un indirizzo IP pubblico per inviare le metriche al servizio di monitoraggio. Per ulteriori informazioni, vedere Abilitazione del monitoraggio per le istanze di computazione.

Parametri disponibili: oci_computeagent

Le metriche delle istanze di computazione consentono di misurare il livello di attività e il throughput delle istanze di computazione. Le metriche elencate nella tabella riportata di seguito sono disponibili per qualsiasi istanza di computazione abilitata al monitoraggio. Per ottenere queste metriche, abilitare il monitoraggio sull'istanza.

Le metriche in questo spazio di nomi vengono aggregate in tutte le risorse correlate nell'istanza. Ad esempio, DiskBytesRead viene aggregato in tutti i volumi di storage collegati dell'istanza e NetworkBytesIn viene aggregato in tutte le VNIC collegate all'istanza.

Per le metriche emesse dallo spazio di nomi delle metriche oci_computeagent, i datapoint vengono campionati ogni dieci secondi. Ogni minuto viene emesso un batch di sei datapoint. Pertanto, per ogni minuto di granularità, il conteggio aggregato è sempre sei, la somma aggregata è la somma dei sei punti dati e la media aggregata è la media dei sei punti dati.

È inoltre possibile utilizzare il servizio di monitoraggio per creare interrogazioni personalizzate.

Ogni metrica include le dimensioni riportate di seguito.

availabilityDomain
Il dominio di disponibilità in cui risiede l'istanza.
faultDomain
Il dominio di errore in cui risiede l'istanza.
imageId
OCID dell'immagine per l'istanza.
instancePoolId
Il pool di istanze a cui appartiene l'istanza.
regione
L'area in cui risiede l'istanza.
resourceDisplayName
Il nome descrittivo dell'istanza.
resourceId
L'OCID dell'istanza.
forma
La forma dell'istanza.
Parametro Nome visualizzato metrica Unità descrizione Dimensioni
CpuUtilization Utilizzo CPU percento

Livello di attività della CPU. Espresso come percentuale del tempo totale.

Ad esempio, la media del valore viene calcolata in tutte le istanze del pool.

availabilityDomain

faultDomain

imageId

instancePoolId

region

resourceDisplayName

resourceId

shape

DiskBytesRead1, 3 Byte letti da disco byte Throughput di lettura. Espresso come byte letti per intervallo.
DiskBytesWritten1, 3 Byte scritti su disco byte Throughput di scrittura. Espresso come byte scritti per intervallo.
DiskIopsRead1, 3 I/O lettura da disco operazioni Livello di attività sulla base della lettura di I/O. Espresso come letture per intervallo.
DiskIopsWritten1, 3 I/O scrittura su disco operazioni Livello di attività sulla base delle scritture di I/O. Espresso come scritture per intervallo.
LoadAverage Carico medio numero di processi Caricamento medio del sistema calcolato su un periodo di 1 minuto.
MemoryAllocationStalls Blocchi di allocazione della memoria numero di stalle Numero di volte in cui il recupero della pagina è stato richiamato in modo diretto.
MemoryUtilization1 Utilizzo memoria percento

Spazio attualmente in uso. Misurato dalle pagine. Espresso come percentuale delle pagine utilizzate.

Ad esempio, la media del valore viene calcolata in tutte le istanze del pool.

NetworksBytesIn1, 2 Byte di ricezione di rete byte

Throughput ricezione rete. Espresso come byte ricevuti.

NetworksBytesOut1, 2 Byte di trasmissione rete byte Velocità di trasmissione della rete. Espresso come byte trasmessi.

1Questa metrica è un contatore cumulativo che mostra un comportamento di aumento monotono per ogni sessione del software Oracle Cloud Agent, che viene reimpostato al riavvio del sistema operativo.

2Il servizio di networking fornisce più metriche (nello spazio di nomi delle metriche oci_vcn) per ogni VNIC nell'istanza. Per ulteriori informazioni, vedere Metriche di rete.

3Il servizio per volumi a blocchi fornisce più metriche (nello spazio di nomi delle metriche oci_blockstore) per ogni volume collegato all'istanza. Per ulteriori informazioni, vedere Metriche dei volumi a blocchi.

Parametri disponibili: gpu_infrastructure_health

Le metriche delle istanze di computazione consentono di misurare il livello di attività e il throughput delle istanze di computazione. Le metriche elencate nella tabella riportata di seguito sono disponibili per qualsiasi istanza di computazione abilitata al monitoraggio. Per ottenere queste metriche, abilitare il monitoraggio sull'istanza.

Le metriche in questo spazio di nomi vengono aggregate in tutte le risorse correlate nell'istanza. Ad esempio, DiskBytesRead viene aggregato in tutti i volumi di storage collegati dell'istanza e NetworkBytesIn viene aggregato in tutte le VNIC collegate all'istanza.

Per le metriche emesse dallo spazio di nomi delle metriche gpu_infrastructure_health, i datapoint vengono campionati ogni dieci secondi. Ogni minuto viene emesso un batch di sei datapoint. Pertanto, per ogni minuto di granularità, il conteggio aggregato è sempre sei, la somma aggregata è la somma dei sei punti dati e la media aggregata è la media dei sei punti dati.

È inoltre possibile utilizzare il servizio di monitoraggio per creare interrogazioni personalizzate.

Ogni metrica include le dimensioni riportate di seguito.

componente
GPU o rdma_nic
Indicatore orario
Ora UTC in cui viene emesso il payload/heartbeat
versione
Numero di versione del payload per la compatibilità
Parametro Nome visualizzato metrica Unità descrizione Dimensioni
GpuUtilization Utilizzo GPU percento

Livello di attività della GPU. Espresso come percentuale del tempo totale.

Ad esempio, la media del valore viene calcolata in tutte le istanze del pool.

availabilityDomain

faultDomain

gpuId

imageId

instancePoolId

region

resourceDisplayName

resourceId

shape

GpuMemoryUtilization Utilizzo memoria GPU percento Percentuale della risorsa di memoria GPU in uso.
GpuPowerDraw Assorbimento di energia della GPU integer Quantità di potenza GPU utilizzata.
GpuTemperature Temperatura GPU integer Temperatura GPU segnalata.
GpuEccSingleBitErrors Errori della GPU a bit singolo integer Numero di errori ECC a singolo bit della GPU segnalati.
GpuEccDoubleBitErrors Errori GPU a doppio bit integer Numero di errori ECC a doppio bit GPU segnalati.

1Questa metrica è un contatore cumulativo che mostra un comportamento di aumento monotono per ogni sessione del software Oracle Cloud Agent, che viene reimpostato al riavvio del sistema operativo.

2Il servizio di networking fornisce più metriche (nello spazio di nomi delle metriche oci_vcn) per ogni VNIC nell'istanza. Per ulteriori informazioni, vedere Metriche di rete.

3Il servizio per volumi a blocchi fornisce più metriche (nello spazio di nomi delle metriche oci_blockstore) per ogni volume collegato all'istanza. Per ulteriori informazioni, vedere Metriche dei volumi a blocchi.

Metriche degli errori: gpu_infrastructure_health

Parametro Nome visualizzato metrica Unità descrizione Dimensioni
Fault Errore GPU Conteggio

Se il valore è 0, non sono presenti errori. Se il valore è 1, vengono rilevati errori.

availabilityDomain

faultCode

faultDomain

gpuId

imageId

instancePoolId

pcieAddress

region

resourceDisplayName

resourceId

shape

1Questa metrica è un contatore cumulativo che mostra un comportamento di aumento monotono per ogni sessione del software Oracle Cloud Agent, che viene reimpostato al riavvio del sistema operativo.

2Il servizio di networking fornisce più metriche (nello spazio di nomi delle metriche oci_vcn) per ogni VNIC nell'istanza. Per ulteriori informazioni, vedere Metriche di rete.

3Il servizio per volumi a blocchi fornisce più metriche (nello spazio di nomi delle metriche oci_blockstore) per ogni volume collegato all'istanza. Per ulteriori informazioni, vedere Metriche dei volumi a blocchi.

Parametri disponibili: rdma_infrastructure_health

Le metriche delle istanze di computazione consentono di misurare il livello di attività e il throughput delle istanze di computazione. Le metriche elencate nella tabella riportata di seguito sono disponibili per qualsiasi istanza di computazione abilitata al monitoraggio. Per ottenere queste metriche, abilitare il monitoraggio sull'istanza.

Le metriche in questo spazio di nomi vengono aggregate in tutte le risorse correlate nell'istanza. Ad esempio, DiskBytesRead viene aggregato in tutti i volumi di storage collegati dell'istanza e NetworkBytesIn viene aggregato in tutte le VNIC collegate all'istanza.

Per le metriche emesse dallo spazio di nomi delle metriche rdma_infrastructure_health, i datapoint vengono campionati ogni dieci secondi. Ogni minuto viene emesso un batch di sei datapoint. Pertanto, per ogni minuto di granularità, il conteggio aggregato è sempre sei, la somma aggregata è la somma dei sei punti dati e la media aggregata è la media dei sei punti dati.

È inoltre possibile utilizzare il servizio di monitoraggio per creare interrogazioni personalizzate.

Ogni metrica include le dimensioni riportate di seguito.

componente
GPU o rdma_nic
Indicatore orario
Ora UTC in cui viene emesso il payload/heartbeat
versione
Numero di versione del payload per la compatibilità
Metrica Nome visualizzato metrica Unità descrizione; Dimensioni
RdmaTxBytes Byte di trasmissione di rete aggregata RDMA byte I byte trasmessi sull'interfaccia RDMA.

availabilityDomain

faultDomain

imageId

instancePoolId

rdmaId

region

resourceDisplayName

resourceId

shape

RdmaRxBytes Byte di ricezione di rete di aggregazione RDMA byte I byte ricevuti sull'interfaccia RDMA.
RdmaTxPackets Pacchetti di trasmissione di rete aggregata RDMA integer Numero di pacchetti di interfaccia RDMA trasmessi.
RdmaRxPackets La rete aggregata RDMA riceve i pacchetti integer Numero di pacchetti di interfaccia RDMA ricevuti.

1Questa metrica è un contatore cumulativo che mostra un comportamento di aumento monotono per ogni sessione del software Oracle Cloud Agent, che viene reimpostato al riavvio del sistema operativo.

2Il servizio di networking fornisce più metriche (nello spazio di nomi delle metriche oci_vcn) per ogni VNIC nell'istanza. Per ulteriori informazioni, vedere Metriche di rete.

3Il servizio per volumi a blocchi fornisce più metriche (nello spazio di nomi delle metriche oci_blockstore) per ogni volume collegato all'istanza. Per ulteriori informazioni, vedere Metriche dei volumi a blocchi.

Metriche degli errori: rdma_infrastructure_health

Metrica Nome visualizzato metrica Unità descrizione; Dimensioni
RdmaLinkSpeedFault Errori Conteggio Rileva se è presente un errore di velocità del collegamento.

Se il valore è 0, non sono presenti errori. Se il valore è 1, vengono rilevati errori.

availabilityDomain

faultDomain

imageId

instancePoolId

pcieAddress

rdmaId

region

resourceDisplayName

resourceId

shape

RdmaPcieAddressFault Errori Conteggio Rileva se è presente un errore di indirizzo PCIE.

Se il valore è 0, non sono presenti errori. Se il valore è 1, vengono rilevati errori.

RdmaPcieBerCheckFault Errori Conteggio Rileva se è presente un errore PCIE BER.

Se il valore è 0, non sono presenti errori. Se il valore è 1, vengono rilevati errori.

RdmaPcieCableFlapFault Errori Conteggio Rileva se è presente un guasto del flap del cavo PCIE.

Se il valore è 0, non sono presenti errori. Se il valore è 1, vengono rilevati errori.

RdmaPcieCablePlugFault Errori Conteggio Rileva se è presente un errore della spina del cavo PCIE.

Se il valore è 0, non sono presenti errori. Se il valore è 1, vengono rilevati errori.

RdmaPcieCableStateFault Errori Conteggio Rileva se è presente un errore di stato del cavo PCIE.

Se il valore è 0, non sono presenti errori. Se il valore è 1, vengono rilevati errori.

1Questa metrica è un contatore cumulativo che mostra un comportamento di aumento monotono per ogni sessione del software Oracle Cloud Agent, che viene reimpostato al riavvio del sistema operativo.

2Il servizio di networking fornisce più metriche (nello spazio di nomi delle metriche oci_vcn) per ogni VNIC nell'istanza. Per ulteriori informazioni, vedere Metriche di rete.

3Il servizio per volumi a blocchi fornisce più metriche (nello spazio di nomi delle metriche oci_blockstore) per ogni volume collegato all'istanza. Per ulteriori informazioni, vedere Metriche dei volumi a blocchi.

Utilizzo di Console

Per visualizzare i grafici delle metriche predefiniti per una singola istanza di computazione
  1. Aprire il menu di navigazione e selezionare Computazione. In Computazione, selezionare Istanze.
  2. Fare clic sull'istanza a cui si è interessati.
  3. In Risorse fare clic su Metriche.
  4. Nella lista Spazio di nomi metrica, selezionare oci_computeagent.

    Nella pagina Metriche viene visualizzato un set predefinito di grafici per l'istanza corrente.

    Non vengono visualizzati grafici delle metriche per l'istanza?

    Se non vengono visualizzati grafici delle metriche, l'istanza potrebbe non emettere metriche. Vedere le seguenti possibili cause e risoluzioni.

    Causa possibile Modalità di verifica Risoluzione
    Il plugin Monitoraggio istanza di computazione è disabilitato nell'istanza o i plugin vengono arrestati. Rivedere le proprietà dell'istanza. Abilitare il plugin Monitoraggio istanze di computazione e avviare tutti i plugin.
    L'istanza non può accedere al servizio di monitoraggio perché la relativa VCN non utilizza Internet. Rivedere l'indirizzo IP dell'istanza. Se non è pubblico, è necessario un gateway di servizi. Impostare un gateway di servizio.
    L'istanza non utilizza un'immagine supportata. Rivedere le immagini supportate. Creare un'istanza con un'immagine supportata.
    Immagini e immagini personalizzate precedenti: nell'istanza non esiste alcun software agente Oracle Cloud. Connettersi all'istanza e cercare il software. Installare il software Oracle Cloud Agent.
    Si è verificato un problema con il software Oracle Cloud Agent. (non applicabile) Segui i passi di risoluzione dei problemi per l'agente Oracle Cloud.

    Per ulteriori informazioni sulle metriche di monitoraggio e sull'uso degli allarmi, vedere Panoramica del monitoraggio. Per informazioni sulle notifiche per gli allarmi, vedere Panoramica delle notifiche.

Per visualizzare i grafici delle metriche predefiniti per tutte le istanze di computazione in un compartimento
  1. Aprire il menu di navigazione e selezionare Osservabilità e gestione. In Monitoraggio, selezionare Metriche servizio.
  2. Selezionare un compartimento.
  3. Per Spazio di nomi metrica, selezionare oci_computeagent.

    La pagina Metriche servizio aggiorna in modo dinamico la pagina in modo da visualizzare i grafici per ogni metrica emessa dallo spazio di nomi della metrica selezionata.

Per ulteriori informazioni sulle metriche di monitoraggio e sull'uso degli allarmi, vedere Panoramica del monitoraggio. Per informazioni sulle notifiche per gli allarmi, vedere Panoramica delle notifiche.

Per visualizzare i grafici delle metriche predefiniti per le istanze in un pool di istanze
  1. Aprire il menu di navigazione e selezionare Computazione. In Computazione selezionare Pool di istanze.
  2. Fare clic sul pool di istanze a cui si è interessati.
  3. In Risorse fare clic su Metriche.
  4. Nella lista Spazio di nomi metrica, selezionare oci_computeagent.

    La pagina Metriche visualizza un set predefinito di grafici per il pool di istanze corrente.

Per ulteriori informazioni sulle metriche di monitoraggio e sull'uso degli allarmi, vedere Panoramica del monitoraggio. Per informazioni sulle notifiche per gli allarmi, vedere Panoramica delle notifiche.