Metriche delle istanze di computazione
Puoi monitorare lo stato, la capacità e le prestazioni delle istanze di computazione utilizzando le metriche, gli allarmi e le notifiche.
Questo argomento descrive le metriche emesse dallo spazio di nomi delle metriche oci_computeagent
(il plugin Monitoraggio istanza di computazione nelle istanze di computazione).
Puoi visualizzare queste metriche per le singole istanze di computazione e per tutte le istanze di un pool di istanze.
Risorse: istanze di computazione abilitate per il monitoraggio.
Panoramica delle metriche per un'istanza e le risorse correlate
Questa sezione fornisce un quadro generale dei diversi tipi di metriche disponibili per un'istanza e dei relativi dispositivi di storage e di rete. Per un riepilogo, vedere il diagramma e la tabella riportati di seguito.
Spazio di nomi metrica | ID risorsa | Dove misurato | Parametri disponibili |
---|---|---|---|
oci_computeagent
|
OCID istanza | Sull'istanza. Le metriche in questo spazio di nomi vengono aggregate in tutte le risorse correlate nell'istanza. Ad esempio, DiskBytesRead viene aggregato in tutti i volumi di storage collegati dell'istanza e NetworkBytesIn viene aggregato in tutte le VNIC collegate all'istanza. |
|
oci_blockstore
|
OCID volume di avvio o a blocchi | dal servizio per volumi a blocchi. Le metriche si riferiscono a un singolo volume (volume di avvio o volume a blocchi). | Vedere Metriche dei volumi a blocchi. |
oci_vcn
|
OCID VNIC | dal servizio di networking. Le metriche si riferiscono a una singola VNIC. |
Vedere Metriche VNIC. |
Informazioni preliminari
- Criteri IAM: per monitorare le risorse, è necessario disporre del tipo di accesso richiesto in un criterio scritto da un amministratore, indipendentemente dal fatto che si stia utilizzando la console o l'API REST con un SDK, un'interfaccia CLI o un altro strumento. Il criterio deve consentire l'accesso sia ai servizi di monitoraggio che alle risorse monitorate. Se si tenta di eseguire un'azione e si riceve un messaggio che informa che non si dispone dell'autorizzazione o che non si è autorizzati, contattare l'amministratore per scoprire il tipo di accesso concesso e il compartimento in cui è necessario lavorare. Per ulteriori informazioni sulle autorizzazioni utente per il monitoraggio, vedere Criteri IAM.
- Le metriche esistono nel servizio di monitoraggio: le risorse che si desidera monitorare devono emettere metriche nel servizio di monitoraggio.
- Istanze di computazione: per emettere metriche, il plugin Monitoraggio istanza di computazione deve essere abilitato nell'istanza e i plugin devono essere in esecuzione. L'istanza deve inoltre disporre di un gateway di servizi o di un indirizzo IP pubblico per inviare le metriche al servizio di monitoraggio. Per ulteriori informazioni, vedere Abilitazione del monitoraggio per le istanze di computazione.
Parametri disponibili: oci_computeagent
Le metriche delle istanze di computazione consentono di misurare il livello di attività e il throughput delle istanze di computazione. Le metriche elencate nella tabella riportata di seguito sono disponibili per qualsiasi istanza di computazione abilitata al monitoraggio. Per ottenere queste metriche, abilitare il monitoraggio sull'istanza.
Le metriche in questo spazio di nomi vengono aggregate in tutte le risorse correlate nell'istanza. Ad esempio, DiskBytesRead
viene aggregato in tutti i volumi di storage collegati dell'istanza e NetworkBytesIn
viene aggregato in tutte le VNIC collegate all'istanza.
Per le metriche emesse dallo spazio di nomi delle metriche oci_computeagent
, i datapoint vengono campionati ogni dieci secondi. Ogni minuto viene emesso un batch di sei datapoint. Pertanto, per ogni minuto di granularità, il conteggio aggregato è sempre sei, la somma aggregata è la somma dei sei punti dati e la media aggregata è la media dei sei punti dati.
È inoltre possibile utilizzare il servizio di monitoraggio per creare interrogazioni personalizzate.
Ogni metrica include le dimensioni riportate di seguito.
- availabilityDomain
- Il dominio di disponibilità in cui risiede l'istanza.
- faultDomain
- Il dominio di errore in cui risiede l'istanza.
- imageId
- OCID dell'immagine per l'istanza.
- instancePoolId
- Il pool di istanze a cui appartiene l'istanza.
- regione
- L'area in cui risiede l'istanza.
- resourceDisplayName
- Il nome descrittivo dell'istanza.
- resourceId
- L'OCID dell'istanza.
- forma
- La forma dell'istanza.
Parametro | Nome visualizzato metrica | Unità | descrizione | Dimensioni |
---|---|---|---|---|
CpuUtilization
|
Utilizzo CPU | percento |
Livello di attività della CPU. Espresso come percentuale del tempo totale. Ad esempio, la media del valore viene calcolata in tutte le istanze del pool. |
|
DiskBytesRead 1, 3 |
Byte letti da disco | byte | Throughput di lettura. Espresso come byte letti per intervallo. | |
DiskBytesWritten 1, 3 |
Byte scritti su disco | byte | Throughput di scrittura. Espresso come byte scritti per intervallo. | |
DiskIopsRead 1, 3 |
I/O lettura da disco | operazioni | Livello di attività sulla base della lettura di I/O. Espresso come letture per intervallo. | |
DiskIopsWritten 1, 3 |
I/O scrittura su disco | operazioni | Livello di attività sulla base delle scritture di I/O. Espresso come scritture per intervallo. | |
LoadAverage |
Carico medio | numero di processi | Caricamento medio del sistema calcolato su un periodo di 1 minuto. | |
MemoryAllocationStalls |
Blocchi di allocazione della memoria | numero di stalle | Numero di volte in cui il recupero della pagina è stato richiamato in modo diretto. | |
MemoryUtilization 1 |
Utilizzo memoria | percento |
Spazio attualmente in uso. Misurato dalle pagine. Espresso come percentuale delle pagine utilizzate. Ad esempio, la media del valore viene calcolata in tutte le istanze del pool. |
|
NetworksBytesIn 1, 2 |
Byte di ricezione di rete | byte |
Throughput ricezione rete. Espresso come byte ricevuti. |
|
NetworksBytesOut 1, 2
|
Byte di trasmissione rete | byte | Velocità di trasmissione della rete. Espresso come byte trasmessi. | |
1Questa metrica è un contatore cumulativo che mostra un comportamento di aumento monotono per ogni sessione del software Oracle Cloud Agent, che viene reimpostato al riavvio del sistema operativo. 2Il servizio di networking fornisce più metriche (nello spazio di nomi delle metriche 3Il servizio per volumi a blocchi fornisce più metriche (nello spazio di nomi delle metriche |
Parametri disponibili: gpu_infrastructure_health
Le metriche delle istanze di computazione consentono di misurare il livello di attività e il throughput delle istanze di computazione. Le metriche elencate nella tabella riportata di seguito sono disponibili per qualsiasi istanza di computazione abilitata al monitoraggio. Per ottenere queste metriche, abilitare il monitoraggio sull'istanza.
Le metriche in questo spazio di nomi vengono aggregate in tutte le risorse correlate nell'istanza. Ad esempio, DiskBytesRead
viene aggregato in tutti i volumi di storage collegati dell'istanza e NetworkBytesIn
viene aggregato in tutte le VNIC collegate all'istanza.
Per le metriche emesse dallo spazio di nomi delle metriche gpu_infrastructure_health
, i datapoint vengono campionati ogni dieci secondi. Ogni minuto viene emesso un batch di sei datapoint. Pertanto, per ogni minuto di granularità, il conteggio aggregato è sempre sei, la somma aggregata è la somma dei sei punti dati e la media aggregata è la media dei sei punti dati.
È inoltre possibile utilizzare il servizio di monitoraggio per creare interrogazioni personalizzate.
Ogni metrica include le dimensioni riportate di seguito.
- componente
- GPU o rdma_nic
- Indicatore orario
- Ora UTC in cui viene emesso il payload/heartbeat
- versione
- Numero di versione del payload per la compatibilità
Parametro | Nome visualizzato metrica | Unità | descrizione | Dimensioni |
---|---|---|---|---|
GpuUtilization
|
Utilizzo GPU | percento |
Livello di attività della GPU. Espresso come percentuale del tempo totale. Ad esempio, la media del valore viene calcolata in tutte le istanze del pool. |
|
GpuMemoryUtilization |
Utilizzo memoria GPU | percento | Percentuale della risorsa di memoria GPU in uso. | |
GpuPowerDraw |
Assorbimento di energia della GPU | integer | Quantità di potenza GPU utilizzata. | |
GpuTemperature |
Temperatura GPU | integer | Temperatura GPU segnalata. | |
GpuEccSingleBitErrors |
Errori della GPU a bit singolo | integer | Numero di errori ECC a singolo bit della GPU segnalati. | |
GpuEccDoubleBitErrors |
Errori GPU a doppio bit | integer | Numero di errori ECC a doppio bit GPU segnalati. | |
1Questa metrica è un contatore cumulativo che mostra un comportamento di aumento monotono per ogni sessione del software Oracle Cloud Agent, che viene reimpostato al riavvio del sistema operativo. 2Il servizio di networking fornisce più metriche (nello spazio di nomi delle metriche 3Il servizio per volumi a blocchi fornisce più metriche (nello spazio di nomi delle metriche |
Metriche degli errori: gpu_infrastructure_health
Parametro | Nome visualizzato metrica | Unità | descrizione | Dimensioni |
---|---|---|---|---|
Fault |
Errore GPU | Conteggio |
Se il valore è 0, non sono presenti errori. Se il valore è 1, vengono rilevati errori. |
|
1Questa metrica è un contatore cumulativo che mostra un comportamento di aumento monotono per ogni sessione del software Oracle Cloud Agent, che viene reimpostato al riavvio del sistema operativo. 2Il servizio di networking fornisce più metriche (nello spazio di nomi delle metriche 3Il servizio per volumi a blocchi fornisce più metriche (nello spazio di nomi delle metriche |
Parametri disponibili: rdma_infrastructure_health
Le metriche delle istanze di computazione consentono di misurare il livello di attività e il throughput delle istanze di computazione. Le metriche elencate nella tabella riportata di seguito sono disponibili per qualsiasi istanza di computazione abilitata al monitoraggio. Per ottenere queste metriche, abilitare il monitoraggio sull'istanza.
Le metriche in questo spazio di nomi vengono aggregate in tutte le risorse correlate nell'istanza. Ad esempio, DiskBytesRead
viene aggregato in tutti i volumi di storage collegati dell'istanza e NetworkBytesIn
viene aggregato in tutte le VNIC collegate all'istanza.
Per le metriche emesse dallo spazio di nomi delle metriche rdma_infrastructure_health
, i datapoint vengono campionati ogni dieci secondi. Ogni minuto viene emesso un batch di sei datapoint. Pertanto, per ogni minuto di granularità, il conteggio aggregato è sempre sei, la somma aggregata è la somma dei sei punti dati e la media aggregata è la media dei sei punti dati.
È inoltre possibile utilizzare il servizio di monitoraggio per creare interrogazioni personalizzate.
Ogni metrica include le dimensioni riportate di seguito.
- componente
- GPU o rdma_nic
- Indicatore orario
- Ora UTC in cui viene emesso il payload/heartbeat
- versione
- Numero di versione del payload per la compatibilità
Metrica | Nome visualizzato metrica | Unità | descrizione; | Dimensioni |
---|---|---|---|---|
RdmaTxBytes
|
Byte di trasmissione di rete aggregata RDMA | byte | I byte trasmessi sull'interfaccia RDMA. |
|
RdmaRxBytes |
Byte di ricezione di rete di aggregazione RDMA | byte | I byte ricevuti sull'interfaccia RDMA. | |
RdmaTxPackets |
Pacchetti di trasmissione di rete aggregata RDMA | integer | Numero di pacchetti di interfaccia RDMA trasmessi. | |
RdmaRxPackets |
La rete aggregata RDMA riceve i pacchetti | integer | Numero di pacchetti di interfaccia RDMA ricevuti. | |
1Questa metrica è un contatore cumulativo che mostra un comportamento di aumento monotono per ogni sessione del software Oracle Cloud Agent, che viene reimpostato al riavvio del sistema operativo. 2Il servizio di networking fornisce più metriche (nello spazio di nomi delle metriche 3Il servizio per volumi a blocchi fornisce più metriche (nello spazio di nomi delle metriche |
Metriche degli errori: rdma_infrastructure_health
Metrica | Nome visualizzato metrica | Unità | descrizione; | Dimensioni |
---|---|---|---|---|
RdmaLinkSpeedFault |
Errori | Conteggio | Rileva se è presente un errore di velocità del collegamento. Se il valore è 0, non sono presenti errori. Se il valore è 1, vengono rilevati errori. |
|
RdmaPcieAddressFault |
Errori | Conteggio | Rileva se è presente un errore di indirizzo PCIE. Se il valore è 0, non sono presenti errori. Se il valore è 1, vengono rilevati errori. |
|
RdmaPcieBerCheckFault |
Errori | Conteggio | Rileva se è presente un errore PCIE BER. Se il valore è 0, non sono presenti errori. Se il valore è 1, vengono rilevati errori. |
|
RdmaPcieCableFlapFault |
Errori | Conteggio | Rileva se è presente un guasto del flap del cavo PCIE. Se il valore è 0, non sono presenti errori. Se il valore è 1, vengono rilevati errori. |
|
RdmaPcieCablePlugFault |
Errori | Conteggio | Rileva se è presente un errore della spina del cavo PCIE. Se il valore è 0, non sono presenti errori. Se il valore è 1, vengono rilevati errori. |
|
RdmaPcieCableStateFault |
Errori | Conteggio | Rileva se è presente un errore di stato del cavo PCIE. Se il valore è 0, non sono presenti errori. Se il valore è 1, vengono rilevati errori. |
|
1Questa metrica è un contatore cumulativo che mostra un comportamento di aumento monotono per ogni sessione del software Oracle Cloud Agent, che viene reimpostato al riavvio del sistema operativo. 2Il servizio di networking fornisce più metriche (nello spazio di nomi delle metriche 3Il servizio per volumi a blocchi fornisce più metriche (nello spazio di nomi delle metriche |
Utilizzo di Console
- Aprire il menu di navigazione e selezionare Computazione. In Computazione, selezionare Istanze.
- Fare clic sull'istanza a cui si è interessati.
- In Risorse fare clic su Metriche.
-
Nella lista Spazio di nomi metrica, selezionare oci_computeagent.
Nella pagina Metriche viene visualizzato un set predefinito di grafici per l'istanza corrente.
Non vengono visualizzati grafici delle metriche per l'istanza?Se non vengono visualizzati grafici delle metriche, l'istanza potrebbe non emettere metriche. Vedere le seguenti possibili cause e risoluzioni.
Causa possibile Modalità di verifica Risoluzione Il plugin Monitoraggio istanza di computazione è disabilitato nell'istanza o i plugin vengono arrestati. Rivedere le proprietà dell'istanza. Abilitare il plugin Monitoraggio istanze di computazione e avviare tutti i plugin. L'istanza non può accedere al servizio di monitoraggio perché la relativa VCN non utilizza Internet. Rivedere l'indirizzo IP dell'istanza. Se non è pubblico, è necessario un gateway di servizi. Impostare un gateway di servizio. L'istanza non utilizza un'immagine supportata. Rivedere le immagini supportate. Creare un'istanza con un'immagine supportata. Immagini e immagini personalizzate precedenti: nell'istanza non esiste alcun software agente Oracle Cloud. Connettersi all'istanza e cercare il software. Installare il software Oracle Cloud Agent. Si è verificato un problema con il software Oracle Cloud Agent. (non applicabile) Segui i passi di risoluzione dei problemi per l'agente Oracle Cloud. Per ulteriori informazioni sulle metriche di monitoraggio e sull'uso degli allarmi, vedere Panoramica del monitoraggio. Per informazioni sulle notifiche per gli allarmi, vedere Panoramica delle notifiche.
- Aprire il menu di navigazione e selezionare Osservabilità e gestione. In Monitoraggio, selezionare Metriche servizio.
- Selezionare un compartimento.
-
Per Spazio di nomi metrica, selezionare oci_computeagent.
La pagina Metriche servizio aggiorna in modo dinamico la pagina in modo da visualizzare i grafici per ogni metrica emessa dallo spazio di nomi della metrica selezionata.
Per ulteriori informazioni sulle metriche di monitoraggio e sull'uso degli allarmi, vedere Panoramica del monitoraggio. Per informazioni sulle notifiche per gli allarmi, vedere Panoramica delle notifiche.
- Aprire il menu di navigazione e selezionare Computazione. In Computazione selezionare Pool di istanze.
- Fare clic sul pool di istanze a cui si è interessati.
- In Risorse fare clic su Metriche.
-
Nella lista Spazio di nomi metrica, selezionare oci_computeagent.
La pagina Metriche visualizza un set predefinito di grafici per il pool di istanze corrente.
Per ulteriori informazioni sulle metriche di monitoraggio e sull'uso degli allarmi, vedere Panoramica del monitoraggio. Per informazioni sulle notifiche per gli allarmi, vedere Panoramica delle notifiche.
Utilizzo dell'API
Per informazioni sull'uso dell'API e delle richieste di firma, consulta la documentazione dell'API REST e le credenziali di sicurezza. Per informazioni sugli SDK, vedere SDK e l'interfaccia CLI.
- Monitoraggio dell'API per metriche e allarmi
- API Notifiche per le notifiche (utilizzata con gli allarmi)