Metriche sullo stato dell'infrastruttura

Puoi monitorare lo stato, la capacità e le prestazioni dell'infrastruttura per le istanze di virtual machine (VM) e Bare Metal di computazione utilizzando metriche, allarmi e notifiche.

Questo argomento descrive le metriche emesse dallo spazio di nomi delle metriche oci_compute_infrastructure_health.

Risorse: istanze di computazione.

Panoramica delle metriche: oci_compute_infrastructure_health

Le metriche di stato dell'infrastruttura di computazione consentono di monitorare lo stato e lo stato delle istanze di computazione.

Stato dell'istanza (attivo/inattivo): la metrica instance_status consente di verificare se un'istanza VM è disponibile (attivo) o non disponibile (inattivo) quando è in esecuzione. Se l'istanza non è disponibile per più di 30 minuti, contattare il Supporto.
Stato della manutenzione dell'istanza: la metrica maintenance_status consente di monitorare se un'istanza VM o Bare Metal è pianificata per la manutenzione pianificata dell'infrastruttura.
Stato dell'infrastruttura Bare Metal: la metrica health_status consente di monitorare l'integrità dell'infrastruttura per le istanze Bare Metal, inclusi i componenti hardware quali la CPU e la memoria.

In base al valore delle metriche, puoi spostare in modo proattivo le istanze interessate su hardware in buono stato e quindi ridurre al minimo l'impatto sulle tue applicazioni.

Criterio IAM necessario

Per monitorare le risorse, è necessario disporre del tipo di accesso richiesto in un criterio scritto da un amministratore, indipendentemente dal fatto che si stia utilizzando la console o l'API REST con un SDK, un'interfaccia CLI o un altro strumento. Il criterio deve consentire l'accesso sia ai servizi di monitoraggio che alle risorse monitorate. Se si tenta di eseguire un'azione e si riceve un messaggio che informa che non si dispone dell'autorizzazione o che non si è autorizzati, contattare l'amministratore per scoprire il tipo di accesso concesso e il compartimento in cui è necessario lavorare. Per ulteriori informazioni sulle autorizzazioni utente per il monitoraggio, vedere Criteri IAM.

Metriche disponibili: oci_compute_infrastructure_health

Le metriche elencate nella tabella seguente sono automaticamente disponibili per le istanze. Non è necessario abilitare il monitoraggio sull'istanza per ottenere queste metriche.

È inoltre possibile utilizzare il servizio di monitoraggio per creare interrogazioni personalizzate.

A seconda della metrica, sono disponibili le dimensioni riportate di seguito.

faultClass

Il tipo del problema hardware:

CPU: è stato rilevato un problema in una o più CPU.
MEM-BOOT: un errore nel sottosistema di memoria è stato rilevato durante l'avvio dell'istanza o un riavvio recente.
MEM-RUNTIME: è stato rilevato un errore nel sottosistema di memoria.
MGMT-CONTROLLER: è stato rilevato un errore nel controller della gestione dell'istanza.
PCI: è stato rilevato un errore nel sottosistema PCI.
PCI-NIC: è stato rilevato un errore nella scheda di interfaccia di rete (NIC) dell'istanza.

Importante

La classe di errore PCI-NIC è non più valida. Per funzionalità simili, eseguire la migrazione alla classe di errore PCI.
SDN-INTERFACE: è stato rilevato un errore nell'interfaccia di rete definita del software dell'istanza.

Per suggerimenti sulla risoluzione dei problemi e ulteriori informazioni su questi problemi hardware, vedere Monitoraggio dello stato del calcolo per le istanze Bare Metal.

resourceDisplayName

Nome riconoscibile dall'utente dell'istanza.

resourceId

OCID dell'istanza.

maintenanceDueTime

L'ora di inizio pianificata della finestra di manutenzione di 24 ore, nel formato definito da RFC3339.

computeMaintenanceAction

L'azione che Oracle Cloud Infrastructure eseguirà su un'istanza durante un evento di manutenzione pianificata:

REBOOT: l'istanza viene migrata dall'host fisico che richiede la manutenzione a un host in buono stata. Se la migrazione in tempo reale non è possibile, viene eseguita la migrazione al riavvio dell'istanza.
REBUILD_IN_PLACE: l'istanza viene arrestata, ricreata sullo stesso hardware fisico e riavviata. Durante il processo di manutenzione si verifica un tempo di inattività di diverse ore.

recommendedAction

Azione che è possibile eseguire prima dell'evento di manutenzione pianificata, in modo da poter controllare in che modo e quando le applicazioni subiscono tempi di inattività.

REBOOT: è possibile riavviare l'istanza in modo proattivo prima dell'ora di manutenzione pianificata. Quando si riavvia la migrazione di un'istanza per manutenzione, l'istanza viene arrestata sull'host fisico che richiede manutenzione e quindi riavviata su un host in buono stato.


Metrica	Nome visualizzato metrica	Unità	Descrizione	Dimensioni
`health_status`	Stato di integrità dell'infrastruttura	Problemi	Numero di problemi di integrità per un'istanza. Qualsiasi valore diverso da zero indica un difetto di integrità. Questa metrica è disponibile solo per le istanze Bare Metal.	`faultClass` `resourceDisplayName` `resourceId`
`instance_status`	Stato istanza	Count	Stato di un'istanza in esecuzione. Il valore 0 indica che l'istanza è disponibile (attiva). Il valore 1 indica che l'istanza non è disponibile (inattiva) a causa di un problema dell'infrastruttura. Se l'istanza viene arrestata, la metrica non ha un valore. Questa metrica è disponibile solo per le istanze VM.	`resourceDisplayName` `resourceId`
`maintenance_status`	Stato gestione	Count	Stato di manutenzione di un'istanza. Il valore 0 indica che l'istanza non è pianificata per un evento di manutenzione dell'infrastruttura. Il valore 1 indica che l'istanza è stata pianificata per un evento di manutenzione dell'infrastruttura. Questa metrica è disponibile sia per le istanze VM che Bare Metal.	`maintenanceDueTime` `computeMaintenanceAction` `recommendedAction` `resourceDisplayName` `resourceId`

Uso della console

Per visualizzare le metriche dello stato dell'infrastruttura per una singola istanza di computazione

Apri il menu di navigazione e seleziona Computazione. In Computazione, selezionare Istanze.
Fare clic sull'istanza a cui si è interessati.
In Risorse, fare clic su Metriche.
Nell'elenco Spazio di nomi metrica, selezionare oci_compute_infrastructure_health.

Nella pagina Metriche viene visualizzato un set predefinito di grafici per l'istanza corrente.

Per ulteriori informazioni sul monitoraggio delle metriche e sull'uso degli allarmi, vedere Panoramica del monitoraggio. Per informazioni sulle notifiche per gli allarmi, vedere Panoramica delle notifiche.

Per visualizzare le metriche dello stato dell'infrastruttura per tutte le istanze di computazione in un compartimento

Aprire il menu di navigazione e selezionare Osservabilità e gestione. In Monitoraggio, selezionare Metriche servizio.
Selezionare un compartimento.
Per Spazio di nomi metrica, selezionare oci_compute_infrastructure_health.

La pagina Metriche servizio viene aggiornata in modo dinamico per visualizzare i grafici per ogni metrica emessa dallo spazio di nomi della metrica selezionata.

Utilizzo dell'API

Per informazioni sull'uso dell'API e sulle richieste di firma, consultare la documentazione relativa all'API REST e le credenziali di sicurezza. Per informazioni sugli SDK, vedere SDK e CLI.

Utilizzare le seguenti API per il monitoraggio:

API di monitoraggio per metriche e allarmi
API Notifiche per le notifiche (utilizzate con allarmi)