Metriche sullo stato dell'infrastruttura
Puoi monitorare lo stato, la capacità e le prestazioni dell'infrastruttura per le istanze di virtual machine (VM) e Bare Metal di computazione utilizzando metriche, allarmi e notifiche.
Questo argomento descrive le metriche emesse dallo spazio di nomi delle metriche oci_compute_infrastructure_health.
Risorse: istanze di computazione.
Panoramica delle metriche: oci_compute_infrastructure_health
Le metriche di stato dell'infrastruttura di computazione consentono di monitorare lo stato e lo stato delle istanze di computazione.
- Stato dell'istanza (attivo/inattivo): la metrica
instance_statusconsente di verificare se un'istanza VM è disponibile (attivo) o non disponibile (inattivo) quando è in esecuzione. Se l'istanza non è disponibile per più di 30 minuti, contattare il Supporto. - Stato della manutenzione dell'istanza: la metrica
maintenance_statusconsente di monitorare se un'istanza VM o Bare Metal è pianificata per la manutenzione pianificata dell'infrastruttura. - Stato dell'infrastruttura Bare Metal: la metrica
health_statusconsente di monitorare l'integrità dell'infrastruttura per le istanze Bare Metal, inclusi i componenti hardware quali la CPU e la memoria.
In base al valore delle metriche, puoi spostare in modo proattivo le istanze interessate su hardware in buono stato e quindi ridurre al minimo l'impatto sulle tue applicazioni.
Criterio IAM necessario
Per monitorare le risorse, è necessario disporre del tipo di accesso richiesto in un criterio scritto da un amministratore, indipendentemente dal fatto che si stia utilizzando la console o l'API REST con un SDK, un'interfaccia CLI o un altro strumento. Il criterio deve consentire l'accesso sia ai servizi di monitoraggio che alle risorse monitorate. Se si tenta di eseguire un'azione e si riceve un messaggio che informa che non si dispone dell'autorizzazione o che non si è autorizzati, contattare l'amministratore per scoprire il tipo di accesso concesso e il compartimento in cui è necessario lavorare. Per ulteriori informazioni sulle autorizzazioni utente per il monitoraggio, vedere Criteri IAM.
Metriche disponibili: oci_compute_infrastructure_health
Le metriche elencate nella tabella seguente sono automaticamente disponibili per le istanze. Non è necessario abilitare il monitoraggio sull'istanza per ottenere queste metriche.
È inoltre possibile utilizzare il servizio di monitoraggio per creare interrogazioni personalizzate.
A seconda della metrica, sono disponibili le dimensioni riportate di seguito.
- faultClass
-
Il tipo del problema hardware:
-
CPU: è stato rilevato un problema in una o più CPU. -
MEM-BOOT: un errore nel sottosistema di memoria è stato rilevato durante l'avvio dell'istanza o un riavvio recente. -
MEM-RUNTIME: è stato rilevato un errore nel sottosistema di memoria. -
MGMT-CONTROLLER: è stato rilevato un errore nel controller della gestione dell'istanza. -
PCI: è stato rilevato un errore nel sottosistema PCI. -
PCI-NIC: è stato rilevato un errore nella scheda di interfaccia di rete (NIC) dell'istanza.Importante
La classe di errorePCI-NICè non più valida. Per funzionalità simili, eseguire la migrazione alla classe di errorePCI. -
SDN-INTERFACE: è stato rilevato un errore nell'interfaccia di rete definita del software dell'istanza.
-
- resourceDisplayName
- Nome riconoscibile dall'utente dell'istanza.
- resourceId
- OCID dell'istanza.
- maintenanceDueTime
-
L'ora di inizio pianificata della finestra di manutenzione di 24 ore, nel formato definito da RFC3339.
- computeMaintenanceAction
-
L'azione che Oracle Cloud Infrastructure eseguirà su un'istanza durante un evento di manutenzione pianificata:
-
REBOOT: l'istanza viene migrata dall'host fisico che richiede la manutenzione a un host in buono stata. Se la migrazione in tempo reale non è possibile, viene eseguita la migrazione al riavvio dell'istanza. -
REBUILD_IN_PLACE: l'istanza viene arrestata, ricreata sullo stesso hardware fisico e riavviata. Durante il processo di manutenzione si verifica un tempo di inattività di diverse ore.
-
- recommendedAction
-
Azione che è possibile eseguire prima dell'evento di manutenzione pianificata, in modo da poter controllare in che modo e quando le applicazioni subiscono tempi di inattività.
-
REBOOT: è possibile riavviare l'istanza in modo proattivo prima dell'ora di manutenzione pianificata. Quando si riavvia la migrazione di un'istanza per manutenzione, l'istanza viene arrestata sull'host fisico che richiede manutenzione e quindi riavviata su un host in buono stato.
-
| Metrica | Nome visualizzato metrica | Unità | Descrizione | Dimensioni |
|---|---|---|---|---|
health_status
|
Stato di integrità dell'infrastruttura | Problemi |
Numero di problemi di integrità per un'istanza. Qualsiasi valore diverso da zero indica un difetto di integrità. Questa metrica è disponibile solo per le istanze Bare Metal. |
|
instance_status
|
Stato istanza | Count |
Stato di un'istanza in esecuzione. Il valore 0 indica che l'istanza è disponibile (attiva). Il valore 1 indica che l'istanza non è disponibile (inattiva) a causa di un problema dell'infrastruttura. Se l'istanza viene arrestata, la metrica non ha un valore. Questa metrica è disponibile solo per le istanze VM. |
|
maintenance_status
|
Stato gestione | Count |
Stato di manutenzione di un'istanza. Il valore 0 indica che l'istanza non è pianificata per un evento di manutenzione dell'infrastruttura. Il valore 1 indica che l'istanza è stata pianificata per un evento di manutenzione dell'infrastruttura. Questa metrica è disponibile sia per le istanze VM che Bare Metal. |
|
Uso della console
- Apri il menu di navigazione e seleziona Computazione. In Computazione, selezionare Istanze.
- Fare clic sull'istanza a cui si è interessati.
- In Risorse, fare clic su Metriche.
-
Nell'elenco Spazio di nomi metrica, selezionare oci_compute_infrastructure_health.
Nella pagina Metriche viene visualizzato un set predefinito di grafici per l'istanza corrente.
Per ulteriori informazioni sul monitoraggio delle metriche e sull'uso degli allarmi, vedere Panoramica del monitoraggio. Per informazioni sulle notifiche per gli allarmi, vedere Panoramica delle notifiche.
- Aprire il menu di navigazione e selezionare Osservabilità e gestione. In Monitoraggio, selezionare Metriche servizio.
- Selezionare un compartimento.
-
Per Spazio di nomi metrica, selezionare oci_compute_infrastructure_health.
La pagina Metriche servizio viene aggiornata in modo dinamico per visualizzare i grafici per ogni metrica emessa dallo spazio di nomi della metrica selezionata.
Per ulteriori informazioni sul monitoraggio delle metriche e sull'uso degli allarmi, vedere Panoramica del monitoraggio. Per informazioni sulle notifiche per gli allarmi, vedere Panoramica delle notifiche.
Utilizzo dell'API
Per informazioni sull'uso dell'API e sulle richieste di firma, consultare la documentazione relativa all'API REST e le credenziali di sicurezza. Per informazioni sugli SDK, vedere SDK e CLI.
- API di monitoraggio per metriche e allarmi
- API Notifiche per le notifiche (utilizzate con allarmi)