Monitorare il carico di lavoro

Comprendere e adottare un processo di monitoraggio per tutti i servizi Oracle Cloud Infrastructure. Il servizio Monitoraggio utilizza le metriche per monitorare le risorse e gli allarmi per notificare quando le metriche soddisfano trigger specifici degli allarmi.

Analizza metriche operazioni

Architetto di rete, Architetto di infrastruttura

Definire, acquisire e analizzare le metriche delle operazioni per ottenere visibilità sugli eventi.

Il servizio Oracle Cloud Infrastructure Monitoring offre le informazioni dettagliate necessarie per comprendere lo stato delle risorse, ottimizzare le prestazioni delle applicazioni e reagire alle anomalie in tempo reale. È possibile impostare allarmi per avvisare l'utente in tempo reale di importanti cambiamenti nell'infrastruttura e nei servizi cloud, consentendo di intraprendere rapidamente le azioni appropriate.

Definisci controlli stato

Architetto cloud, Architetto infrastruttura

Il servizio Oracle Cloud Infrastructure Health Checks fornisce agli utenti un monitoraggio esterno ad alta frequenza per determinare la disponibilità e le prestazioni di qualsiasi servizio esposto al pubblico, inclusi siti Web ospitati, endpoint API o load balancer esterni.
Utilizzare Oracle Cloud Infrastructure Health Checks per assicurarsi di essere immediatamente consapevoli di eventuali problemi di disponibilità che interessano i clienti.

Monitora servizi di calcolo

Infrastructure Architect

Assicurarsi che il team operativo utilizzi e applichi le metriche dei servizi di calcolo.

Utilizzare metriche, allarmi e notifiche per monitorare quanto segue:

  • Istanza di calcolo: monitorare lo stato, la capacità e le prestazioni delle istanze di calcolo.
  • Stato infrastruttura: monitorare lo stato, la capacità e le prestazioni delle istanze di computazione bare metal
  • Oracle Cloud Infrastructure Functions: monitora lo stato, la capacità e le prestazioni delle funzioni distribuite su Oracle Cloud Infrastructure Functions.
  • Stato database: monitorare lo stato, la capacità e le prestazioni dei servizi di database.

Monitorare le reti

Architetto di rete, Architetto di infrastruttura

Adottare un meccanismo in cui le metriche vengono applicate a endpoint di rete diversi. È possibile disporre di metriche per la rete cloud virtuale interna (VCN) e anche per la connettività (Oracle Cloud Infrastructure FastConnect e IPsec VPN) o il load balancer.

Utilizzare metriche, allarmi e notifiche per monitorare quanto segue:

  • Metriche VNIC: monitorare lo stato, la capacità e le prestazioni delle VNIC (schede di interfaccia di rete virtuale) del servizio di rete.
  • Metriche FastConnect: monitorare lo stato, la capacità e le prestazioni della connessione tra la rete in locale e VCN (connessione Oracle Cloud Infrastructure FastConnect).
  • Metriche di connessione VPN: monitorare lo stato, la capacità e le prestazioni della connessione tra la rete in locale e VCN (nota anche come IPSec VPN).
  • Metriche gateway di servizio: monitorare lo stato, la capacità e le prestazioni dei gateway di servizio, che consentono agli host in locale o agli host VCN di accedere in modo privato ai servizi Oracle (ad esempio storage degli oggetti e Autonomous Database) senza esporre le risorse a Internet pubblico.
  • Metriche di bilanciamento del carico: monitorare lo stato, la capacità e le prestazioni dei load balancer, che fungono da intermediario per il traffico di dati tra client e Application Server.
  • Attrezzatura locale clienti: monitorare lo stato, la capacità e le prestazioni delle apparecchiature frontaliere della rete che si connette a Oracle Cloud Infrastructure (OCI).
  • Abilitare i log di flusso di VCN e incorporarli con Oracle Cloud Logging Analytics per analizzarli e identificare pattern interessanti e acquisire informazioni dettagliate, se necessario.

Dati di monitoraggio

Architetto cloud, Architetto infrastruttura, Architetto sicurezza

Monitorare i servizi di memorizzazione utilizzati per memorizzare i dati utilizzando metriche, allarmi e notifiche.
  • Metriche volume a blocchi: monitorare il throughput e le operazioni dei volumi a blocchi e dei volumi di avvio.
  • Metriche storage oggetti: monitorare la dimensione e il numero di oggetti dei bucket di storage degli oggetti.
  • Metriche file system: monitorare lo stato, il throughput, le richieste e la latenza dei file system e delle destinazioni di accesso.

Creare un set di allarmi per ogni metrica

DevOps Architect, Infrastructure Architect

Creare un set di allarmi per le metriche di servizio rilevanti. Per ogni metrica emessa dalle risorse, creare allarmi che definiscano i comportamenti delle risorse.
  • A rischio. La risorsa rischia di diventare inoperabile, come indicato dai valori delle metriche.
  • Non ottimale. La risorsa viene eseguita a livelli non ottimali, come indicato dai valori delle metriche.
  • La risorsa è attiva o inattiva. La risorsa non è raggiungibile o non è operativa.

Tune Your Alarms

DevOps Architect, Infrastructure Architect

Rivedere periodicamente gli allarmi, ad esempio settimanalmente, per garantire una configurazione ottimale. Calibrare la soglia, la gravità e i dettagli di notifica di ogni allarme, inclusi il metodo, la frequenza e il pubblico mirato.
Le soglie di metrica troppo ampie avviseranno inutilmente, mentre le soglie troppo strette ridurranno il tempo di intraprendere azioni correttive prima di un'interruzione.

Una configurazione ottimale degli allarmi affronta i seguenti fattori:

  • Criticità della risorsa.
  • Comportamento appropriato delle risorse. Valutare il comportamento individualmente e nel contesto dell'ecosistema di servizio. Rivedere le fluttuazioni dei valori delle metriche per un determinato periodo di tempo, quindi adeguare le soglie in base alle esigenze.
  • Rumore di notifica accettabile. Valutare il metodo di notifica, ad esempio e-mail o PagerDuty, i destinatari appropriati e la frequenza delle notifiche ripetute.

Abilita log servizio

Architetto di DevOps, Architetto dell'infrastruttura, Architetto della sicurezza

I log del servizio sono log emessi dai servizi OCI (Oracle Cloud Infrastructure), ad esempio gateway API, eventi, funzioni, bilanciamento del carico, storage degli oggetti e log di flusso VCN. Ciascuno di questi servizi supportati dispone di una risorsa Log che consente di abilitare o disabilitare il log per tale servizio.
Abilitarlo solo se sono necessarie informazioni diagnostiche critiche che descrivono le modalità di esecuzione e di accesso delle risorse.

Prendere in considerazione l'ingestione dei log dei servizi con Oracle Cloud Logging Analytics per una migliore comprensione e un'analisi dettagliata dei pattern e delle tendenze, se necessario.

Abilita OCI Operations Insights

Infrastructure Architect

Oracle Cloud Infrastructure (OCI) Operations Insights è un servizio nativo OCI che fornisce informazioni dettagliate a 360 gradi sull'utilizzo delle risorse e sulla capacità dei database autonomi.

Operations Insights è costituito dalle seguenti applicazioni integrate:

  • Capacity Planning
  • Warehouse SQL Oracle

Abilita Oracle Cloud Guard

Architetto di DevOps, Architetto dell'infrastruttura, Architetto della sicurezza

Oracle Cloud Guard è un servizio che consente ai clienti di monitorare, identificare, raggiungere e gestire livelli di sicurezza elevati in Oracle Cloud. Utilizzare il servizio per esaminare le risorse Oracle Cloud Infrastructure per verificare la debolezza della sicurezza correlata alla configurazione e gli operatori e gli utenti per attività a rischio.

Assicurarsi che Oracle Cloud Guard sia abilitato a livello radice della tenancy per monitorare tutti i compartimenti.

Configura auditing

Architetto di DevOps, Architetto dell'infrastruttura, Architetto della sicurezza

Il servizio Oracle Cloud Infrastructure Audit registra automaticamente le chiamate a tutti gli endpoint API (Application Programming Interface) Oracle Cloud Infrastructure (OCI) supportati come eventi di log. Attualmente, tutti i servizi supportano la registrazione mediante Audit.

Esaminare quanto segue durante la configurazione dell'audit:

  • Assicurarsi che la conservazione dell'audit sia impostata su 365 giorni.
  • Se si dispone di strumenti di terze parti che devono accedere ai dati di audit OCI, configurare un connettore di servizio per copiare i dati di audit OCI in Oracle Cloud Infrastructure Object Storage.
  • Assicurarsi che il periodo di conservazione nel bucket di memorizzazione sia configurato in modo appropriato.
  • Prendere in considerazione l'ingestione di un subset di log di audit con OCI Log Analytics per una migliore comprensione e un'analisi dettagliata dei pattern e delle tendenze, se necessario.