Monitora il carico di lavoro

Comprendi e adotta un processo di monitoraggio per tutti i servizi Oracle Cloud Infrastructure. Il servizio di monitoraggio utilizza le metriche per monitorare le risorse e gli allarmi e ricevere una notifica quando le metriche soddisfano i trigger specificati dall'allarme.

Analizza metriche operazione

Architetto di rete, Cloud Operations Manager, architetto di sicurezza

Definisci, acquisisci e analizza le metriche delle operazioni per ottenere visibilità sugli eventi.

Il servizio Oracle Cloud Infrastructure Monitoring offre gli insight necessari per comprendere lo stato delle tue risorse, ottimizzare le prestazioni delle tue applicazioni e rispondere alle anomalie in tempo reale. Puoi impostare allarmi per avvisarti in tempo reale di cambiamenti importanti nell'infrastruttura e nei servizi cloud, consentendoti di intraprendere rapidamente le azioni appropriate.

Definisci controlli stato

Architetto del cloud, Cloud Operations Manager, architetto della sicurezza

Il servizio Oracle Cloud Infrastructure Health Checks offre agli utenti un monitoraggio esterno ad alta frequenza per determinare la disponibilità e le prestazioni di qualsiasi servizio rivolto pubblicamente, inclusi siti Web in hosting, endpoint API o load balancer rivolti esternamente.

Utilizza Oracle Cloud Infrastructure Health Checks per assicurarti di essere immediatamente consapevole di qualsiasi problema di disponibilità che colpisce i tuoi clienti.

Monitora servizi di computazione

Cloud Operations Manager, architetto della sicurezza

Assicurati che il tuo team operativo utilizzi e applichi le metriche dei servizi di computazione.

Utilizzare metriche, allarmi e notifiche per monitorare gli elementi riportati di seguito.

  • Istanza di computazione: monitora lo stato, la capacità e le prestazioni delle tue istanze di computazione.
  • Integrità dell'infrastruttura: monitora lo stato, la capacità e le prestazioni delle istanze Bare Metal di computazione
  • Oracle Cloud Infrastructure Functions: monitora lo stato, la capacità e le prestazioni delle funzioni distribuite in Oracle Cloud Infrastructure Functions.
  • Stato del database: monitora lo stato, la capacità e le prestazioni dei servizi di database. Oracle Cloud Observability and Management Platform offre funzionalità unificate di monitoraggio e amministrazione del database per i database cloud.
  • Stato del sistema operativo: implementare strumenti di log a livello di sistema operativo, ad esempio auditd.

Monitorare le reti

Architetto di rete, Cloud Operations Manager, architetto di sicurezza

Adotta un meccanismo in cui le metriche vengono applicate a endpoint di rete diversi. Puoi avere metriche per la rete cloud virtuale (VCN) interna e anche per la connettività (Oracle Cloud Infrastructure FastConnect e la VPN IPsec) o il load balancer.

Utilizzare metriche, allarmi e notifiche per monitorare gli elementi riportati di seguito.

  • Metriche VNIC: monitorare lo stato, la capacità e le prestazioni delle VNIC del servizio di networking (schede di interfaccia di rete virtuali).
  • Metriche FastConnect: monitora lo stato, la capacità e le prestazioni della connessione tra la rete on premise e la rete VCN (connessione Oracle Cloud Infrastructure FastConnect).
  • VPN Connect Metrics: Monitor the health, capacity, and performance of the connection between your on-premises network and VCN (also known as IPSec VPN).
  • Metriche del gateway di servizi: monitora lo stato, la capacità e le prestazioni dei gateway di servizi che consentono agli host in locale o agli host VCN di accedere in privato ai servizi Oracle (ad esempio, Object Storage e Autonomous Database) senza esporre le risorse alla rete Internet pubblica.
  • Metriche di bilanciamento del carico: monitora lo stato, la capacità e le prestazioni dei load balancer, che fungono da intermediario per il traffico dati tra i client e gli Application Server.
  • Customer Premises Equipment: monitora lo stato, la capacità e le prestazioni dell'apparecchiatura di confine sulla tua rete che si connette a Oracle Cloud Infrastructure (OCI).
  • Abilita i log di flusso VCN e includili con Oracle Cloud Logging Analytics per analizzarli e identificare pattern interessanti e ottenere insight, in base alle esigenze.

Utilizzare il centro di comando di rete OCI e gli strumenti disponibili per monitorare e osservare la rete. OCI Network Command Center offre i seguenti strumenti di osservabilità per supportare vari casi d'uso delle operazioni:

  • Visualizzatore di rete

    Offre una visualizzazione intuitiva della topologia per comprendere le connessioni e le relazioni tra le risorse della rete virtuale, ispezionare la configurazione da un'unica posizione e risolvere visivamente eventuali problemi di configurazione.

  • Analyzer percorso di rete

    Consente di risolvere i problemi relativi a complesse configurazioni di rete virtuale in caso di problemi di raggiungibilità. Fornisce analisi automatizzate della configurazione per determinare il percorso di rete del traffico, identificare i problemi di instradamento e configurazione della sicurezza e fornire informazioni sulla configurazione lungo il percorso.

  • Latenza tra le aree

    Fornisce informazioni sulla latenza in tempo reale e cronologica tra le region OCI.

  • Log di flusso VCN

    Offre telemetria del traffico di rete, fondamentale per supportare i casi d'uso della sicurezza e delle operazioni di rete. Puoi ottenere insight approfonditi sul traffico di rete, trasmettere i log di flusso allo strumento scelto utilizzando protocolli standard come Kafka e archiviare i log di flusso in OCI Object Storage per scopi di conformità. I log di flusso della VCN possono essere inviati a Oracle Cloud Infrastructure Logging Analytics, OCI Object Storage o a un sistema di terze parti.

  • VTAP (Virtual Test Access Point)

    Offre funzionalità di mirroring del traffico che consentono l'acquisizione completa dei pacchetti per l'analisi della sicurezza, la risoluzione dei problemi delle applicazioni o problemi di prestazioni della rete. VTAP è utile anche per la risoluzione di problemi di rete complessi analizzando il contenuto e le intestazioni del pacchetto.

Dati di monitoraggio

Architetto del cloud, Cloud Operations Manager, architetto della sicurezza

Monitorare i servizi di storage utilizzati per memorizzare i dati utilizzando metriche, allarmi e notifiche.
  • Metriche dei volumi a blocchi: monitora il throughput e le operazioni dei volumi a blocchi e di avvio.
  • Metriche di storage degli oggetti: monitora la dimensione e il numero di oggetti dei bucket di storage degli oggetti.
  • Metriche del file system: monitorare lo stato, il throughput, le richieste e la latenza dei file system e delle destinazioni di MOUNT.

Crea un set di allarmi per ogni metrica

DevOps Architetto, Cloud Operations Manager, architetto della sicurezza

Creare un set di allarmi per le metriche di servizio pertinenti. Per ogni metrica emessa dalle risorse, creare allarmi che definiscono i comportamenti delle risorse.
  • A rischio. La risorsa rischia di diventare inutilizzabile, come indicato dai valori delle metriche.
  • Non ottimale. Le prestazioni della risorsa sono a livelli non ottimali, come indicato dai valori delle metriche.
  • La risorsa è attiva o inattiva. La risorsa non è raggiungibile o non è operativa.

Ottimizza gli allarmi

DevOps Architetto, Cloud Operations Manager, architetto della sicurezza

Esaminare regolarmente gli allarmi, ad esempio settimanalmente, per garantire una configurazione ottimale. Calibrare i dettagli relativi a soglia, severità e notifica di ogni allarme, inclusi metodo, frequenza e audience target.
Le soglie delle metriche troppo ampie avvisano inutilmente, mentre le soglie troppo strette ridurranno il tempo necessario per intraprendere azioni correttive prima di un'interruzione.

Una configurazione di allarme ottimale risolve i seguenti fattori:

  • Criticità della risorsa.
  • Funzionamento appropriato delle risorse. Valuta il comportamento individualmente e nel contesto dell'ecosistema dei servizi. Rivedere le fluttuazioni dei valori delle metriche per un determinato periodo di tempo, quindi adeguare le soglie in base alle esigenze.
  • Rumore di notifica accettabile. Valutare il metodo di notifica (ad esempio, e-mail o PagerDuty), i destinatari appropriati e la frequenza delle notifiche ripetute.

Abilita log servizio

DevOps Architetto, Cloud Operations Manager, architetto della sicurezza

I log del servizio sono log emessi dai servizi Oracle Cloud Infrastructure (OCI), come gateway API, eventi, funzioni, bilanciamento del carico, storage degli oggetti e log di flusso VCN. Ciascuno di questi servizi supportati dispone di una risorsa Log che consente di abilitare o disabilitare il log per tale servizio.

Abilitare il log del servizio solo se sono necessarie informazioni diagnostiche critiche che descrivono le modalità di esecuzione e accesso alle risorse.

Prendi in considerazione l'inclusione dei log dei servizi con Oracle Cloud Infrastructure Logging Analytics per insight migliori e analisi dettagliata di modelli e tendenze, in base alle esigenze.

Crea e gestisce i criteri di conservazione log.

Abilita Oracle Cloud Infrastructure Ops Insights

Cloud Operations Manager, architetto della sicurezza

Oracle Cloud Infrastructure Ops Insights è un servizio nativo OCI che fornisce insight olistici sull'utilizzo e la capacità delle risorse del database e dell'host.

Oracle Cloud Infrastructure Ops Insights è costituito dalle seguenti applicazioni integrate:

  • Capacity Planning
  • Oracle SQL Warehouse

Abilita Oracle Cloud Guard

DevOps Architetto, Cloud Operations Manager, architetto della sicurezza

Oracle Cloud Guard è un servizio che consente ai clienti di monitorare, identificare, ottenere e gestire un livello di sicurezza elevato in Oracle Cloud. Utilizza il servizio per esaminare le tue risorse di Oracle Cloud Infrastructure per i punti deboli della sicurezza relativi alla configurazione e i tuoi operatori e utenti per attività rischiose.

Assicurarsi che Oracle Cloud Guard sia abilitato al livello radice della tenancy per monitorare tutti i compartimenti.

Configura audit

DevOps Architetto, Cloud Operations Manager, architetto della sicurezza

The Oracle Cloud Infrastructure Audit service automatically records calls to all supported Oracle Cloud Infrastructure (OCI) public application programming interface (API) endpoints as log events. Attualmente, tutti i servizi supportano la registrazione mediante Audit.

Esaminare quanto riportato di seguito durante la configurazione del controllo.

  • Rivedere la durata della conservazione dell'audit. L'impostazione predefinita è 365 giorni.
  • Se si dispone di strumenti di terze parti che devono accedere ai dati di audit OCI, configurare un connettore servizio per copiare i dati di audit OCI in Oracle Cloud Infrastructure Object Storage.
  • Assicurarsi che il periodo di conservazione nel bucket di storage sia configurato in modo appropriato.
  • Prendi in considerazione l'inclusione di un subset di log di audit con OCI Log Analytics per insight migliori e analisi dettagliata di pattern e trend, in base alle esigenze.