Monitoraggio e osservabilità

Il cloud ha rivoluzionato il modo in cui le aziende utilizzano la tecnologia. In passato, le aziende assumevano la proprietà e la responsabilità di tutti i livelli di tecnologia, dall'infrastruttura al software. Ora, il cloud offre alle aziende il potenziale per eseguire il provisioning e consumare le risorse in base alle esigenze. Sebbene il vantaggio sia una maggiore efficienza e produttività, il cloud introduce ulteriori modifiche ai modelli operativi. Le modifiche includono:

  • Il modello di responsabilità condivisa tra il business e i provider cloud
  • La necessità per l'azienda di gestire le applicazioni on-premise e in più cloud
  • I requisiti del team IT per integrare i set di strumenti esistenti con i nuovi strumenti della piattaforma cloud

Oracle Cloud Infrastructure (OCI) utilizza i migliori processi operativi per proteggere e monitorare l'infrastruttura cloud sottostante, come strutture di data center, hardware e sistemi software. OCI fornisce strumenti che ti consentono di eseguire in modo sicuro i tuoi carichi di lavoro e monitorare le tue risorse cloud, come computazione, rete, storage, database e le loro applicazioni end-to-end.

Che cos'è il monitoraggio e l'osservabilità?

Monitoraggio è uno strumento o un servizio che controlla lo stato di un sistema e attiva una notifica quando viene soddisfatta una condizione predefinita.

Observability è uno strumento o una soluzione che utilizza i dati di telemetria di un sistema, come metriche, log e trace, per eseguire il debug di un problema e migliorare le prestazioni.

Come monitorare i servizi OCI

OCI offre set predefiniti di metriche, log ed eventi per fornire visibilità sull'infrastruttura e sui servizi interni. OCI fornisce anche integrazioni con Grafana, PagerDuty e Slack, oltre a supportare gli standard della Cloud Native Computing Foundation (CNCF), come CloudEvents e OpenTracing.

Metriche: è possibile visualizzare una vista completa delle metriche emesse dai servizi OCI utilizzando Metrics Explorer nella console. Per ulteriori informazioni sul monitoraggio OCI e una lista di servizi che emettono metriche, vedere Panoramica del monitoraggio.

Il monitoraggio consente di definire le soglie sulle metriche delle risorse per generare allarmi. Gli allarmi possono essere inseriti nel servizio OCI Notifications. Puoi anche accedere alle metriche per l'integrazione con strumenti di terze parti indipendenti dai fornitori di servizi cloud, come Grafana, una piattaforma open source per il monitoraggio e l'analisi dei dati.

Log: OCI Logging fornisce l'accesso ai log dalle risorse OCI. I log includono informazioni di diagnostica critiche che descrivono le prestazioni e l'accesso alle risorse. Per ulteriori informazioni, vedere Panoramica del log.

Eventi: i servizi OCI emettono eventi. Gli eventi sono messaggi strutturati che indicano una modifica dello stato nelle risorse OCI. Esempi di eventi sono:

  • Creazione di un'istanza
  • Eliminazione di un'istanza
  • Creazione, aggiornamento o eliminazione di una risorsa

Gli eventi possono essere instradati dal servizio di notifiche ai canali appropriati. Gli eventi possono anche essere inseriti nelle funzioni OCI per gli elementi dai quali è possibile intraprendere azioni, ad esempio per notificare a un team specifico il lancio di un'istanza. Per ulteriori informazioni sui servizi che emettono eventi, vedere Servizi che producono eventi.

Piattaforma di osservabilità e gestione

I servizi di osservabilità e gestione OCI sono progettati per affrontare le sfide delle applicazioni e delle soluzioni moderne costituite da molti componenti che utilizzano tecnologie diverse. Questa raccolta di servizi offre visibilità e insight su tecnologia cloud nativa e tradizionale, fornitori di servizi cloud e ambienti on-premise, oltre a un ampio supporto ecosistemico basato su standard. La piattaforma è progettata per aiutarti a gestire portafogli IT sempre più diversificati e distribuiti, riducendo al contempo i tempi di risoluzione dei problemi, prevenendo le interruzioni e consentendo all'IT di gestire le applicazioni dal punto di vista aziendale. I servizi includono metriche, eventi, log e altro ancora, offrendo flessibilità a seconda delle esigenze di personalizzazione. I servizi e le funzioni includono:

  • Monitoraggio: consente ai servizi e ai clienti OCI di emettere metriche sulle risorse dei clienti OCI. Le funzionalità di monitoraggio includono le metriche dei servizi, Metrics Explorer e lo stato e la definizione degli allarmi. Puoi configurare allarmi con soglie per rilevare e rispondere alle anomalie dell'infrastruttura e dell'applicazione.

  • Controlli dello stato: fornisce un monitoraggio esterno ad alta frequenza per determinare la disponibilità e le prestazioni di qualsiasi servizio rivolto al pubblico, inclusi siti Web in hosting, endpoint API o load balancer rivolti all'esterno.

  • Application Performance Monitoring (APM): offre una visibilità approfondita sulle prestazioni delle applicazioni e consente ai professionisti DevOps di diagnosticare rapidamente i problemi. APM è compatibile con OpenTracing e OpenMetrics per il trace distribuito e combina il monitoraggio dell'utente finale con il monitoraggio sintetico. Può anche includere la telemetria dai microservizi distribuiti nei container Kubernetes o Docker.

  • Gestione del database: offre funzionalità complete di gestione e performance del database per ogni tipo di Oracle Database, inclusi OCI e on-premise. Questa funzionalità riduce notevolmente il carico sugli amministratori di database fornendo una soluzione per l'intero ciclo di vita che comprende monitoraggio, gestione delle prestazioni, ottimizzazione e amministrazione del database.

  • Java Management Service: è in grado di trovare, monitorare e gestire l'ambiente Java. Una volta distribuito, il servizio scopre quali versioni di Java hai in esecuzione e dove, quali richiedono aggiornamenti e quali applicazioni li utilizzano. Questo servizio è incluso nel tuo abbonamento a Java SE.

  • Log: semplifica l'inclusione dei dati di log e l'analisi per diagnosticare i problemi. Puoi integrare Logging con i servizi OCI quali Streaming, Monitoring, OCI Functions e Notifications. Logging utilizza lo standard CloudEvents del CNCF e utilizza CNCF Fluentd per includere i log da centinaia di fonti.

  • Logging Analytics: soluzione cloud basata sul Machine Learning che monitora, aggrega, indicizza e analizza tutti i dati di log dai tuoi ambienti on-premise e multicloud.

  • Notifiche: servizio di pubblicazione e sottoscrizione (pub/sub) altamente disponibile e a bassa latenza che invia avvisi e messaggi alle funzioni OCI, alla posta elettronica e ai partner di consegna dei messaggi, tra cui Slack e PagerDuty.

  • Operation Insights: strumento di pianificazione della capacità che consente agli amministratori di scoprire problemi di prestazioni, prevedere il consumo e pianificare la capacità utilizzando analytics basati sul machine learning su dati cronologici e SQL. Utilizza queste funzionalità per prendere decisioni basate sui dati e ottimizzare l'utilizzo delle risorse, evitare in modo proattivo le interruzioni e migliorare le performance.

  • Resource Manager: strumento di automazione dell'infrastruttura cloud basato su Terraform che fornisce funzionalità di servizio infrastructure-as-code.

  • Service Connector Hub: aiuta gli ingegneri cloud a gestire e spostare i dati tra i servizi OCI e da OCI a servizi di terze parti.

  • Monitoraggio dello stack: consente il monitoraggio proattivo delle applicazioni e del relativo stack di base, inclusi application server e database.

  • Enterprise Manager: fornisce monitoraggio e gestione completi per applicazioni, middleware, database e sistemi ingegnerizzati Oracle distribuiti in cloud ibridi.

  • Governance: offre una gamma completa di servizi per aiutarti a ottimizzare i costi, massimizzare l'utilizzo e garantire il rispetto degli standard aziendali e della compliance legislativa per gli asset distribuiti in OCI.