Flessibilità
La resilienza è la capacità di un'applicazione o di un carico di lavoro di recuperare rapidamente dagli errori e mantenere l'alta disponibilità. Si tratta di un aspetto fondamentale del cloud computing perché garantisce che le applicazioni e i carichi di lavoro rimangano accessibili e funzionali, anche quando si verificano eventi imprevisti. Le informazioni riportate di seguito descrivono la resilienza di Oracle Cloud Infrastructure (OCI). Le informazioni evidenziano l'importanza della resilienza nel cloud computing e le funzionalità di resilienza fornite da OCI. La resilienza dovrebbe essere una considerazione fondamentale perché garantisce la continuità del business e riduce al minimo il rischio di interruzioni del servizio.
Recupera da errore
OCI fornisce un set di strumenti e servizi progettati per fornire un elevato livello di resilienza e disponibilità per applicazioni e carichi di lavoro. Un'offerta è la Platform as a Service (PaaS), che include diversi meccanismi per il ripristino da errori e la garanzia di tempi di attività elevati per i carichi di lavoro.
Ad esempio, il servizio Autonomous Database, che è un servizio PaaS, offre funzionalità integrate di tolleranza agli errori e backup e ripristino automatici. In caso di errore, il database può passare automaticamente a un database in standby, riducendo al minimo i tempi di inattività e garantendo la continuità dei processi aziendali critici.
OCI fornisce funzionalità di backup e ripristino automatizzate per le istanze di computazione, consentendoti di ripristinare lo stato precedente delle istanze in caso di errore. Questa funzione offre tranquillità, sapendo che i carichi di lavoro critici possono essere ripristinati in uno stato funzionale se si verifica un evento imprevisto.
Le funzioni di resilienza e disponibilità fornite da OCI, inclusi i servizi PaaS e il backup e il ripristino automatizzati, aiutano a garantire che le applicazioni e i carichi di lavoro siano sempre disponibili e performanti. Ciò consente di continuare a operare e fornire servizi ai clienti, anche a fronte di eventi imprevisti come guasti hardware o altre interruzioni.
High Availability
OCI fornisce un'architettura solida e ad alta disponibilità, progettata in modo specifico per ridurre al minimo i tempi di inattività e garantire che le applicazioni rimangano accessibili e funzionali anche a fronte di errori. Questa architettura si ottiene distribuendo risorse in più domini di errore (FD, Fault Domain) e domini di disponibilità (AD, Availability Domain) all'interno di un'area. Ogni dominio di errore (FD, Fault Domain) rappresenta hardware fisico diverso all'interno di un singolo dominio di disponibilità, fornendo anti-affinità, mentre ogni dominio di disponibilità (AD, Availability Domain) è un data center indipendente isolato dagli altri domini di disponibilità, fornendo ridondanza e tolleranza agli errori. Tutti i domini di disponibilità contengono tre domini di errori.
Ad esempio, si consideri un'applicazione ad alta disponibilità, ad esempio una con due server Web e un database in cluster. In questo scenario, il posizionamento ideale per ogni componente consiste nel raggruppare un server Web e un nodo di database in un dominio di errore e l'altra metà di ogni coppia in un altro dominio di errore. Questa strategia di posizionamento garantisce che un errore di qualsiasi dominio di errore non provochi un'indisponibilità per l'applicazione, poiché l'altra metà di ogni coppia di componenti continua a funzionare.
L'architettura ad alta disponibilità fornita da OCI, inclusa l'implementazione di risorse in più domini di errore e domini di disponibilità, oltre alle region abbinate per il disaster recovery, garantisce che le applicazioni e i carichi di lavoro rimangano disponibili e funzionali, anche quando si verificano eventi imprevisti. Ciò garantisce che i tuoi servizi rimarranno accessibili ai tuoi clienti, contribuendo a mantenere la soddisfazione dei clienti e la continuità aziendale. Per ulteriori informazioni, consulta i suggerimenti di Cloud Adoption Framework e le best practice su High Availability (HA).
Inoltre, OCI offre region abbinate per il disaster recovery, che ti consentono di replicare le tue risorse in due region per ottenere ulteriore resilienza.
Disaster recovery
Il Disaster recovery (DR) è il processo di ripristino dei sistemi e dell'infrastruttura IT dopo un evento irreversibile. Le regioni sono indipendenti da altre regioni e possono essere separate da grandi distanze, in paesi o addirittura continenti. In genere, si distribuisce un'applicazione nella regione in cui è più utilizzata, perché l'utilizzo di risorse vicine è più veloce rispetto all'utilizzo di risorse distanti. Tuttavia, puoi anche distribuire applicazioni in diverse aree per mitigare il rischio di eventi catastrofici a livello regionale e soddisfare requisiti diversi per giurisdizioni legali, domini fiscali e altri criteri aziendali o sociali.
OCI offre diverse opzioni di disaster recovery, tra cui soluzioni hot, warm e cold standby. Le soluzioni di hot standby offrono la replica in tempo reale dei dati e sono ideali per carichi di lavoro mission-critical che richiedono tempi di inattività quasi nulli. Le soluzioni di standby caldo replicano i dati a intervalli regolari e sono adatte per carichi di lavoro che possono tollerare alcuni tempi di inattività. Le soluzioni Cold standby comportano il ripristino manuale dei sistemi dai backup e sono adatte per carichi di lavoro che possono tollerare tempi di inattività significativi.
Inoltre, OCI supporta diversi modelli di DR HA, tra cui architetture attive-passive e attive-attive. Le architetture attive-passive implicano la replica delle risorse in un ambiente in standby attivato in caso di errore. Le architetture attive-attive implicano la replica delle risorse in più aree o domini di disponibilità e la distribuzione del traffico su di esse per ridurre al minimo i tempi di inattività.
Maximum Availability Architecture
OCI offre una gamma di modelli di DR HA altamente efficaci, incluse architetture attive-passive e attive-attive, per garantire continuità e alta disponibilità delle risorse critiche in caso di guasti o manutenzione. Ad esempio, in un'architettura passiva-attiva, l'ambiente in standby replica le risorse e diventa attivo solo quando l'ambiente primario non riesce. Al contrario, un'architettura attiva-attiva implica la replica delle risorse in più aree o domini AD per distribuire il traffico e ridurre al minimo i tempi di inattività.
Per garantire la disponibilità di applicazioni e database end-to-end a livelli ottimali, OCI utilizza Chaos Engineering, una disciplina che sperimenta con un sistema per aumentare la fiducia nella sua capacità di resistere a condizioni turbolente nella produzione. Maximum Availability Architectures (MAA) sfrutta Chaos Engineering durante i cicli di test e sviluppo, iniettando in modo aggressivo vari errori ed eventi di manutenzione pianificati per valutare l'impatto dell'applicazione e del database. Attraverso questa sperimentazione, le best practice, i difetti e le lezioni apprese vengono derivate e messe in pratica per evolvere e migliorare le soluzioni OCI's cloud MAA.
Il backup automatico del database (ADB) in OCI viene memorizzato nello storage degli oggetti OCI e replicato in un altro dominio di disponibilità, consentendo di ripristinare i database in caso di calamità. Inoltre, per Oracle Autonomous Database on Exadata Cloud@Customer (ADB-C@C), puoi scegliere di eseguire il backup su NFS o su Zero Data Loss Recovery Appliance (ZDLRA); tuttavia, sei responsabile della configurazione e della gestione della replica di tali backup.
I modelli avanzati di DR HA di OCI, Chaos Engineering e i backup automatici del database con replica su più domini di disponibilità offrono una protezione completa contro potenziali perdite di dati o guasti del sistema, garantendo la massima disponibilità e continuità delle risorse critiche.
Tempo medio di ripristino
Il tempo medio di ripristino (MTTR) è una metrica critica che misura il tempo medio necessario per ripristinare un servizio o un sistema dopo un errore. Un MTTR prolungato può causare danni finanziari e di reputazione significativi alle aziende, con conseguente perdita di ricavi, diminuzione della soddisfazione dei clienti e persino multe normative.
OCI fornisce diversi strumenti e servizi, come Terraform e Ansible, per ridurre MTTR e garantire la massima disponibilità dei servizi. Ad esempio, sono disponibili processi di backup e ripristino automatizzati per recuperare rapidamente dati e applicazioni in caso di interruzione o disastro. Inoltre, la replica in tempo reale dei dati in più domini di disponibilità consente il ripristino rapido dei servizi, riducendo al minimo i tempi di inattività e l'impatto degli errori.
È essenziale misurare continuamente MTTR per capire il tempo necessario per ripristinare i servizi in condizioni sfavorevoli. Questa valutazione è fondamentale per identificare le aree di miglioramento e ridurre il MTTR nel tempo, garantendo una disponibilità ottimale del servizio e riducendo il rischio di danni causati da tempi di inattività prolungati.
Integrazione e distribuzione continue
Integrazione continua e distribuzione continua (CI/CD) sono pratiche DevOps importanti che ti aiutano a semplificare il processo di sviluppo del software, aumentare la produttività e ridurre gli errori. Queste pratiche comportano l'automazione del processo di creazione, test e distribuzione del software, consentendoti di rilasciare il codice più frequentemente, con una migliore qualità e coerenza.
OCI supporta queste best practice attraverso l'integrazione con gli strumenti CI/CD più diffusi, come Jenkins, GitLab e GitHub. Questi strumenti forniscono una pipeline efficiente e automatizzata per lo sviluppo e la distribuzione del software, dalle modifiche al codice al test e alla distribuzione. Integrando questi strumenti in OCI, puoi sfruttare la scalabilità e la flessibilità del cloud per accelerare il processo di sviluppo e migliorare la produttività complessiva.
Ad esempio, utilizzando Jenkins in OCI, puoi automatizzare i processi di creazione e distribuzione, assicurando che il codice venga testato e distribuito rapidamente negli ambienti di produzione. Allo stesso modo, l'utilizzo di GitLab in OCI può consentire una collaborazione trasparente tra i team, facilitando una condivisione efficiente del codice e monitorando le modifiche. Inoltre, l'integrazione di GitHub con OCI fornisce una piattaforma che consente di gestire i repository di codice, abilitare il controllo delle versioni e facilitare le revisioni del codice.
Il servizio DevOps OCI è un servizio cloud completamente gestito progettato per supportare i flussi di lavoro CI/CD per gli sviluppatori. Grazie a questa piattaforma, i tecnici di DevOps possono creare, testare e distribuire software e applicazioni facilmente in Oracle Cloud, fornendo una soluzione end-to-end che semplifica il processo di sviluppo.
Il servizio consente la creazione di pipeline di creazione e distribuzione DevOps che riducono gli errori associati al cambiamento e riducono il tempo necessario per la creazione e la distribuzione delle release, migliorando in ultima analisi la qualità e la coerenza complessive del codice. Inoltre, il servizio offre repository Git privati per la memorizzazione sicura del codice e supporta le connessioni a repository di codici esterni, consentendo una collaborazione semplificata con team esterni.
Essendo un servizio cloud completamente gestito, il servizio DevOps di OCI fornisce scalabilità e manutenzione automatizzate, consentendoti di concentrarti sul codice senza preoccuparti della gestione dell'infrastruttura. Ciò garantisce che la piattaforma sia sempre aggiornata e disponibile per supportare il processo di sviluppo, rendendola una soluzione ideale quando si desidera semplificare i flussi di lavoro DevOps e ottenere cicli di rilascio più rapidi con codice di qualità superiore.
DevOps, SecOps, DevSecOps, IaC
DevOps, SecOps e DevSecOps sono metodologie fondamentali che consentono di soddisfare le esigenze dello sviluppo software moderno sottolineando la collaborazione, l'automazione e la sicurezza. Infrastructure as code (IaC) svolge un ruolo importante nel provisioning e nella configurazione dell'infrastruttura per la distribuzione automatizzata.
-
DevOps: è essenziale perché favorisce la collaborazione tra i team di sviluppo e quelli operativi, garantendo che il software venga distribuito più velocemente, con una qualità migliore e una maggiore affidabilità. Questa metodologia sottolinea l'importanza dell'automazione, consentendo ai team di creare, testare e distribuire il codice in modo più efficiente, riducendo il time-to-market. In OCI, puoi utilizzare le procedure DevOps utilizzando strumenti come Jenkins, GitLab e GitHub per automatizzare il processo di sviluppo del software.
-
SecOps: è importante perché integra la sicurezza nel processo di sviluppo per garantire che le vulnerabilità della sicurezza vengano identificate e affrontate in anticipo, riducendo il rischio di violazioni e garantendo la protezione dei dati sensibili. Sottolineando l'importanza della sicurezza, questa metodologia garantisce la possibilità di creare e distribuire applicazioni software sicure. In OCI, puoi utilizzare le integrazioni con strumenti di sicurezza di terze parti come Check Point e Fortinet per fornire rilevamento e protezione avanzate delle minacce.
-
DevSecOps: combinazione di queste due metodologie, con sicurezza integrata nel processo DevOps fin dall'inizio. Questo approccio garantisce che le applicazioni siano sicure, affidabili e soddisfino i requisiti di conformità. Concentrandosi sulla sicurezza fin dall'inizio, puoi creare e distribuire applicazioni sicure in tempi più rapidi, con una qualità migliore e una maggiore affidabilità. In OCI, puoi utilizzare funzioni di sicurezza integrate come le zone di sicurezza per isolare i carichi di lavoro e controllare il traffico di rete per migliorare la sicurezza e la resilienza.
-
IaC: pratica importante che prevede la scrittura di codice per automatizzare la distribuzione e la gestione dell'infrastruttura. Questa metodologia garantisce la coerenza e l'affidabilità delle implementazioni dell'infrastruttura, riducendo il rischio di errori e migliorando la resilienza. In OCI, puoi utilizzare strumenti come Terraform e Ansible per automatizzare il provisioning e la configurazione delle risorse dell'infrastruttura.
Automatizza tutto
L'automazione è un aspetto cruciale della creazione e della manutenzione di un'infrastruttura cloud resiliente. Automatizzando processi e attività, gli errori possono essere ridotti e l'efficienza può essere aumentata. Creare una cultura che dia priorità all'automazione e alla resilienza è essenziale per mantenere l'alta disponibilità nel cloud. Ciò può essere ottenuto tramite l'uso di strumenti e servizi come Terraform, Ansible e Jenkins, che forniscono funzionalità di automazione per l'implementazione, la configurazione e la gestione dell'infrastruttura.
Ad esempio, OCI offre una gamma di strumenti di automazione, tra cui Resource Manager, che ti consente di automatizzare la creazione, la configurazione e la distribuzione delle risorse cloud utilizzando le API native Terraform o Oracle Cloud Infrastructure. Inoltre, l'uso dell'automazione per eseguire attività di routine come backup e aggiornamenti può ridurre significativamente il rischio di errori e aumentare la resilienza complessiva dell'infrastruttura cloud.
Requisiti non funzionali - SLI, SLO e SLA
I requisiti non funzionali, come prestazioni, scalabilità e disponibilità, svolgono un ruolo cruciale nel garantire che le applicazioni e i carichi di lavoro soddisfino le esigenze aziendali. Per raggiungere questo obiettivo, è importante disporre di metriche che misurino le prestazioni e la disponibilità di servizi e risorse. Gli indicatori del livello di servizio (SLI), gli obiettivi del livello di servizio (SLO, Service Level Objectives) e gli accordi sul livello di servizio (SLA, Service Level Agreement) sono metriche che consentono di misurare l'efficacia della tua infrastruttura cloud.
OCI offre una vasta gamma di strumenti e servizi che ti consentono di monitorare e gestire queste metriche, tra cui il monitoraggio cloud, la registrazione e le notifiche. Cloud Monitoring ti consente di raccogliere, analizzare e inviare avvisi su metriche e log tra le risorse e i servizi OCI. Fornisce una visione unificata dello stato e delle prestazioni dell'infrastruttura, consentendo di identificare e risolvere rapidamente i problemi che potrebbero influire su SLIs, SLO e SLA. La registrazione consente di acquisire e analizzare i dati di log da varie origini, tra cui servizi OCI, applicazioni e componenti dell'infrastruttura. Le notifiche consentono di ricevere avvisi e notifiche quando vengono soddisfatte le condizioni predefinite, consentendo di intervenire prima che i problemi influiscano su SLIs, SLO e SLA.
Sfruttando questi strumenti e servizi, puoi ottenere una visibilità approfondita sulla tua infrastruttura cloud e monitorare e gestire in modo proattivo SLIs, SLO e SLA. Ciò garantisce che le applicazioni e i carichi di lavoro soddisfino le esigenze aziendali e consente loro di rispondere rapidamente a qualsiasi problema che si presenti, riducendo al minimo i tempi di inattività e migliorando la resilienza complessiva.
Ad esempio, puoi utilizzare Cloud Monitoring per monitorare il tempo di risposta e la disponibilità di un'applicazione Web ospitata in OCI, mentre utilizzi Logging per tenere traccia degli errori e diagnosticare i problemi di prestazioni. Le notifiche possono essere utilizzate per avvisare gli amministratori quando si verificano interruzioni del servizio o problemi di prestazioni, consentendo loro di intervenire prima che il problema diventi grave.
Dominio di errore e disponibilità
I domini di errore e i domini di disponibilità sono concetti importanti nel cloud computing che migliorano la resilienza e riducono l'impatto di potenziali errori. In caso di errore in una determinata area, è possibile utilizzare i domini di errore per garantire che le risorse critiche non siano interessate, riducendo l'impatto complessivo sul sistema. I domini di disponibilità offrono isolamento tra i data center per fornire ridondanza e tolleranza agli errori. Ciò garantisce che, se si verifica un errore in un dominio di disponibilità, il carico di lavoro possa eseguire il failover in un dominio di disponibilità diverso, garantendo che i servizi rimangano disponibili, anche in caso di errori.
OCI sfrutta i domini di errore e i domini di disponibilità per fornire alta disponibilità. Ad esempio, in OCI, ogni region è composta da tre domini di disponibilità, fisicamente isolati l'uno dall'altro e che forniscono domini di errore indipendenti. OCI utilizza i domini di errore per garantire che le istanze in un determinato dominio di disponibilità vengano distribuite tra più domini di errore, garantendo alta disponibilità e protezione dagli errori.
Più aree
Le regioni OCI sono una componente fondamentale per garantire resilienza e continuità in caso di calamità. Le aree sono due aree separate geograficamente che forniscono ridondanza e tolleranza agli errori. In caso di un evento catastrofico come un disastro naturale, un attacco informatico o un errore umano, le aree accoppiate garantiscono che le risorse critiche vengano replicate e disponibili in un'area alternativa. Ciò riduce il rischio di tempi di inattività e perdita di dati, offrendo tranquillità alle aziende e ai clienti.
Ad esempio, se un'azienda opera negli Stati Uniti e c'è un evento catastrofico come un disastro naturale, disordini politici o interruzioni di corrente in una regione, l'altra regione può assumere il controllo e garantire la continuità aziendale. Se l'area primaria è orientale degli Stati Uniti (Ashburn) e si verifica un'indisponibilità, l'area secondaria occidentale degli Stati Uniti (Phoenix) potrà assumere il controllo e fornire i servizi necessari fino a quando l'area primaria non sarà nuovamente online. Questo approccio garantisce che l'esperienza utente non subisca interruzioni e che i dati siano disponibili durante l'interruzione. La replica attiva-attiva o passiva delle risorse OCI nelle aree abbinate garantisce che i dati siano costantemente disponibili, rendendo possibile il failover nell'area di backup senza interruzioni.
Le più region offrono alle aziende la possibilità di implementare un piano di disaster recovery efficace, garantendo la protezione dei dati e la disponibilità di servizi.
Data Guard e GoldenGate
Data Guard è una funzione di Oracle Database che fornisce disaster recovery e alta disponibilità per i database aziendali. Consente la creazione di un database in standby che può assumere il controllo in caso di errore del database primario. Il database in standby viene sincronizzato continuamente con il database primario, garantendo che i dati siano sempre aggiornati. Ciò fornisce un ulteriore livello di resilienza per sistemi e applicazioni critiche.
GoldenGate è uno strumento di integrazione e replica dei dati che consente l'integrazione dei dati in tempo reale tra database diversi. Supporta l'integrazione eterogenea dei dati, il che significa che può replicare i dati tra diversi fornitori di database e all'interno di un singolo fornitore. GoldenGate può essere utilizzato anche per la migrazione del database, il data warehousing e la business intelligence.
OCI fornisce versioni diverse di Data Guard e GoldenGate per soddisfare requisiti e casi d'uso diversi. Ad esempio, Data Guard Standard Edition fornisce funzionalità di disaster recovery di base, mentre Data Guard Enterprise Edition fornisce funzioni più avanzate come il failover automatico e la protezione dei dati. GoldenGate Standard Edition fornisce la replica dei dati in tempo reale tra i database, mentre GoldenGate Enterprise Edition include funzioni aggiuntive quali il rilevamento e la risoluzione dei conflitti.
Utilizzando queste tecnologie insieme a OCI, puoi migliorare la resilienza del tuo sistema assicurandoti che i dati critici siano sempre disponibili e aggiornati, anche in caso di disastro o guasto del sistema. Ad esempio, un'azienda di servizi finanziari può utilizzare Data Guard per replicare un database di produzione in un database di standby in una region diversa, come le region nord e sud degli Stati Uniti nell'infrastruttura OCI, in modo da garantire che possano eseguire rapidamente il ripristino da un evento catastrofico e continuare a servire i clienti senza interruzioni.
Replica data
La replica dei dati è un aspetto fondamentale della resilienza nel cloud computing perché garantisce che i dati siano disponibili anche in caso di errore. La replica implica la creazione di copie di dati e la loro memorizzazione in più posizioni, che possono essere utilizzate per il ripristino da un errore o un disastro.
OCI fornisce diverse opzioni di storage per la replica dei dati. Object Storage è un servizio di storage altamente scalabile e duraturo che consente la replica dei dati tra le aree. Configurando la replica tra più aree, i dati vengono replicati automaticamente in un'area diversa, fornendo un elevato livello di resilienza. In caso di disastro o interruzione, è possibile accedere facilmente ai dati dalla posizione replicata, garantendo la continuità del business.
Lo storage di file fornisce file system ad alta disponibilità e duraturi a cui possono accedere più istanze contemporaneamente. Utilizzando i criteri di replica, i file vengono replicati automaticamente in un dominio di disponibilità diverso, fornendo tolleranza agli errori e alta disponibilità.
Block Volume è un servizio di storage a blocchi ad alta disponibilità e duraturo che fornisce una funzione di replica. Configurando la replica dei volumi a blocchi, i dati vengono replicati automaticamente in un altro volume a blocchi in un dominio di disponibilità diverso all'interno della stessa area. Ciò garantisce la disponibilità dei dati anche in caso di guasto o interruzione.
La replica dei dati è fondamentale per mantenere la resilienza nel cloud computing e OCI fornisce diverse opzioni per replicare i dati tra region, domini di disponibilità e istanze. Utilizzando queste opzioni, puoi assicurarti che i tuoi dati siano altamente disponibili, duraturi e facilmente recuperabili in caso di guasto o disastro.
Calcola affidabilità complessiva
L'affidabilità è fondamentale da considerare quando si distribuisce un'applicazione o un carico di lavoro nel cloud. La misurazione della probabilità e dell'impatto dei guasti è essenziale per garantire il corretto funzionamento delle operazioni aziendali. OCI offre una gamma di strumenti e servizi che ti aiutano a calcolare l'affidabilità e il costo complessivi della tua infrastruttura cloud. Ad esempio, Cloud Advisor ti aiuta a identificare potenziali problemi con la tua architettura e fornisce suggerimenti per migliorare l'affidabilità, mentre Cost Estimator ti aiuta a stimare i costi di implementazione della tua infrastruttura cloud. Utilizzando questi strumenti e servizi, è possibile garantire che le applicazioni e i carichi di lavoro vengano distribuiti in modo affidabile ed economico.
Pianificare l'applicazione di patch e l'upgrade
Mantenere aggiornate le applicazioni e l'infrastruttura è importante per mantenere la sicurezza e le prestazioni ottimali nel cloud. La mancata applicazione delle patch e degli aggiornamenti necessari può rendere i sistemi vulnerabili agli attacchi e causare problemi di prestazioni che interrompono le operazioni aziendali. OCI offre una vasta gamma di strumenti e servizi per semplificare e automatizzare il processo di applicazione di patch e upgrade.
I servizi di automazione dell'applicazione di patch e Upgrade Advisor forniti da OCI sono progettati per semplificare la pianificazione e l'esecuzione del processo di applicazione di patch e upgrade. Inoltre, il servizio di gestione del sistema operativo (OSMS) consente di automatizzare l'applicazione delle patch alle istanze Oracle Linux o Windows. Con OSMS, puoi organizzare i tuoi sistemi in gruppi e pianificare processi per applicare gli ultimi aggiornamenti a tutti i sistemi. Questo servizio fornisce l'accesso a una vasta gamma di origini software predefinite, fornendo l'intera gamma di repository Oracle yum ai sistemi Linux. Di conseguenza, i sistemi possono essere sempre aggiornati con le patch più recenti, migliorando la sicurezza e le prestazioni.
Piano continuità aziendale
Un solido piano di continuità aziendale è essenziale per qualsiasi organizzazione per garantire che possa continuare a operare anche di fronte a eventi dirompenti. Questi potrebbero includere disastri naturali, interruzioni di corrente o attacchi informatici.
OCI fornisce una vasta gamma di strumenti e servizi per supportare questo tipo di pianificazione. Ad esempio, il servizio VPN da sito a sito consente di creare una connessione sicura e cifrata tra la rete on premise e la rete cloud virtuale (VCN) OCI, consentendo di estendere il data center al cloud. Analogamente, il servizio FastConnect fornisce una connessione privata a larghezza di banda elevata tra l'infrastruttura on-premise e le risorse OCI, consentendoti di replicare i dati ed eseguire applicazioni critiche nel cloud.
Uso dell'architettura accoppiata liberamente
L'architettura accoppiata in modo approssimativo è un elemento cruciale nella creazione di sistemi resilienti perché aiuta a ridurre l'impatto dei guasti riducendo le dipendenze tra i componenti. Riducendo le dipendenze, ogni componente può essere scalato ed evoluto in modo indipendente, rendendo il sistema più flessibile e adattabile ai cambiamenti. OCI fornisce strumenti e servizi che supportano questa architettura, come Oracle Functions, che consente agli sviluppatori di creare e distribuire applicazioni serverless che possono essere scalate automaticamente in base alla domanda dei carichi di lavoro, senza essere strettamente abbinate ad altri componenti. Un altro esempio è Oracle Kubernetes Engine (OKE), che offre una piattaforma altamente scalabile e flessibile per l'esecuzione di applicazioni containerizzate. OKE utilizza un'architettura basata su microservizi che consente di creare e distribuire applicazioni modulari e non accoppiate che possono essere facilmente ridimensionate e gestite.
Monitoraggio e adattamento per pattern insoliti
Per garantire la resilienza del sistema, è importante monitorare e adattarsi a pattern insoliti nell'uso delle risorse, nel traffico e nel comportamento. Questi pattern possono aiutare a identificare potenziali problemi prima che diventino critici e influiscano sulle prestazioni e sulla disponibilità del sistema. OCI fornisce strumenti e servizi come Cloud Guard e Security Zones che forniscono monitoraggio e analisi continui dell'uso delle risorse, del traffico di rete e del comportamento degli utenti. Cloud Guard automatizza il monitoraggio delle risorse e consente di rilevare minacce alla sicurezza e configurazioni errate nell'ambiente cloud. Inoltre, Security Zones offre un ambiente sicuro per carichi di lavoro e risorse che richiedono livelli di sicurezza più elevati.
Scelta tra SaaS, PaaS e IaaS
La selezione del modello di servizio cloud appropriato è fondamentale perché determina il livello di controllo, flessibilità e gestione richiesto per le applicazioni e i carichi di lavoro. I modelli di servizi cloud come Software as a Service (SaaS), Platform as a Service (PaaS) e Infrastructure as a Service (IaaS) offrono vantaggi e svantaggi distinti. SaaS offre una soluzione completamente gestita che può essere facilmente distribuita e richiede poca manutenzione, mentre PaaS fornisce una piattaforma di sviluppo con più opzioni di controllo e personalizzazione. IaaS offre un controllo completo sull'infrastruttura, ma richiede una maggiore gestione e manutenzione. La scelta del modello di servizio giusto per la tua azienda è essenziale per massimizzare le prestazioni, ridurre i costi e mantenere elevati livelli di resilienza.
Anticipa errore
Ridurre l'impatto di potenziali guasti è fondamentale per garantire la resilienza della tua infrastruttura cloud. OCI offre una vasta gamma di strumenti e servizi che ti consentono di prevedere potenziali punti di errore e pianificare la tua mitigazione. Ad esempio, i domini di errore e i domini di disponibilità sono concetti utilizzati nel cloud computing per aumentare la resilienza e ridurre l'impatto degli errori. Raggruppando le risorse e distribuendole tra domini di errore e domini di disponibilità diversi, puoi ridurre al minimo il rischio di un singolo punto di errore. Inoltre, Security Zones in OCI ti consente di isolare i carichi di lavoro e ridurre l'impatto di incidenti o errori di sicurezza.
Costi e affidabilità
Per garantire un'efficienza in termini di costi mantenendo l'affidabilità, è essenziale bilanciare costi e prestazioni dell'infrastruttura cloud. OCI fornisce vari strumenti e servizi, come Cost Estimator e Cost Management, che ti aiutano a monitorare e ottimizzare le spese del cloud. Il Cost Estimator ti aiuta a stimare i costi di implementazione dell'infrastruttura e a identificare potenziali risparmi sui costi. Il servizio Cost Management offre una piattaforma centralizzata per il monitoraggio e la gestione delle spese cloud in diversi servizi e aree geografiche. Con questo servizio, puoi impostare i budget, monitorare l'utilizzo e identificare le aree in cui puoi ridurre i costi senza influire sull'affidabilità della tua infrastruttura.
Pianifica per grandi eventi
Garantire l'alta disponibilità ed evitare interruzioni durante i grandi eventi, come picchi stagionali del traffico o finestre di manutenzione pianificate, richiede un'attenta pianificazione. OCI fornisce vari strumenti e servizi come il ridimensionamento automatico e pianificato che ti aiutano a pianificare e regolare le tue risorse di conseguenza. La scalabilità automatica regola automaticamente la capacità delle risorse in base al traffico in tempo reale, assicurando che l'applicazione sia disponibile per gli utenti. La scalabilità pianificata ti consente di pianificare e regolare le risorse in anticipo per modelli di traffico prevedibili, riducendo il rischio di over-provisioning e costi non necessari. Questi strumenti ti aiutano a gestire in modo efficiente le tue risorse cloud, garantendo alta disponibilità e prestazioni ottimali durante i grandi eventi.