Disaster recovery
Un piano di ripristino di emergenza (DR) ben progettato consente di recuperare rapidamente dai disastri e continuare a fornire servizi ai propri utenti.
Il DR è il processo di preparazione e recupero da un disastro. Un disastro può essere qualsiasi evento che mette a rischio le tue applicazioni, dalle interruzioni della rete ai guasti delle apparecchiature e delle applicazioni ai disastri naturali. È quasi impossibile prevedere quando avrai bisogno di un disaster recovery, proprio come non puoi prevedere quando ti troverai in un incidente d'auto. Se non riesci a controllare quando un disastro colpisce, la prossima cosa migliore è essere in grado di controllare il processo di recupero.
Un piano DR ben progettato ti consente di recuperare rapidamente dai disastri e di garantire la continuità aziendale. Man mano che la tua organizzazione sposta i carichi di lavoro nel cloud, devi tradurre la tua comprensione su come creare sistemi on-premise resilienti nel cloud. Oracle Cloud Infrastructure (OCI) fornisce infrastruttura e servizi altamente disponibili, sicuri e scalabili che ti consentono di recuperare i carichi di lavoro cloud in modo rapido, affidabile e sicuro.
Poiché le architetture multilivello o a tre livelli sono comuni nelle tradizionali applicazioni aziendali on-premise, utilizziamo un'applicazione aziendale a tre livelli di esempio per mostrare come puoi rendere quell'applicazione più resiliente dalle calamità utilizzando le funzionalità OCI DR e le best practice della topologia cloud affidabile e resiliente. Il diagramma riportato di seguito mostra un esempio di applicazione enterprise nella configurazione DR in standby attivo.
Concetti DR
Il primo passo nella pianificazione del DR consiste nel determinare l'obiettivo RTO (Recovery Time Objective) e l'RPO (Recovery Point Objective).
L'RTO è il tempo obiettivo entro il quale una determinata applicazione deve essere ripristinata dopo il verificarsi di una calamità. In genere, l'aspetto più critico dell'applicazione è la riduzione dell'RTO.
L'RPO è il periodo successivo al verificarsi di una calamità per il quale un'applicazione può tollerare la perdita di dati prima che l'incidente inizi a colpire l'azienda.
Per creare un piano che garantisca il ripristino delle applicazioni dopo una calamità ed è conveniente, è necessario considerare sia il tempo di recupero target che la tolleranza per la perdita di dati.
Per ulteriori informazioni, consulta la sezione relativa alle migliori prassi per proteggere la topologia cloud dalle catastrofi.
Scelta di un approccio DR
Alcune applicazioni sono più critiche di altre. La soluzione DR scelta dipende da molti requisiti possibili, tra cui disponibilità, durabilità dei dati, RTO e RPO.
Valutare i metodi DR nella tabella riportata di seguito per decidere quali funzionalità DR OCI utilizzare durante la distribuzione di applicazioni enterprise a più livelli su OCI.
Metodo DR | RPO | RTO | Cost |
---|---|---|---|
Backup e ripristino | Ore | Ore | $ |
Luce pilota | minuti | minuti | $$ |
Standby caldo | secondi | minuti | $$$ |
Attivo/attivo | Vicino a zero | Zero potenziale | $$$$ |
Considera sia le regioni che i domini di disponibilità all'interno di un'area per gli scenari di DR e high availability (HA). Un'area è un'area geografica localizzata, mentre un dominio di disponibilità è costituito da uno o più centri dati situati all'interno di un'area. Se il piano DR richiede che i siti DR si trovino fisicamente distanti, l'utilizzo di più aree può raggiungere questo obiettivo.
Per la nostra applicazione aziendale di esempio, dobbiamo essere in grado di sopravvivere a un'indisponibilità regionale, ma possiamo gestire alcuni tempi di inattività se una regione è interessata. Per questi motivi abbiamo scelto una distribuzione di warm standby in più region.
Gestisci l'orchestrazione DR con Full Stack DR
Full Stack Disaster Recovery (DR) è un servizio nativo OCI che fornisce un'interfaccia semplice e coerente per orchestrare le operazioni di DR per molti sistemi diversi, semplificando per qualsiasi utente autorizzato nelle operazioni IT l'attivazione di un failover o switchover senza dover comprendere alcuno dei processi di ripristino di base.
Full Stack DR è la prima vera soluzione Oracle di disaster recovery as a service (DRaaS) per OCI ed è molto più di un semplice motore di orchestrazione. Full Stack DR è un servizio di gestione del DR altamente scalabile ed estendibile che automatizza completamente i passaggi necessari per testare, eseguire la transizione o recuperare sistemi aziendali critici e non critici tra due region OCI da qualsiasi parte del mondo con un solo clic.
I problemi che le aziende devono affrontare con il recupero su larga scala
La tua azienda probabilmente ha più di poche applicazioni mission e business critical ospitate nella tua tenancy OCI. Per complicare le cose, ognuna di queste applicazioni Oracle o non Oracle ha un processo di ripristino diverso con diversi obiettivi relativi a punti di ripristino e tempi di ripristino. Inoltre, i processi di ripristino di ogni diverso stack di applicazioni possono essere complessi, richiedendo la massima attenzione da parte dei tecnici più esperti.
La tua organizzazione IT ha probabilmente le competenze e la determinazione per recuperare una o due applicazioni diverse in un giorno o due in uno sforzo onnicomprensivo e pratico da parte degli specialisti IT più senior dell'azienda. Ma cosa succede se la tua organizzazione IT si trova ad affrontare la prospettiva di recuperare più di un paio di sistemi allo stesso tempo?
Full Stack DR semplifica il recupero su larga scala
Full Stack DR è progettato per gestire i flussi di lavoro DR su larga scala senza coinvolgere gli esperti tecnici più esperti nel caso in cui sia necessario recuperare contemporaneamente molti sistemi. Full Stack DR normalizza il modo in cui le operazioni di DR vengono eseguite e monitorate utilizzando un metodo semplice e coerente tramite OCI Console.
Full Stack DR organizza varie applicazioni in gruppi di protezione indipendenti senza modificare il modo in cui hai installato e configurato le tue applicazioni Oracle e non Oracle esistenti in OCI. Full Stack DR può recuperare un solo componente di uno stack di applicazioni o recuperare l'intero stack di applicazioni con un solo clic: scegli cosa vuoi fare.
Lo stack completo DR convalida la disponibilità dei piani DR
Full Stack DR aiuta a verificare che i sistemi aziendali strategici siano pronti per qualsiasi interruzione imprevista del servizio attraverso i nostri controlli di disponibilità del DR integrati e completamente automatizzati. La nostra funzione di controllo preliminare viene aggiunta automaticamente all'elenco di attività che Full Stack DR esegue durante qualsiasi operazione di DR.
I controlli preliminari non comportano interruzioni e possono essere eseguiti in qualsiasi momento senza disturbare i sistemi di produzione. Convalidiamo l'integrità dei piani DR controllando se i database di rete, storage, computazione, Oracle e gli eventuali script personalizzati aggiunti a un piano DR sono quelli che dovrebbero essere e pronti per essere utilizzati.
Flessibilità per gestire qualsiasi architettura di distribuzione
La flessibilità è un concetto chiave dietro la progettazione di Full Stack DR. Diversi sistemi aziendali richiedono diverse soluzioni di ripristino. Pertanto, Full Stack DR è conforme al modo in cui è necessario recuperare ogni singolo sistema aziendale in un modo che corrisponda alle esigenze tecniche e aziendali. Il modo in cui scegli di installare e distribuire un sistema aziendale per il disaster recovery dipende da te.
La nostra soluzione DRaaS può gestire il ripristino in modo diverso per ogni singolo sistema aziendale, indipendentemente dal fatto che venga distribuito per il failover delle VM, la luce pilota, il cold standby, il warm standby, il hot standby o l'attiva/attiva. L'utente gestisce la distribuzione e noi gestiamo il ripristino.
Ulteriori informazioni su Full Stack DR
Full Stack DR ti offre la potenza e la flessibilità necessarie per implementare il DR per applicazioni Oracle o non Oracle in OCI nel modo che preferisci, non nel modo che preferiamo.
- Scopri di più su Full Stack DR
- Guida per l'utente
- Guida API
- Approfondisci il disaster recovery
- Laboratorio pratico
considerazioni sulla progettazione DR
Ci sono molte cose da considerare, a seconda del metodo DR che si implementa.
Per informazioni generali sulle funzionalità DR, vedere Funzionalità DR di Oracle Cloud. In questo esempio, esaminiamo il metodo di warm standby e le risorse OCI necessarie per implementare il warm standby, che includono una seconda region per una distribuzione tra più aree.
Networking
Dopo aver creato la rete di base delle reti cloud virtuali (VCN) e delle subnet nelle rispettive aree, per configurare il DR è necessario eseguire il peer delle VCN nelle diverse aree per facilitare la connettività di rete.
Calcolo
Per eseguire applicazioni su istanze di computazione in due aree, è necessario rendere disponibili le immagini di computazione in entrambe le aree. Nell'area per il DR, implementa un'impostazione minima per mantenere un warm standby. Quindi, utilizzare capacity Reservations per prenotare la capacità rimanente necessaria per eseguire tutte le VM quando l'area DR diventa primaria. Per ulteriori informazioni, vedere Panoramica del servizio di computazione e Best practice per le istanze di computazione.
Storage
OCI fornisce un set di servizi di storage che include Volume a blocchi, Storage di file e Storage degli oggetti, che forniscono funzionalità di ridondanza e alta disponibilità integrate gestendo più copie dei dati. Questi servizi di storage forniscono anche una replica nativa che può essere configurata per il disaster recovery tra più aree.
Object Storage è una piattaforma di storage su scala Internet ad alte prestazioni che offre durabilità dei dati affidabile ed economica. Lo storage degli oggetti è un servizio regionale ed è disponibile in tutti i domini di disponibilità all'interno di un'area. La replica di storage degli oggetti può essere configurata in più aree a scopo DR.
Il volume a blocchi dispone di una funzione di replica asincrona completamente gestita e utile per il ripristino di emergenza. Con un recovery time objective (RTO) inferiore a un minuto, puoi replicare i volumi e i gruppi di volumi in un'altra area. È disponibile anche una funzione di backup automatica per produrre backup coerenti con gli arresti anomali per volumi e gruppi di volumi. Questi backup possono essere copiati automaticamente in un'altra area.
Analogamente ad altri servizi di storage in OCI, lo storage di file dispone di funzioni di replica integrate per replicare in modo asincrono in un altro dominio di disponibilità e in un'altra area. Utilizzando la funzione di clonazione dello storage di file, i dati sul lato destinazione possono essere resi disponibili quasi istantaneamente (RTO, File Storage). Per un'esperienza DR completa, la replica replica replica anche gli snapshot con i dati del file system principale.
Database
La progettazione ad alta disponibilità ha lo scopo di garantire la disponibilità dell'applicazione in caso di eventi di errore IaaS, ad esempio errore di nodo o rete. Gli scenari di DR del database si occupano della prevenzione della perdita di dati aziendali critici a causa di un'indisponibilità significativa e inevitabile per i database primari che spesso hanno un impatto su un'intera area o su un dominio di disponibilità.
Ti consigliamo di fare riferimento alla Maximum Availability Architecture (MAA), un insieme di best practice e architetture di riferimento sviluppate dai tecnici Oracle nel corso degli anni per l'uso integrato delle tecnologie di alta disponibilità, protezione dei dati e disaster recovery di Oracle.
Le considerazioni chiave per un progetto DR sono l'RPO (Recovery Point Objective), che è la quantità di perdita di dati che l'applicazione può tollerare, e l'RTO (Recovery Time Objective), che è il tempo massimo di recupero che l'applicazione può tollerare prima che i sistemi debbano tornare online. Sulla base di questi, ci sono varie categorie che MAA definisce con costi e complessità crescenti. Questi sono classificati come Bronzo, Argento, Auroso, Oro e Platino, ognuno con complessità e resilienza progressivamente crescenti. Questi costituiscono la base per le architetture di riferimento DR specificate da MAA.
Livelli MAA ( Maximum Availability Architecture) | Architettura di base | RPO ( Recovery Point Objective) | RPO ( Recovery Time Objective) | Oracle Autonomous Database Serverless (ADB-S) | Oracle Autonomous Database on Dedicated Exadata Infrastructure (ADB-D e ADB-C@C) | Oracle Base Database Service (VM) | Oracle Exadata Database Service on Dedicated Infrastructure (ExaDB-D) | Oracle Exadata Database Service on Cloud@Customer (ExaDB-C@C) |
---|---|---|---|---|---|---|---|---|
BRONZE | Singola istanza con backup locale e replicato | Ultimo backup | Ore | Integrata | Integrata | Integrata | Integrata | Integrata |
SILVER | RAC con backup locale e backup replicato | Ultimo backup | Ore (zero per manutenzione pianificata) | Integrata | Integrata | Predefinito per 2 nodi (richiedi EE Extreme Performance) | Integrata | Integrata |
AUROSO | PDB aggiornabile | Ultimo aggiornamento | minuti | + Autonomous Data Guard | Facoltativo | Facoltativo | Facoltativo | Facoltativo |
ORO | Database con replica cross-site attiva-passiva tramite Data Guard (attivo) | Zero | secondi | Non applicabile | + Data Guard | + Data Guard (richiede EE/EE HP per DG standard, EE EP per DG attiva) | + Data Guard | + Data Guard |
PLATINUM | Database con replica cross-site attiva-attiva tramite GoldenGate | Zero | Zero | + GoldenGate | + GoldenGate | + GoldenGate | + GoldenGate | + GoldenGate |
Questa progettazione e strategia di DR descrive la prevenzione della perdita di dati nel database Oracle. Una solida strategia di DR deve anche gestire le configurazioni per garantire la disponibilità continua delle applicazioni.
Le tecnologie chiave che costituiscono la base del MAA includono:
- Recovery Manager (RMAN)
- Pluggable database aggiornabile (PDB)
- Data Guard e Active Data Guard
- Autonomous Data Guard
- Golden Gate OCI
Controllo in corso
OCI Monitoring ti consente di monitorare in modo attivo e passivo le tue risorse cloud per una maggiore disponibilità e livelli di servizio coerenti. Assicurarsi di aver eseguito la sottoscrizione alle notifiche di stato OCI e controllare il dashboard Stato servizio. Per un esempio, vedere Monitoraggio end-to-end delle applicazioni in esecuzione su Oracle Cloud Infrastructure.
Visualizza altro
Playbook di soluzione:
- Scopri di più sull'automazione del recupero per le applicazioni Oracle e non Oracle
- Scopri come proteggere la tua topologia cloud dalle catastrofi
- Progettare l'infrastruttura per distribuire Oracle Enterprise Performance Management nel cloud (architettura DR: più aree)
- Proteggi il tuo SDDC VMware nel cloud da disastri
- Distribuisci Commvault per proteggere il tuo SDDC VMware nel cloud da disastri
- Distribuisci Zerto per proteggere il tuo SDDC VMware nel cloud da disastri
- Implementa Veeam per proteggere il tuo SDDC VMware nel cloud da disastri
- Implementa Actifio per proteggere il tuo SDDC VMware nel cloud da disastri
Architetture di riferimento:
- Progettare una topologia di disaster recovery (DR) pilota-luce
- Distribuisci Exadata Cloud Service con Data Guard in più aree
- Distribuire una soluzione di disaster recovery tra più aree utilizzando RackWare
- Configurare la connettività privata tra più aree tra le tenancy
Documentazione e altre risorse: