Planeje sua Estratégia de Recuperação de Desastres

Os desastres podem colocar sistemas críticos off-line, danificar escritórios e data centers ou tornar bancos de dados e aplicativos necessários para executar operações de negócios temporariamente inutilizáveis. Um plano de recuperação de desastres é o roteiro de processo e tecnologia de uma empresa para fazer backup rápido de seus sistemas e aplicativos mais importantes para retomar o trabalho enquanto restaura outros.

A recuperação de desastres (RD) abrange os planos técnicos de uma empresa para colocar suas cargas de trabalho de computação de volta on-line após um evento disruptivo, bem como os métodos para testar o manual antes dos ataques a desastres. Em um plano de recuperação de desastres, as cargas de trabalho são classificadas em ordem de importância. Tente minimizar o tempo de inatividade de computação e a perda de dados enquanto equilibra o custo de fazer isso para cada carga de trabalho.

A recuperação de desastres descreve as políticas, tecnologias e orçamento que as empresas dedicam a colocar sistemas de TI importantes de volta on-line após um tempo de inatividade inesperado. Antes que uma interrupção ocorra, identifique quais aplicativos de missão crítica devem ser restaurados imediatamente após um desastre e classifique outros em grupos importantes.

Há duas métricas críticas de recuperação de desastres: RTO (Recovery Time Objective), que mede o tempo máximo que um sistema pode permanecer off-line, e RPO (Recovery Point Objective), que mede a quantidade de dados que uma empresa pode perder e está associada à frequência de backups ou replicação. Para ambos, limiares mais curtos são melhores, mas mais caros. As organizações de TI geralmente definem um RTO e um RPO para cada sistema executado, permitindo que elas equilibrem custos com criticidade.

Desenvolver um Plano de Recuperação de Desastre

Arquiteto de Nuvem, Gerente de Operações em Nuvem, Arquiteto de Segurança

Avalie minuciosamente os riscos potenciais de eventos catastróficos, os possíveis danos às operações, como os funcionários e partes interessadas externas podem ser afetados e as perdas financeiras ou multas regulatórias que podem ser incorridas como resultado em seu plano de DR.

Como parte do desenvolvimento de um plano de DR, identifique patrocinadores executivos e equipes afetadas; catalogue ativos físicos e de TI que possam ser prejudicados durante um desastre; e considere os possíveis impactos sobre clientes, fornecedores, parceiros e outras partes interessadas.

Decida quais cargas de trabalho podem ser restauradas a partir de backups, que exigem dados ativos combinados com serviços em execução em menor capacidade e quais cargas de trabalho precisam de capacidade total. Em alguns casos, os sistemas ativos que estão inativos mudarão automaticamente para sistemas em espera, incorrendo em tempo de inatividade mínimo e zero perda de dados. Em outros casos, o switchover será manual. Selecione sites de backup e crie um plano que os permita reiniciar rapidamente os aplicativos. A nuvem é uma grande ajuda aqui. Procure dependências de TI que possam impedir a reinicialização das operações — casos em que um aplicativo off-line impede a colocação de outro on-line.

Além desses aspectos técnicos, a liderança executiva e as linhas de negócios devem ter planos de comunicação e resposta de emergência em vigor, bem como provisões para treinar funcionários no plano de DR, testá-lo e ensaiá-lo por meio de testes de mesa ou orientações e melhorá-lo continuamente.

Projete Soluções de Recuperação de Desastres

Arquiteto de Nuvem, Gerente de Operações em Nuvem, Arquiteto de Segurança

Ao desenvolver um plano de recuperação de desastres, comece com uma avaliação de risco de possíveis eventos catastróficos e seu impacto nos sistemas de TI e processos de negócios.

Em seguida, as equipes de TI e de linha de negócios, apoiadas pela administração, devem classificar ativos e sistemas por sua importância e atribuir estratégias de DR para proteger cada um, considerando os RTOs e RPOs desejados e o orçamento disponível. Os planos de DR fazem parte de planos de continuidade de negócios mais amplos para fazer a ponte entre o tempo de um desastre, ataque cibernético ou interrupção causada por um erro técnico e a recuperação. Eles precisam ser continuamente testados e atualizados.

Planeje a recuperação de desastres tradicional ou a realocação de desastres baseada na nuvem. A DR tradicional depende de servidores redundantes e dispositivos de armazenamento localizados em um data center de propriedade da empresa ou do backup de dados de negócios e instâncias de aplicativos em data centers remotos, portanto, é improvável que um problema em uma área geográfica cause danos a cópias remotas distantes. As estratégias de DR baseadas em nuvem, por outro lado, permitem que as empresas economizem em custos iniciais armazenando cópias menores ou em espera de instâncias de aplicativos em uma nuvem pública, ampliando-as adicionando recursos de computação quando precisam ser ativadas em caso de emergência. As empresas também podem distribuir aplicativos de missão crítica em várias regiões da nuvem.

Implementar o Full Stack Disaster Recovery

Arquiteto de Nuvem, Gerente de Operações em Nuvem, Arquiteto de Segurança

O Oracle Cloud Infrastructure Full Stack Disaster Recovery é um serviço de orquestração e gerenciamento de recuperação de desastre que fornece recursos abrangentes de recuperação de desastre para todas as camadas de uma pilha de aplicativos, incluindo infraestrutura, middleware, banco de dados e aplicativo.

O OCI Full Stack Disaster Recovery (DR) garante a continuidade abrangente dos negócios contra uma variedade de interrupções no data center, para garantir que as organizações tenham um impacto mínimo de interrupções em toda a região ou de interrupções no domínio de disponibilidade.

O Full Stack DR é flexível o suficiente para se integrar facilmente com várias plataformas Oracle, aplicativos não Oracle e infraestrutura. O Full Stack DR gera, executa e monitora planos de recuperação de desastre para serviços e aplicativos implantados em sua tenancy. O Full Stack DR opera no nível do serviço; portanto, não há impacto em outros serviços em execução em sua tenancy. Com base em suas necessidades específicas, você pode personalizar os planos de recuperação de desastre gerados pelo Full Stack DR.

Monitore ativamente o andamento das operações do Full Stack DR e tome medidas corretivas, se houver erros durante uma operação. Valide e monitore a prontidão e a conformidade da continuidade dos negócios executando periodicamente as Pré-verificações do Full Stack DR.

O Full Stack DR é compatível com OCI para OCI. Todas as cargas de trabalho on-premises precisarão ser migradas para a OCI antes que o Full Stack DR possa ser implementado.

Os Planos Detalhados de Recuperação de Desastres permitem que você exerça e valide sua configuração e planos de continuidade de negócios sem interromper sua pilha de produção. Traga uma cópia da pilha de produção isoladamente em uma região stand-by para teste e validação.