Planifiez votre stratégie de récupération après sinistre

Les catastrophes peuvent mettre hors ligne les systèmes critiques, endommager les bureaux et les centres de données ou rendre temporairement inutilisables les bases de données et les applications nécessaires à l'exécution des opérations commerciales. Un plan de reprise après sinistre est une feuille de route des processus et de la technologie d'une entreprise pour récupérer rapidement ses systèmes et applications les plus importants afin de reprendre le travail tout en restaurant les autres.

La récupération après sinistre englobe les plans techniques d'une entreprise pour remettre ses charges de travail de calcul en ligne après un événement perturbateur, ainsi que les méthodes de test du manuel avant une catastrophe. Dans un plan de récupération après sinistre, les charges globales sont classées par ordre d'importance. Essayez de réduire les temps d'arrêt de calcul et les données perdues tout en équilibrant le coût de cette opération pour chaque charge de travail.

La récupération après sinistre décrit les politiques, les technologies et le budget que les entreprises consacrent à la remise en ligne des systèmes informatiques importants après un temps d'arrêt inattendu. Avant qu'une perturbation ne se produise, identifiez les applications critiques qui doivent être restaurées immédiatement après une catastrophe et classez les autres par groupes d'importance.

Il existe deux mesures de récupération après sinistre critiques : l'objectif de temps de récupération (RTO), qui mesure la durée maximale pendant laquelle un système peut rester hors ligne, et l'objectif de point de récupération (RPO), qui mesure la quantité de données qu'une entreprise peut se permettre de perdre et qui est associée à la fréquence des sauvegardes ou de la réplication. Pour les deux, les seuils plus courts sont meilleurs mais plus coûteux. Les organisations informatiques définissent souvent un RTO et un RPO pour chaque système qu'elles exécutent, ce qui leur permet d'équilibrer les coûts avec la criticité.

Développement d'un plan de récupération après sinistre

Architecte cloud, Gestionnaire des opérations cloud, Architecte de sécurité

Évaluez minutieusement les risques potentiels d'événements catastrophiques, les dommages potentiels aux opérations, la façon dont les employés et les intervenants externes peuvent être affectés, ainsi que les pertes financières ou les amendes réglementaires qui pourraient être encourues à la suite de votre plan de récupération après sinistre.

Dans le cadre de l'élaboration d'un plan de reprise après sinistre, identifier les commanditaires exécutifs et les équipes touchées, répertorier les actifs physiques et informatiques qui pourraient être endommagés lors d'une catastrophe et examiner les impacts potentiels sur les clients, les fournisseurs, les partenaires et les autres parties prenantes.

Décidez quelles charges globales peuvent être restaurées à partir de sauvegardes, qui nécessitent des données réelles combinées à des services exécutés à une capacité inférieure, et quelles charges globales ont besoin d'une capacité totale. Dans certains cas, les systèmes actifs en panne basculent automatiquement sur les systèmes de secours, ce qui entraîne un temps d'arrêt minimal et une perte de données nulle. Dans d'autres cas, la permutation sera manuelle. Sélectionnez des sites de sauvegarde et élaborez un plan qui leur permet de redémarrer rapidement les applications. Le cloud est d'une grande aide ici. Recherchez les dépendances informatiques qui pourraient entraver le redémarrage des opérations (cas où une application hors ligne empêche de remettre une autre en ligne).

En plus de ces aspects techniques, le leadership exécutif et les secteurs d'activité devraient avoir des plans de communication et d'intervention d'urgence en place, ainsi que des dispositions pour former les employés au plan de récupération après sinistre, le tester et le répéter via des tests sur table ou des revues de processus, et l'améliorer continuellement.

Concevoir des solutions de récupération après sinistre

Architecte cloud, Gestionnaire des opérations cloud, Architecte de sécurité

Lors de l'élaboration d'un plan de reprise après sinistre, commencez par une évaluation des risques des événements catastrophiques potentiels et de leur impact sur les systèmes informatiques et les processus métier.

Ensuite, les équipes informatiques et sectorielles, soutenues par la direction, devraient classer les actifs et les systèmes par leur importance et affecter des stratégies de récupération après sinistre pour protéger chacune d'elles, en tenant compte des RTO et RPO souhaités et du budget disponible. Les plans de reprise après sinistre s'inscrivent dans le cadre de plans de continuité des activités plus larges visant à réduire le délai entre un sinistre, une cyberattaque ou une panne causée par une erreur technique et la récupération. Ils doivent être continuellement testés et mis à jour.

Planifiez la reprise après sinistre traditionnelle ou la reprise après sinistre sur le cloud. La récupération après sinistre traditionnelle repose sur des serveurs et des périphériques de stockage redondants situés dans un centre de données appartenant à l'entreprise ou sur la sauvegarde des données d'entreprise et des instances d'application vers des centres de données distants. Il est donc peu probable qu'un problème dans une zone géographique endommage les copies distantes. En revanche, les stratégies de récupération après sinistre basées sur le cloud permettent aux entreprises d'économiser sur les coûts initiaux en stockant des copies plus petites ou de secours des instances d'application dans un cloud public, en les augmentant en ajoutant des ressources informatiques lorsqu'elles doivent être activées en cas d'urgence. Les entreprises peuvent également distribuer des applications stratégiques dans plusieurs régions cloud.

Implémenter Full Stack Disaster Recovery

Architecte cloud, Gestionnaire des opérations cloud, Architecte de sécurité

Oracle Cloud Infrastructure Full Stack Disaster Recovery est un service de gestion et d'orchestration de récupération après sinistre qui fournit des fonctionnalités complètes pour toutes les couches de la pile d'applications, y compris l'infrastructure, le middleware, la base de données et l'application.

La récupération après sinistre OCI Full Stack (DR) assure une continuité complète des opérations en cas de diverses coupures du centre de données afin de garantir aux entreprises un impact minimal en cas de coupure au niveau de la région ou du domaine de disponibilité.

Full Stack DR est suffisamment flexible pour s'intégrer facilement à diverses plates-formes Oracle, applications non Oracle et infrastructure. Full Stack DR génère, exécute et surveille les plans de récupération après sinistre pour les services et les applications déployés dans votre location. Full Stack DR fonctionne au niveau du service, de sorte qu'il n'y a aucune incidence sur les autres services exécutés dans la location. En fonction de vos besoins, vous pouvez personnaliser les plans de récupération après sinistre générés par Full Stack DR.

Surveillez activement la progression des opérations de Full Stack DR et prenez des mesures correctives en cas d'erreurs au cours d'une opération. Validez et surveillez la préparation et la conformité de la continuité des activités en exécutant régulièrement des pré-vérifications Full Stack DR.

Full Stack DR est pris en charge par OCI vers OCI. Tous les workloads sur site devront être migrés vers OCI avant de pouvoir implémenter Full Stack DR.

Les plans d'exploration de récupération après sinistre vous permettent d'exercer et de valider votre configuration et vos plans de continuité d'activité sans perturber votre pile de production. Apportez une copie de la pile de production isolée dans une région de secours pour le test et la validation.