Planifiez votre stratégie de récupération après sinistre

Les catastrophes peuvent mettre hors ligne des systèmes critiques, endommager les bureaux et les centres de données, ou rendre les bases de données et les applications nécessaires à l'exécution des opérations commerciales temporairement inutilisables. Un plan de reprise après sinistre est le processus et la feuille de route technologique d'une entreprise pour récupérer rapidement ses systèmes et applications les plus importants afin de reprendre le travail tout en restaurant les autres.

La reprise après sinistre englobe les plans techniques d'une entreprise pour remettre ses charges de travail informatiques en ligne après un événement perturbateur, ainsi que les méthodes de test du livre de jeu avant une catastrophe. Dans un plan de reprise après sinistre, les charges de travail sont classées par ordre d'importance. Visez à minimiser les temps d'arrêt de calcul et les données perdues tout en équilibrant le coût de cette opération pour chaque charge de travail.

La reprise après sinistre décrit les politiques, les technologies et le budget que les entreprises consacrent à la remise en ligne des systèmes de TI importants après un temps d'arrêt inattendu. Avant qu'une interruption ne se produise, identifiez les applications critiques qui doivent être restaurées immédiatement après une catastrophe et classez les autres en groupes d'importance.

Il existe deux mesures critiques de récupération après sinistre : l'objectif de délai de récupération (ODR), qui mesure la durée maximale pendant laquelle un système peut rester hors ligne, et l'objectif de point de récupération (OPR), qui mesure la quantité de données qu'une entreprise peut se permettre de perdre et qui est associée à la fréquence des sauvegardes ou de la réplication. Pour les deux, les seuils plus courts sont meilleurs mais plus coûteux. Les organisations informatiques définissent souvent un RTO et un RPO pour chaque système qu'elles exécutent, ce qui leur permet d'équilibrer les coûts avec la criticité.

Développer un plan de récupération après sinistre

Architecte infonuagique, gestionnaire des opérations infonuagiques, architecte de sécurité

Évaluer minutieusement les risques potentiels d'événements catastrophiques, les dommages potentiels aux opérations, la façon dont les employés et les intervenants externes peuvent être touchés, et les pertes financières ou les amendes réglementaires qui pourraient être encourues à la suite de votre plan de RS.

Dans le cadre de l'élaboration d'un plan de reprise après sinistre, identifier les commanditaires exécutifs et les équipes concernées; cataloguer les ressources physiques et informatiques qui pourraient être endommagées lors d'une catastrophe; et tenir compte des impacts potentiels sur les clients, les fournisseurs, les partenaires et les autres parties prenantes.

Déterminez quelles charges de travail peuvent être restaurées à partir de sauvegardes, qui nécessitent des données réelles combinées à des services exécutés à une capacité inférieure et quelles charges de travail ont besoin d'une capacité complète. Dans certains cas, les systèmes actifs qui sont en panne passeront automatiquement aux systèmes de secours, entraînant un temps d'arrêt minimal et aucune perte de données. Dans d'autres cas, la permutation sera manuelle. Sélectionnez les sites de sauvegarde et créez un plan qui leur permet de redémarrer rapidement les applications. Le nuage est une grande aide ici. Recherchez les dépendances informatiques qui pourraient empêcher le redémarrage des opérations, c'est-à-dire les cas où une application hors ligne empêche d'en remettre une autre en ligne.

En plus de ces aspects techniques, le leadership exécutif et les secteurs d'activité devraient avoir des plans de communication et d'intervention d'urgence en place, ainsi que des dispositions pour former les employés au plan de reprise après sinistre, le tester et le répéter via des tests sur table ou des visites guidées, et l'améliorer continuellement.

Concevoir des solutions de récupération après sinistre

Architecte infonuagique, gestionnaire des opérations infonuagiques, architecte de sécurité

Lors de l'élaboration d'un plan de reprise après sinistre, commencez par une évaluation des risques d'événements catastrophiques potentiels et de leur impact sur les systèmes informatiques et les processus opérationnels.

Ensuite, les équipes des TI et du secteur d'activité, soutenues par la direction, devraient classer les actifs et les systèmes en fonction de leur importance et affecter des stratégies de reprise après sinistre pour protéger chacune d'elles, en tenant compte des objectifs de délai de récupération et des objectifs de point de reprise souhaités et du budget disponible. Les plans de reprise après sinistre font partie des plans de continuité des activités plus larges visant à réduire le temps écoulé entre une catastrophe, une cyberattaque ou une panne causée par une erreur technique et une reprise après sinistre. Ils doivent être continuellement testés et mis à jour.

Planifiez la reprise après sinistre traditionnelle ou la récupération après sinistre dans le nuage. La reprise après sinistre traditionnelle repose sur des serveurs et des périphériques de stockage redondants situés dans un centre de données appartenant à l'entreprise ou sur la sauvegarde des données d'entreprise et des instances d'application vers des centres de données distants. Il est donc peu probable qu'un problème dans une zone géographique cause des dommages aux copies distantes très éloignées. Les stratégies de reprise après sinistre basées sur le nuage, en revanche, permettent aux entreprises d'économiser sur les coûts initiaux en stockant des copies plus petites ou de secours des instances d'application dans un nuage public, en les augmentant en ajoutant des ressources informatiques lorsqu'elles doivent être activées en cas d'urgence. Les entreprises peuvent également répartir les applications essentielles entre plusieurs régions infonuagiques.

Mettre en oeuvre la récupération après sinistre de pile complète

Architecte infonuagique, gestionnaire des opérations infonuagiques, architecte de sécurité

Oracle Cloud Infrastructure Full Stack Disaster Recovery est un service d'orchestration et de gestion de la récupération après sinistre qui fournit des fonctions complètes de récupération après sinistre pour toutes les couches d'une pile d'applications, notamment l'infrastructure, l'intergiciel, la base de données et l'application.

Le service de récupération après sinistre de pile complète d'OCI assure la continuité complète des activités suite à diverses pannes de centre de données afin que les pannes à l'échelle de la région ou du domaine de disponibilité aient peu d'incidence sur les organisations.

La reprise après sinistre de pile complète est suffisamment flexible pour s'intégrer facilement à diverses plates-formes Oracle, à différentes applications non Oracle et à l'infrastructure. La récupération après sinistre de pile complète génère, exécute et surveille les plans de récupération après sinistre pour les services et les applications déployés dans votre location. La récupération après sinistre de pile complète fonctionne au niveau du service, et n'a donc aucune incidence sur les autres services exécutés dans votre location. En fonction de vos besoins spécifiques, vous pouvez personnaliser les plans de récupération après sinistre générés par la récupération après sinistre de pile complète.

Surveillez activement la progression des opérations de récupération après sinistre de pile complète et effectuez des actions correctives en cas d'erreurs au cours d'une opération. Validez et surveillez la disponibilité et la conformité de la continuité des activités en exécutant périodiquement des vérifications préalables de débit de pile complète.

La récupération après sinistre de pile complète est prise en charge entre OCI et OCI. Toutes les charges de travail sur place devront être migrées vers OCI pour que la récupération après sinistre de pile complète puisse être mise en oeuvre.

Les plans de forage de récupération après sinistre vous permettent d'exercer et de valider votre configuration et vos plans de continuité des activités sans perturber votre pile de production. Utilisez une copie de la pile de production isolément dans une région de secours à des fins de test et de validation.