Modèle de responsabilité partagée pour la résilience

La résilience dans le cloud est une responsabilité partagée entre vous (l'utilisateur) et Oracle. Pour que vous puissiez créer des architectures de charge de travail résilientes dans Oracle Cloud Infrastructure (OCI), vous devez comprendre vos exigences et responsabilités en matière de haute disponibilité et de récupération après sinistre.

Responsabilité d'Oracle : "Résilience du cloud"

OCI est responsable de la "résilience du cloud". OCI fournit une infrastructure cloud mondiale robuste, hautement disponible et résiliente composée de centres de données, de réseaux, de matériel physique et de logiciels conçus pour minimiser les temps d'arrêt et garantir que les applications restent accessibles et fonctionnelles même en cas de panne. OCI offre des contrats de niveau de service (SLA) de bout en bout couvrant les performances, la disponibilité et la gestion de ces services.

OCI est hébergé physiquement dans plusieurs régions. Les régions sont indépendantes et géographiquement dispersées dans un pays, entre pays ou entre continents. Chaque région est composée de domaines de disponibilité, nommés respectivement à un seul domaine de disponibilité ou à plusieurs domaines de disponibilité. Chaque domaine de disponibilité est un centre de données indépendant. Dans les régions à plusieurs domaines de disponibilité, chacun est isolé afin de réduire le risque de défaillance affectant les autres.

Les domaines de disponibilité sont connectés par un réseau sécurisé à faible latence et à bande passante élevée, qui vous permet de créer des solutions résilientes et hautement disponibles sur plusieurs domaines de disponibilité (si disponibles). De plus, chaque domaine de disponibilité contient trois domaines de pannes. Chaque FD est un regroupement de matériel et d'infrastructure distinct des autres FD du même domaine de disponibilité. Les disques durs électroniques permettent de distribuer des ressources afin qu'elles ne dépendent pas du même matériel physique au sein d'un même domaine de disponibilité. En conséquence, les pannes matérielles ou les événements de maintenance qui affectent un FD n'affectent pas les ressources des autres FD.

Les composants d'infrastructure de base OCI, tels que les services Compute, Storage, Networking, Identity et Database, disposent de redondances intégrées. Vous pouvez tirer parti des domaines de disponibilité, des domaines de disponibilité et de ces services pour créer des applications hautement disponibles. Cependant, OCI ne réplique pas, ne déploie pas et n'effectue pas automatiquement de basculement pour les ressources d'application et les données provisionnées dans la location d'un utilisateur vers un autre domaine de disponibilité ou une autre région en cas de sinistre ou de panne régionale partielle/complète. Il incombe à l'utilisateur de déployer ses ressources d'application dans les domaines de disponibilité et les régions.

Par exemple, si une application est déployée sur une instance de calcul (avec un volume de blocs) dans un domaine de disponibilité (par exemple, AD1), OCI ne provisionnera pas automatiquement une nouvelle instance de calcul dans un autre domaine de disponibilité ou une autre région en cas d'échec affectant l'instance.

Remarque : le stockage de blocs comporte des redondances intégrées.

Votre responsabilité : "La résilience dans le Cloud"

Pour atteindre la "résilience dans le cloud", vous êtes responsable en dernier ressort de l'élaboration d'un plan complet de continuité des activités, comprenant une stratégie de haute disponibilité et de récupération après sinistre, des évaluations des risques et des plans d'intervention en cas d'incident. Vous êtes également responsable du déploiement de vos applications et systèmes dans plusieurs domaines de disponibilité, domaines de disponibilité et régions à des fins de résilience et de tolérance aux pannes à l'aide des meilleures pratiques OCI et des structures d'architecture de disponibilité maximale (MAA). Chaque composant de l'application doit être conçu de manière à garantir son potentiel maximal de disponibilité et d'accessibilité. Pour garantir une haute disponibilité, il est nécessaire d'identifier et d'éliminer les points de défaillance uniques afin que, même en cas de défaillance des composants, l'application reste en cours d'exécution et disponible.

En cas de sinistre ou de panne régionale complète, qu'il s'agisse d'une région à un ou plusieurs domaines de disponibilité, il vous incombe de vous assurer que la disponibilité des ressources OCI est allouée à votre location dans le domaine de disponibilité ou la région de basculement avant d'exécuter un plan de récupération après sinistre.

La résilience est une responsabilité partagée entre OCI et vous

Responsabilités OCI : résilience du cloud

Composants Description
Région, domaines de disponibilité, domaines de pannes Oracle provisionne, gère, surveille, sécurise et exploite une infrastructure cloud mondiale hautement fiable.
Services de stockage OCI Oracle provisionne et exploite des services de stockage, offrant une haute disponibilité des services et protégeant les données physiquement au sein d'un domaine de disponibilité.
Services OCI Core Networking Oracle fournit une haute disponibilité pour les services de réseau de base OCI et les services de connectivité avec une mise en forme du trafic global qui garantit une connectivité et des performances optimales des applications.
Services de base de données OCI Oracle crée et lance le service Database, effectue la maintenance et les améliorations matérielles, met à jour les serveurs de stockage et supervise l'état du service.

Vos responsabilités : résilience dans le cloud

Composants Description
Planification et test de la haute disponibilité, de la récupération après sinistre et du basculement Planifiez, configurez, testez et exécutez des solutions de haute disponibilité, de récupération après sinistre et de basculement pour la résilience des données et des services afin d'assurer la continuité des activités.
Opérations et gestion Vous êtes responsable de l'exploitation et de la surveillance de vos ressources cloud, de l'implémentation des meilleures pratiques d'architecture cloud résiliente pour minimiser les perturbations de service.
Architecture de charge globale Vous êtes responsable de l'utilisation des meilleures pratiques d'architecture d'entreprise et des structures Maximum Availability Architecture (MAA) pour concevoir, créer et maintenir des charges de travail cloud fiables, sécurisées, efficaces et rentables.
Planification de la résilience Vous êtes responsable de l'élaboration d'un plan complet de continuité des activités, comprenant une stratégie de haute disponibilité et de récupération après sinistre, des évaluations des risques et des plans de réponse aux incidents.

Comment OCI offre la résilience du cloud

Les informations suivantes décrivent comment OCI offre la résilience cloud.

Responsabilités d'OCI pour les services

  • L'architecture OCI est conçue avec résilience, en déployant plusieurs composants qui peuvent exécuter la même tâche.
  • OCI surveille l'état des services OCI et gère le basculement automatique en cas d'interruption de service.
  • Les services de plate-forme de base OCI, les serveurs et le stockage, la mise en réseau, les services de base Identity and Access Management (IAM) et les services de télémétrie sont conçus et déployés de manière redondante. OCI surveille en permanence leur état, et en cas de panne, des processus de basculement automatique sont exécutés pour assurer la continuité.
  • Les services OCI Storage ont intégré la résilience. OCI Block Volume fournit un stockage de données hautes performances persistant au sein d'un domaine de disponibilité. De même, OCI Object Storage fournit un stockage de données persistant, durable et hautes performances au sein d'un domaine de disponibilité. En outre, dans les régions à plusieurs domaines de disponibilité, la banque d'objets réplique automatiquement les données sur les domaines de disponibilité. Le stockage de fichiers gère les répliques dans les domaines de pannes, au sein d'un domaine de disponibilité.
  • Oracle fournit des services de base de données hautement robustes et résilients au sein d'OCI qui vous permettent de sélectionner la stratégie de haute disponibilité et de récupération après sinistre la plus adaptée à vos besoins.
  • OCI DNS est hébergé dans plusieurs centres de données distribués géographiquement, ce qui le rend hautement disponible. Il offre également une faible latence, un niveau d'équilibrage de charge de base et une résilience permettant de gérer les pannes ou le trafic important avec un impact minimal sur les utilisateurs.

Vos responsabilités pour atteindre la résilience

Les informations suivantes décrivent les façons dont vous êtes responsable de la résilience.

Traitement des recommandations

Domaines d'identité

  • Planifiez les domaines de récupération après sinistre et d'identité.
  • La réplication de domaine d'identité est toujours activée pour le domaine d'identité "par défaut". Le domaine d'identité "par défaut" est toujours répliqué vers toutes les régions auxquelles le locataire est abonné. Lorsqu'un administrateur s'abonne à une autre région, le domaine d'identité "par défaut" est automatiquement répliqué vers cette région.
  • Des domaines d'identité supplémentaires sont créés dans la "région d'origine" indiquée lors de la création. Ils ne répliquent pas vers d'autres régions abonnées, sauf si la réplication est spécifiquement activée.

Fonctions de réseau

Calcul

  • Planifier la haute disponibilité des instances Compute, en les répartissant entre les différents domaines de disponibilité de chacun et en les plaçant derrière les équilibreurs de charge.
    • Activez la sauvegarde pour un instantané ponctuel de vos volumes.
    • Configurez la réplication inter-région des volumes de blocs, des volumes d'initialisation et des groupes de volumes.
    • Rendez les images de calcul disponibles dans une région active et une région de récupération après sinistre. Dans la région de la récupération après sinistre, déployez une configuration minimale permettant de gérer un système de secours à chaud. Utilisez ensuite les réservations de capacités afin d'effectuer le reste de la capacité requise pour exécuter toutes les machines virtuelles si la région DE récupération après sinistre devient principale.

Stockage

  • Planifier la haute disponibilité pour le stockage.
    • Activez les sauvegardes automatisées pour Object Storage et la réplication Object Storage entre les régions à des fins de récupération après sinistre.
    • Activez les fonctionnalités de clonage de volumes pour les volumes de blocs et tirez parti de la fonctionnalité de réplication du service Block Volume pour assurer la redondance entre différents domaines de disponibilité (même région ou région différente).
    • Activez les instantanés et les clones du système de fichiers. Le cycle de vie des instantanés peut être géré automatiquement à l'aide de la fonctionnalité Cliché basé sur une stratégie. Utiliser la réplication asynchrone OCI File Storage pour les scénarios de basculement et de rétablissement
    • Configurez la réplication asynchrone de volume de blocs pour répliquer des volumes et des groupes de volumes vers une autre région. Activez la fonctionnalité de sauvegarde pour produire des sauvegardes cohérentes en cas d'incident pour les volumes et les groupes de volumes. Activez les copies vers une autre région.
    • Pour File Storage, en plus de la réplication intégrée pour effectuer une réplication asynchrone vers un autre domaine de disponibilité et une autre région, vous pouvez utiliser la fonctionnalité de clonage File Storage pour un RTO presque instantané.

Base de données

Arborescence de décision OCI HA DR

OCI HA – Arborescence des décisions de récupération après sinistre.

En savoir plus

Documentation

Livres de jeux de solution

Architectures de référence