Planifier la haute disponibilité pour les instances de calcul

Oracle Cloud Infrastructure Compute fournit des instances Bare Metal et de machine virtuelle qui vous permettent de déployer n'importe quelle taille de serveur dont vous avez besoin, à partir d'une petite machine virtuelle avec un seul coeur vers un serveur Bare Metal ou de machine virtuelle volumineux avec de nombreux coeurs et une quantité plus importante de RAM. Ces options assurent les performances, la flexibilité et le contrôle nécessaires à l'exécution de vos applications et charges de travail les plus exigeantes dans le cloud.

Pour planifier la haute disponibilité de vos instances de calcul, les stratégies de conception clés que vous devez prendre en compte sont les suivantes :

Eliminer les événements d'échec ponctuels en exploitant correctement le domaine de pannes et les domaines de disponibilité.
Grâce à la surveillance, aux pools d'instances et à l'équilibreur de charge.
Garantir que votre conception protège à la fois la disponibilité et l'intégrité des données de vos instances Compute.

Cet article décrit ces stratégies.

Distribuer les instances dans les domaines de pannes

L'un des principes clés de la conception de solutions haute disponibilité est d'éviter les points de défaillance uniques. Le principe de conception clé consiste alors à répartir les instances entre plusieurs domaines de pannes.

Dans un déploiement à domaine de disponibilité unique, en utilisant correctement les domaines de pannes, vous pouvez augmenter la disponibilité des applications exécutées sur Oracle Cloud Infrastructure. L'architecture de votre application détermine si vous devez séparer ou regrouper des instances à l'aide de domaines de pannes.

scénario 1 : architecture d'application hautement disponible
Dans ce scénario, vous disposez d'une application hautement disponible (par exemple, deux serveurs Web et une base de données incluse dans un cluster). Ici, vous pouvez regrouper un serveur Web et un noeud de base de données dans un domaine de pannes et l'autre moitié de chaque paire dans un autre domaine de pannes. Cette architecture permet de s'assurer qu'une défaillance d'un domaine de pannes n'entraîne pas une interruption de votre application.
Scénario 2 : serveur Web unique et architecture d'instance de base de données
Dans ce scénario, votre architecture d'application n'est pas hautement disponible. Par exemple, vous disposez d'un serveur Web et d'une instance de base de données. Ici, le serveur Web et l'instance de base de données doivent être placés dans le même domaine de pannes. Cette architecture garantit que l'application n'est affectée qu'en cas de défaillance de ce domaine de pannes unique.

Distribuer des instances entre les domaines de disponibilité

Une autre approche de la haute disponibilité est de déployer des instances Compute qui effectuent les mêmes tâches dans plusieurs domaines de disponibilité. Cette conception supprime un point d'échec unique en introduisant la redondance dans les centres de données.

Dans un déploiement à domaines de disponibilité multiples, vous séparez les groupes d'instances par domaine de disponibilité. Cela protège votre application des pannes au niveau du centre de données, telles que les coupures de courant, les pannes d'infrastructure physique ou les événements de maintenance planifiés.

Lorsque les instances sont distribuées entre des domaines de disponibilité ou des domaines de pannes, un équilibreur de charge est souvent utilisé pour améliorer l'utilisation des ressources, faciliter le redimensionnement et assurer une haute disponibilité. Elle prend en charge le routage des demandes entrantes vers divers ensembles de back-ends, ou groupes d'instances de calcul, afin d'équilibrer le trafic réseau entre eux.

Le diagramme suivant illustre les machines virtuelles de serveur Web déployées dans deux domaines de disponibilité pour implémenter la redondance, ainsi qu'un équilibreur de charge :

Description de l'illustration public-lb.png

Remarque :

L'architecture présente plusieurs domaines de disponibilité. Pour une région dotée d'un seul domaine de disponibilité, ajustez l'architecture afin de répartir les ressources entre les domaines de pannes du domaine de disponibilité.

Selon les exigences de votre système ou de votre application, vous pouvez implémenter cette redondance architecturale en mode veille ou en mode actif :

En mode veille, lorsque le composant principal tombe en panne, le composant de secours prend le relais. Le mode veille est généralement utilisé pour les applications qui doivent conserver leurs états.
En mode actif, aucun composant n'est désigné comme principal ou de secours ; tous les composants participent activement à l'exécution des mêmes tâches. Lorsque l'un des composants échoue, les tâches associées sont simplement distribuées à un autre composant. Le mode actif est généralement utilisé pour les applications sans conservation de statut.

Assurer la haute disponibilité et l'intégrité de vos données

Dans le cadre d'une architecture haute disponibilité, veillez toujours à ce que votre conception protège à la fois la disponibilité et l'intégrité des données de vos instances Compute. Pour protéger la disponibilité des données de votre instance Compute, vous pouvez répliquer ou sauvegarder vos données vers un autre emplacement.

Récapitulatif du volume de blocs
Le service Oracle Cloud Infrastructure Block Volume permet de provisionner et de gérer les volumes de stockage de blocs de façon dynamique. Vous pouvez créer, attacher, connecter et déplacer des volumes, ainsi que modifier leurs performances, si nécessaire, afin de répondre à vos exigences en matière de stockage, de performances et d'application. Une fois un volume attaché et connecté à une instance, vous pouvez l'utiliser comme un disque dur classique. Vous pouvez également déconnecter un volume et l'attacher à une autre instance sans perte de données.
Durabilité des volumes
Le service Oracle Cloud Infrastructure Block Volume offre un haut niveau de durabilité des données par rapport aux lecteurs attachés standard. Tous les volumes sont automatiquement répliqués afin d'éviter toute perte de données. Plusieurs copies de données sont stockées de manière redondante dans de multiples serveurs de stockage dotés de mécanismes de réparation intégrés. Pour l'objectif de niveau de service, le service Block Volume est conçu afin d'offrir une durabilité annuelle de 99,99 % pour les volumes de blocs et les volumes d'initialisation. Cependant, nous vous recommandons de réaliser régulièrement des sauvegardes afin de protéger les données contre la panne d'un domaine de disponibilité.
Réplication de volume
Le service Block Volume vous permet d'effectuer une réplication asynchrone automatique continue de volumes de blocs et de volumes d'initialisation vers d'autres régions ou domaines de disponibilité de la même région. La réplication interdomaine de disponibilité au sein de la même région n'est prise en charge que pour les régions ayant plusieurs domaines de disponibilité. Pour déterminer les régions contenant plusieurs domaines de disponibilité, reportez-vous au champ Domaines de disponibilité du tableau répertoriant les régions dans A propos des régions et Domaines de disponibilité. Cette fonctionnalité prend en charge les scénarios de récupération après sinistre, de migration et de développement des activités, sans nécessiter de sauvegardes de volume. Pour plus d'informations, reportez-vous à la section "Réplication d'un volume", à laquelle vous pouvez accéder à partir du sujet Explorer plus, ailleurs dans ce livre de jeux.

A propos des sauvegardes de volume de blocs

La fonctionnalité de sauvegarde du service Oracle Cloud Infrastructure Block Volume permet de prendre des clichés à un point dans le temps des données sur un volume de blocs. Vous pouvez effectuer une sauvegarde d'un volume lorsqu'il est attaché à une instance ou pendant son détachement. Vous pouvez ensuite restaurer ces sauvegardes vers les nouveaux volumes, immédiatement après une sauvegarde ou à un moment ultérieur.

Les sauvegardes sont cryptées et stockées dans OCI Object Storage, et peuvent être restaurées en tant que nouveaux volumes vers n'importe quel domaine de disponibilité au sein de la même région. Cette fonction fournit une copie de secours d'un volume et permet d'effectuer une récupération après sinistre dans la même région.

Vous pouvez lancer une sauvegarde de deux manières : en lançant manuellement la sauvegarde ou en affectant une stratégie qui définit une programmation de sauvegarde définie. Pour plus d'informations sur les volumes bloqués, reportez-vous à Présentation des sauvegardes de volume de blocs, accessible à partir du sujet Explorer d'autres éléments du livre de jeux. https://docs.oracle.com/en-us/iaas/Content/Block/Concepts/blockvolumebackups.htm

Utiliser la réplication synchrone ou asynchrone

Vous pouvez utiliser la réplication synchrone ou asynchrone pour protéger vos données en cas d'échec de votre instance Compute :

Les domaines de disponibilité d'une région sont interconnectés par un réseau hautes performances qui prend en charge la réplication synchrone. Si votre application a besoin d'un basculement instantané et ne peut pas tolérer la perte de données, utilisez la réplication synchrone. En raison de ses exigences en matière de performances réseau, la réplication synchrone est généralement utilisée dans une région.
Pour les applications qui ont besoin de la protection de la disponibilité des données entre les régions, utilisez la réplication asynchrone.

Les sauvegardes traditionnelles constituent une autre manière de protéger vos données. Pour une durabilité maximale des données, ne stockez pas vos sauvegardes dans le même domaine de disponibilité que leur instance Compute d'origine. Vous devez utiliser Oracle Cloud Infrastructure Object Storage pour sauvegarder les données de votre instance Compute. Pour les instances Compute avec des lecteurs NVMe locaux, une baie RAID protégée constitue le meilleur moyen de se protéger contre la panne d'un périphérique NVMe.

Pour plus d'informations, reportez-vous à la section "Protecting Data on NVMe Devices", à laquelle vous pouvez accéder à partir du sujet Explorer plus ailleurs dans ce livre de jeux.