Résilience

La résilience est la capacité d'une application ou d'une charge de travail à récupérer rapidement des pannes et à maintenir une haute disponibilité. Il s'agit d'un aspect essentiel du cloud computing, car il garantit que les applications et les charges de travail restent accessibles et fonctionnels, même en cas d'événements inattendus. Les informations suivantes décrivent la résilience Oracle Cloud Infrastructure (OCI). Ces informations soulignent l'importance de la résilience dans le cloud computing et les fonctionnalités de résilience fournies par OCI. La résilience doit être une considération clé car elle assure la continuité des activités et minimise le risque de perturbations du service.

Récupération en cas d'échec

OCI fournit un ensemble d'outils et de services conçus pour fournir un haut niveau de résilience et de disponibilité pour les applications et les workloads. L'une des offres est Platform-as-a-Service (PaaS), qui inclut plusieurs mécanismes de récupération suite à des pannes et garantissant un temps d'activité élevé pour les charges de travail.

Par exemple, le service Autonomous AI Database, qui est un service PaaS, offre des fonctionnalités intégrées de tolérance aux pannes et de sauvegarde et de récupération automatiques. En cas de panne, la base de données peut basculer automatiquement vers une base de secours, ce qui réduit les temps d'arrêt et assure la continuité des processus métier critiques.

OCI fournit des fonctionnalités de sauvegarde et de récupération automatisées pour les instances de calcul, ce qui vous permet de restaurer les instances à un état antérieur en cas de panne. Cette fonctionnalité offre la tranquillité d'esprit, sachant que les charges de travail critiques peuvent être restaurées dans un état fonctionnel en cas d'événement inattendu.

Les fonctionnalités de résilience et de disponibilité fournies par OCI, y compris les services PaaS et la sauvegarde et la récupération automatisées, permettent de garantir que les applications et les workloads sont toujours disponibles et performants. Cela vous permet de continuer à exploiter et à fournir des services à vos clients, même en cas d'événements inattendus tels que des pannes matérielles ou d'autres perturbations.

Haute disponibilité

OCI fournit une architecture robuste et hautement disponible, spécialement conçue pour minimiser les temps d'arrêt et garantir que les applications restent accessibles et fonctionnelles même en cas de panne. Cette architecture est réalisée en déployant des ressources sur plusieurs domaines de pannes (FD) et domaines de disponibilité (AD) au sein d'une région. Chaque domaine de pannes (FD) représente un matériel physique différent au sein d'un même domaine de disponibilité. Il assure l'anti-affinité, tandis que chaque domaine de disponibilité est un centre de données indépendant isolé des autres domaines de disponibilité, assurant la redondance et la tolérance de panne. Tous les domaines de disponibilité contiennent trois domaines de pannes,

Par exemple, envisagez une application hautement disponible, telle qu'une application avec deux serveurs Web et une base de données en cluster. Dans ce scénario, le placement idéal pour chaque composant est de regrouper un serveur Web et un noeud de base de données dans un domaine de pannes, et l'autre moitié de chaque paire dans un autre domaine de pannes. Cette stratégie de placement garantit qu'une panne d'un domaine de pannes n'entraîne pas une interruption de l'application, car l'autre moitié de chaque paire de composants continue de fonctionner.

L'architecture hautement disponible fournie par OCI, y compris le déploiement de ressources sur plusieurs domaines de pannes et domaines de disponibilité, en plus des régions couplées pour la récupération après sinistre, garantit que vos applications et vos charges de travail restent disponibles et fonctionnelles, même en cas d'événements inattendus. Cela vous donne l'assurance que vos services resteront accessibles à vos clients, ce qui contribue à maintenir la satisfaction des clients et la continuité des activités. Pour plus d'informations, reportez-vous à Recommandations de la structure d'adoption du cloud et meilleures pratiques en matière de haute disponibilité.

En outre, OCI propose des régions couplées pour la récupération après sinistre, ce qui vous permet de répliquer vos ressources dans deux régions pour une résilience supplémentaire.

Récupération après sinistre

La récupération après sinistre est le processus de restauration des systèmes et de l'infrastructure informatiques après un événement catastrophique. Les régions sont indépendantes les unes des autres et de grandes distances peuvent les séparer (elles peuvent se trouver dans des pays voire des continents différents). En règle générale, vous déployez une application dans la région où elle est la plus utilisée, car l'utilisation de ressources proches est plus rapide que l'utilisation de ressources distantes. Cependant, vous pouvez également déployer des applications dans différentes régions pour atténuer le risque d'événements catastrophiques à l'échelle de la région et répondre à des exigences variables pour les juridictions légales, les domaines fiscaux et d'autres critères commerciaux ou sociaux.

OCI propose plusieurs options de récupération après sinistre, notamment des solutions de secours à chaud, à chaud et à froid. Les solutions de secours à chaud permettent la réplication en temps réel des données et sont idéales pour les charges de travail stratégiques nécessitant un temps d'inactivité quasi nul. Les solutions de secours à chaud répliquent les données à intervalles réguliers et conviennent aux charges de travail pouvant tolérer un certain temps d'inactivité. Les solutions de secours à froid impliquent la restauration manuelle des systèmes à partir de sauvegardes et conviennent aux charges de travail pouvant tolérer un temps d'inactivité important.

OCI prend également en charge plusieurs modèles de récupération après sinistre à haute disponibilité, y compris les architectures active-passive et active-active. Les architectures actives-passives impliquent la réplication des ressources dans un environnement de secours qui est activé en cas de panne. Les architectures actives-actives impliquent la réplication des ressources dans plusieurs régions ou domaines de disponibilité et la distribution du trafic entre elles afin de minimiser les temps d'inactivité.

Architecture de disponibilité maximale

OCI fournit une gamme de modèles de récupération après sinistre hautement efficaces, y compris des architectures active-passive et active-active, pour assurer une continuité transparente et une haute disponibilité des ressources critiques en cas de panne ou de maintenance. Par exemple, dans une architecture active-passive, l'environnement de secours réplique les ressources et ne devient actif que lorsque l'environnement principal tombe en panne. En revanche, une architecture actif-actif implique la réplication des ressources dans plusieurs régions ou domaines de disponibilité pour distribuer le trafic et réduire les temps d'inactivité.

Pour garantir une disponibilité d'application et de base de données de bout en bout à des niveaux optimaux, OCI utilise Chaos Engineering, une discipline qui expérimente un système pour renforcer la confiance dans sa capacité à résister aux conditions turbulentes de production. Maximum Availability Architectures (MAA) tire parti de Chaos Engineering tout au long des cycles de vie de test et de développement, en injectant de manière agressive diverses erreurs et événements de maintenance planifiés pour évaluer l'impact de l'application et de la base de données. Grâce à cette expérience, les meilleures pratiques, les défauts et les leçons apprises sont dérivés et mis en pratique pour évoluer et améliorer les solutions MAA cloud d'OCI.

Automatic Database Backup (ADB) dans OCI est stocké dans OCI Object Storage et répliqué vers un autre domaine de disponibilité, ce qui vous permet de restaurer vos bases de données en cas de sinistre. En outre, pour Oracle Autonomous AI Database on Exadata Cloud@Customer (ADB-C@C), vous pouvez choisir de sauvegarder vers NFS ou Zero Data Loss Recovery Appliance (ZDLRA). Toutefois, vous êtes responsable de la configuration et de la gestion de la réplication de ces sauvegardes.

Les modèles de récupération après sinistre HA avancés d'OCI, l'ingénierie du chaos et les sauvegardes automatiques de base de données avec réplication vers plusieurs domaines de disponibilité vous offrent une protection complète contre les pertes de données potentielles ou les pannes système, garantissant une disponibilité et une continuité maximales des ressources critiques.

Temps moyen de restauration

Le temps moyen de restauration (MTTR) est une mesure critique qui mesure le temps moyen nécessaire à la restauration d'un service ou d'un système après une panne. Un MTTR prolongé peut causer des dommages financiers et de réputation importants aux entreprises, entraînant une perte de revenus, une diminution de la satisfaction des clients et même des amendes réglementaires.

OCI fournit plusieurs outils et services, tels que Terraform et Ansible, pour réduire le MTTR et assurer une disponibilité maximale des services. Par exemple, des sauvegardes et des processus de récupération automatisés sont disponibles pour récupérer rapidement les données et les applications en cas de panne ou de sinistre. En outre, la réplication en temps réel des données dans plusieurs domaines de disponibilité permet une restauration rapide des services, ce qui réduit les temps d'arrêt et l'impact des pannes.

Il est essentiel de mesurer continuellement le MTTR pour comprendre le temps nécessaire à la restauration des services dans des conditions défavorables. Cette évaluation est essentielle pour identifier les domaines à améliorer et réduire le MTTR au fil du temps, assurer une disponibilité optimale du service et réduire le risque de dommages causés par des temps d'arrêt prolongés.

Intégration continue et déploiement continu

L'intégration continue et le déploiement continu (CI/CD) sont des pratiques importantes de DevOps qui vous aident à rationaliser votre processus de développement logiciel, à augmenter votre productivité et à réduire les erreurs. Ces pratiques impliquent l'automatisation du processus de création, de test et de déploiement de logiciels, ce qui vous permet de publier du code plus fréquemment, avec une qualité et une cohérence améliorées.

OCI prend en charge ces meilleures pratiques grâce à l'intégration à des outils d'intégration continue et de déploiement continu populaires, tels que Jenkins, GitLab et GitHub. Ces outils fournissent un pipeline efficace et automatisé pour le développement et le déploiement de logiciels, des modifications de code aux tests et au déploiement. En intégrant ces outils dans OCI, vous pouvez tirer parti de l'évolutivité et de la flexibilité du cloud pour accélérer le processus de développement et améliorer la productivité globale.

Par exemple, en exploitant Jenkins sur OCI, vous pouvez automatiser les processus de création et de déploiement, afin de vous assurer que le code est testé minutieusement et déployé rapidement dans les environnements de production. De même, l'utilisation de GitLab dans OCI peut permettre une collaboration transparente entre les équipes, facilitant ainsi le partage de code et le suivi efficaces des modifications. En outre, l'intégration de GitHub à OCI fournit une plate-forme permettant de gérer les référentiels de code, d'activer le contrôle des versions et de faciliter les révisions de code.

Le service OCI DevOps est un service cloud entièrement géré conçu pour prendre en charge les workflows d'intégration continue et de déploiement continu pour les développeurs. Avec cette plate-forme, les ingénieurs DevOps peuvent créer, tester et déployer facilement des logiciels et des applications dans Oracle Cloud, fournissant ainsi une solution de bout en bout qui rationalise le processus de développement.

Le service permet de créer des pipelines de build et de déploiement DevOps qui réduisent les erreurs associées aux modifications et réduisent le temps nécessaire à la création et au déploiement de versions, améliorant ainsi la qualité et la cohérence globales du code. En outre, le service propose des référentiels Git privés pour un stockage de code sécurisé et prend en charge les connexions à des référentiels de code externes, ce qui permet une collaboration rationalisée avec des équipes externes.

En tant que service cloud entièrement géré, le service DevOps d'OCI fournit une mise à l'échelle et une maintenance automatisées, vous permettant de vous concentrer sur le code sans vous soucier de la gestion de l'infrastructure. Cela garantit que la plate-forme est toujours à jour et disponible pour prendre en charge le processus de développement, ce qui en fait une solution idéale lorsque vous souhaitez rationaliser les workflows DevOps et réaliser des cycles de versions plus rapides avec un code de meilleure qualité.

DevOps, SecOps, DevSecOps, IaC

DevOps, SecOps et DevSecOps sont des méthodologies critiques qui vous permettent de répondre aux exigences du développement de logiciels modernes en mettant l'accent sur la collaboration, l'automatisation et la sécurité. L'infrastructure en tant que code (IaC) joue un rôle important dans le provisionnement et la configuration de l'infrastructure pour le déploiement automatisé.

DevOps : essentiel car il favorise la collaboration entre les équipes de développement et d'exploitation, en veillant à ce que les logiciels soient livrés plus rapidement, avec une meilleure qualité et une plus grande fiabilité. Cette méthodologie met l'accent sur l'importance de l'automatisation, permettant aux équipes de créer, tester et déployer du code plus efficacement, réduisant ainsi le délai de mise sur le marché. Dans OCI, vous pouvez utiliser les pratiques DevOps à l'aide d'outils tels que Jenkins, GitLab et GitHub pour automatiser le processus de développement logiciel.
SecOps : important car il intègre la sécurité dans le processus de développement pour s'assurer que les vulnérabilités de sécurité sont identifiées et traitées dès le début, réduisant ainsi le risque de violations et assurant la protection des données sensibles. En soulignant l'importance de la sécurité, cette méthodologie garantit que vous pouvez créer et déployer des applications logicielles sécurisées. Dans OCI, vous pouvez utiliser des intégrations avec des outils de sécurité tiers tels que Check Point et Fortinet pour fournir une détection et une protection avancées des menaces.
DevSecOps : combinaison de ces deux méthodologies, avec une sécurité intégrée au processus DevOps dès le début. Cette approche garantit que les applications sont sécurisées, fiables et répondent aux exigences de conformité. En mettant l'accent sur la sécurité dès le départ, vous pouvez créer et déployer des applications sécurisées plus rapidement, avec une meilleure qualité et une plus grande fiabilité. Dans OCI, vous pouvez utiliser des fonctionnalités de sécurité intégrées telles que les zones de sécurité pour isoler les workloads et contrôler le trafic réseau afin d'améliorer la sécurité et la résilience.
IaC : pratique importante qui implique l'écriture de code pour automatiser le déploiement et la gestion de l'infrastructure. Cette méthodologie garantit la cohérence et la fiabilité des déploiements d'infrastructure, réduisant le risque d'erreurs et améliorant la résilience. Dans OCI, vous pouvez utiliser des outils tels que Terraform et Ansible pour automatiser le provisionnement et la configuration des ressources d'infrastructure.

Tout automatiser

L'automatisation est un aspect crucial de la création et du maintien d'une infrastructure cloud résiliente. L'automatisation des processus et des tâches permet de réduire les erreurs et d'accroître l'efficacité. Il est essentiel de créer une culture qui donne la priorité à l'automatisation et à la résilience pour maintenir la haute disponibilité dans le cloud. Pour ce faire, vous pouvez utiliser des outils et services tels que Terraform, Ansible et Jenkins, qui fournissent des fonctionnalités d'automatisation pour le déploiement, la configuration et la gestion de l'infrastructure.

Par exemple, OCI fournit toute une gamme d'outils d'automatisation, y compris Resource Manager, qui vous permet d'automatiser la création, la configuration et le déploiement de ressources cloud à l'aide d'API natives Terraform ou Oracle Cloud Infrastructure. En outre, l'utilisation de l'automatisation pour effectuer des tâches de routine telles que les sauvegardes et les mises à jour peut réduire considérablement le risque d'erreurs et augmenter la résilience globale de votre infrastructure cloud.

Exigences non fonctionnelles - SLI, SLO et SLA

Les exigences non fonctionnelles, telles que les performances, l'évolutivité et la disponibilité, jouent un rôle crucial pour garantir que les applications et les charges de travail répondent aux besoins de l'entreprise. Pour ce faire, il est important de disposer de mesures qui mesurent les performances et la disponibilité des services et des ressources. Les indicateurs de niveau de service (SLI), les objectifs de niveau de service (SLO) et les contrats de niveau de service (SLA) sont des mesures qui vous aident à mesurer l'efficacité de votre infrastructure cloud.

OCI fournit une gamme d'outils et de services qui vous permettent de surveiller et de gérer ces mesures, notamment Cloud Monitoring, Logging et Notifications. Cloud Monitoring vous permet de collecter, d'analyser et d'alerter sur les mesures et les journaux des ressources et services OCI. Il fournit une vue unifiée de l'état et des performances de votre infrastructure, vous permettant d'identifier et de résoudre rapidement les problèmes susceptibles d'avoir un impact sur vos SLI, SLO et SLA. Logging vous permet de capturer et d'analyser les données des journaux à partir de différentes sources, notamment les services OCI, les applications et les composants d'infrastructure. Notifications vous permet de recevoir des alertes et des notifications lorsque les conditions prédéfinies sont remplies, ce qui vous permet d'agir avant que les problèmes n'affectent vos contrats de niveau de service, vos objectifs de niveau de service et vos contrats de niveau de service.

En tirant parti de ces outils et services, vous pouvez gagner en visibilité sur votre infrastructure cloud, et surveiller et gérer de manière proactive les SLI, les SLO et les SLA. Cela permet de s'assurer que vos applications et charges de travail répondent aux besoins de l'entreprise et leur permet de répondre rapidement à tous les problèmes qui surviennent, réduisant ainsi les temps d'arrêt et améliorant la résilience globale.

Par exemple, vous pouvez utiliser Cloud Monitoring pour surveiller le temps de réponse et la disponibilité d'une application Web hébergée dans OCI, tout en utilisant Logging pour suivre les erreurs et diagnostiquer les problèmes de performances. Les notifications peuvent être utilisées pour alerter les administrateurs lorsque des interruptions de service ou des problèmes de performances surviennent, ce qui leur permet de prendre des mesures avant que le problème ne devienne grave.

Domaine de pannes et de disponibilité

Les domaines de pannes et les domaines de disponibilité sont des concepts importants du cloud computing qui améliorent la résilience et réduisent l'impact des pannes potentielles. En cas de panne dans une zone particulière, les domaines de pannes peuvent être utilisés pour garantir que les ressources critiques ne sont pas affectées, ce qui réduit l'impact global sur le système. Les domaines de disponibilité assurent l'isolement entre les centres de données afin de garantir la redondance et la tolérance aux pannes. Ainsi, si une panne se produit dans un domaine de disponibilité, la charge globale peut basculer vers un autre domaine de disponibilité, ce qui garantit que les services restent disponibles, même en cas de panne.

OCI exploite les domaines de pannes et de disponibilité pour vous fournir une haute disponibilité. Par exemple, dans OCI, chaque région est composée de trois domaines de disponibilité, qui sont physiquement isolés les uns des autres et fournissent des domaines de défaillance indépendants. OCI utilise des domaines de pannes pour s'assurer que les instances d'un domaine de disponibilité donné sont réparties dans plusieurs domaines de pannes, ce qui garantit une haute disponibilité et une protection contre les pannes.

Régions multiples

Les régions d'OCI sont un élément essentiel pour assurer la résilience et la continuité en cas de sinistre. Les régions sont deux régions géographiquement séparées qui assurent la redondance et la tolérance aux pannes. En cas d'événement catastrophique tel qu'une catastrophe naturelle, une cyberattaque ou une erreur humaine, les régions associées garantissent que les ressources critiques sont répliquées et disponibles dans une autre région. Cela réduit le risque de temps d'arrêt et de perte de données, offrant une tranquillité d'esprit aux entreprises et à vos clients.

Par exemple, si une entreprise opère aux États-Unis et qu'il y a un événement catastrophique tel qu'une catastrophe naturelle, des troubles politiques ou une panne d'électricité dans une région, l'autre région peut prendre en charge et assurer la continuité des activités. Si la région principale est Est des Etats-Unis (Ashburn) et subit une panne, la région secondaire Ouest des Etats-Unis (Phoenix) peut prendre le relais et fournir les services nécessaires jusqu'à ce que la région principale soit de nouveau en ligne. Cette approche garantit que l'expérience utilisateur n'est pas perturbée et que les données sont disponibles tout au long de la panne. La réplication active-active ou active-passive des ressources d'OCI dans les régions associées garantit que les données sont disponibles en permanence, ce qui permet de basculer vers la région de sauvegarde sans interruption.

Les régions multiples offrent aux entreprises la possibilité de mettre en œuvre un plan de reprise après sinistre efficace, garantissant la protection des données et la disponibilité permanente des services.

Data Guard et GoldenGate

Data Guard est une fonctionnalité d'Oracle Database qui fournit une récupération après sinistre et une haute disponibilité pour les bases de données d'entreprise. Elle permet la création d'une base de données de secours qui peut prendre le relais en cas d'échec de la base de données principale. La base de données de secours est synchronisée en permanence avec la base principale, ce qui garantit que les données sont toujours à jour. Cela fournit une couche supplémentaire de résilience pour les systèmes et applications critiques.

GoldenGate est un outil d'intégration et de réplication de données qui permet l'intégration de données en temps réel entre différentes bases de données. Il prend en charge l'intégration de données hétérogènes, ce qui signifie qu'il peut répliquer des données entre différents fournisseurs de bases de données et au sein d'un seul fournisseur. GoldenGate peut également être utilisé pour la migration de base de données, l'entreposage de données et la business intelligence.

OCI fournit différentes versions de Data Guard et de GoldenGate pour répondre à différents besoins et cas d'utilisation. Par exemple, Data Guard Standard Edition fournit des fonctionnalités de base de récupération après sinistre, tandis que Data Guard Enterprise Edition fournit des fonctionnalités plus avancées telles que le basculement automatique et la protection des données. GoldenGate Standard Edition assure la réplication des données en temps réel entre les bases de données, tandis que GoldenGate Enterprise Edition inclut des fonctionnalités supplémentaires telles que la détection et la résolution des conflits.

En utilisant ces technologies conjointement avec OCI, vous pouvez améliorer la résilience de votre système en veillant à ce que les données critiques soient toujours disponibles et à jour, même en cas de sinistre ou de défaillance du système. Par exemple, une entreprise de services financiers peut utiliser Data Guard pour répliquer une base de données de production vers une base de données de secours dans une autre région, telle que les régions Nord et Sud des Etats-Unis dans OCI, afin de garantir qu'elle peut rapidement se remettre d'un événement catastrophique et continuer à servir ses clients sans interruption.

Réplication de date

La réplication des données est un aspect essentiel de la résilience dans le cloud computing, car elle garantit la disponibilité des données même en cas de panne. La réplication implique la création de copies des données et leur stockage dans plusieurs emplacements, qui peuvent être utilisés pour effectuer une récupération suite à une panne ou un sinistre.

OCI fournit plusieurs options de stockage pour la réplication des données. Object Storage est un service de stockage hautement évolutif et durable qui permet la réplication des données dans plusieurs régions. En configurant la réplication inter-région, les données sont automatiquement répliquées vers une autre région, ce qui offre un haut niveau de résilience. En cas de sinistre ou de panne, les données sont facilement accessibles à partir de l'emplacement répliqué, ce qui garantit la continuité des activités.

File Storage fournit des systèmes de fichiers durables et hautement disponibles auxquels plusieurs instances peuvent accéder simultanément. Grâce aux stratégies de réplication, les fichiers sont automatiquement répliqués vers un autre domaine de disponibilité, ce qui assure une tolérance aux pannes et une haute disponibilité.

Block Volume est un service de stockage de blocs durable et hautement disponible qui fournit une fonctionnalité de réplication. La configuration de la réplication de volume de blocs permet de répliquer automatiquement les données vers un autre volume de blocs dans un autre domaine de disponibilité de la même région. Cela garantit que les données sont disponibles même en cas de panne ou de panne.

La réplication des données est essentielle pour maintenir la résilience dans le cloud computing. OCI fournit plusieurs options pour répliquer les données entre les régions, les domaines de disponibilité et les instances. Grâce à ces options, vous pouvez garantir la haute disponibilité, la durabilité et la facilité de récupération de vos données en cas de panne ou de sinistre.

Calculer la fiabilité globale

La fiabilité est essentielle à prendre en compte lors du déploiement d'une application ou d'une charge de travail dans le cloud. La mesure de la probabilité et de l'impact des défaillances est essentielle pour assurer le bon fonctionnement des opérations commerciales. OCI fournit une gamme d'outils et de services qui vous aident à calculer la fiabilité et le coût globaux de votre infrastructure cloud. Par exemple, Cloud Advisor vous aide à identifier les problèmes potentiels liés à votre architecture et fournit des recommandations pour améliorer la fiabilité, tandis que Cost Estimator vous aide à estimer le coût de l'implémentation de votre infrastructure cloud. Grâce à ces outils et services, vous pouvez vous assurer que vos applications et charges de travail sont déployées de manière fiable et rentable.

Planification de l'application de patches et de la mise à niveau

Il est important de maintenir les applications et l'infrastructure à jour pour maintenir une sécurité et des performances optimales dans le cloud. Le fait de ne pas appliquer les correctifs et mises à niveau nécessaires peut rendre les systèmes vulnérables aux attaques et entraîner des problèmes de performances qui perturbent les opérations commerciales. OCI fournit une gamme d'outils et de services permettant de rationaliser et d'automatiser le processus d'application de correctifs et de mise à niveau.

Les services Patching Automation et Upgrade Advisor fournis par OCI sont conçus pour faciliter la planification et l'exécution du processus d'application de patches et de mise à niveau. En outre, OS Management Service (OSMS) vous permet d'automatiser l'application de patches aux instances Oracle Linux ou Windows. Avec OSMS, vous pouvez organiser vos systèmes en groupes et planifier des travaux pour appliquer les dernières mises à jour à tous les systèmes. Ce service fournit l'accès à un large éventail de sources logicielles prédéfinies, fournissant la gamme complète de référentiels Oracle yum aux systèmes Linux. En conséquence, les systèmes peuvent être constamment mis à jour avec les derniers correctifs, améliorant ainsi la sécurité et les performances.

Plan de continuité des activités

Un plan de continuité des activités solide est essentiel pour que toute organisation puisse continuer à fonctionner même en cas d'événements perturbateurs. Il peut s'agir de catastrophes naturelles, de coupures de courant ou de cyberattaques.

OCI fournit une gamme d'outils et de services pour prendre en charge ce type de planification. Par exemple, le service VPN site à site vous permet de créer une connexion cryptée et sécurisée entre votre réseau sur site et votre réseau cloud virtuel OCI (VCN), ce qui vous permet d'étendre votre centre de données au cloud. De même, le service FastConnect fournit une connexion privée à bande passante élevée entre votre infrastructure sur site et vos ressources OCI, ce qui vous permet de répliquer des données et d'exécuter des applications critiques dans le cloud.

Utilisation d'une architecture faiblement couplée

L'architecture faiblement couplée est un élément crucial dans la construction de systèmes résilients, car elle permet de minimiser l'impact des pannes en réduisant les dépendances entre les composants. En réduisant les dépendances, chaque composant peut être mis à l'échelle et évolué indépendamment, ce qui rend le système plus flexible et adaptable aux changements. OCI fournit des outils et des services qui prennent en charge cette architecture, tels qu'Oracle Functions, qui permet aux développeurs de créer et de déployer des applications sans serveur qui peuvent évoluer automatiquement en fonction de la demande de workloads, sans être étroitement couplées à d'autres composants. Un autre exemple est Oracle Kubernetes Engine (OKE), qui fournit une plate-forme hautement évolutive et flexible pour l'exécution d'applications en conteneur. OKE utilise une architecture basée sur les microservices qui vous permet de créer et de déployer des applications modulaires et faiblement couplées qui peuvent être facilement mises à l'échelle et gérées.

Surveiller et adapter les modèles inhabituels

Pour assurer la résilience de votre système, il est important de surveiller et de s'adapter à des modèles inhabituels d'utilisation des ressources, de trafic et de comportement. Ces modèles peuvent aider à identifier les problèmes potentiels avant qu'ils ne deviennent critiques et influent sur les performances et la disponibilité de votre système. OCI fournit des outils et des services tels que Cloud Guard et Security Zones qui fournissent une surveillance et une analyse continues de l'utilisation des ressources, du trafic réseau et du comportement des utilisateurs. Cloud Guard automatise la surveillance de vos ressources et aide à détecter les menaces de sécurité et les erreurs de configuration dans votre environnement cloud. En outre, Security Zones fournit un environnement sécurisé pour les charges de travail et les ressources qui nécessitent des niveaux de sécurité plus élevés.

Choisir parmi SaaS, PaaS et IaaS

La sélection du modèle de service cloud approprié est cruciale car elle détermine le niveau de contrôle, de flexibilité et de gestion requis pour vos applications et charges de travail. Les modèles de service cloud tels que Software as a Service (SaaS), Platform as a Service (PaaS) et Infrastructure as a Service (IaaS) présentent des avantages et des inconvénients distincts. SaaS fournit une solution entièrement gérée qui peut être déployée facilement et nécessite peu de maintenance, tandis que PaaS fournit une plate-forme de développement avec plus d'options de contrôle et de personnalisation. IaaS offre un contrôle total sur l'infrastructure, mais nécessite davantage de gestion et de maintenance. Le choix du modèle de service adapté à votre entreprise est essentiel pour optimiser les performances, réduire les coûts et maintenir des niveaux élevés de résilience.

Anticiper l'échec

L'atténuation de l'impact des pannes potentielles est essentielle pour assurer la résilience de votre infrastructure cloud. OCI fournit une variété d'outils et de services qui vous permettent d'anticiper les points de défaillance potentiels et de planifier votre atténuation. Par exemple, les domaines de pannes et de disponibilité sont des concepts utilisés dans le cloud computing pour augmenter la résilience et réduire l'impact des pannes. En regroupant les ressources et en les répartissant entre différents domaines de pannes et domaines de disponibilité, vous pouvez réduire le risque d'un point d'échec unique. En outre, les zones de sécurité dans OCI vous permettent d'isoler les workloads et de réduire l'impact des incidents ou des échecs de sécurité.

Coût et fiabilité

Pour garantir la rentabilité tout en maintenant la fiabilité, il est essentiel d'équilibrer le coût et les performances de votre infrastructure cloud. OCI fournit divers outils et services, tels que l'estimateur de coût et la gestion des coûts, qui vous aident à surveiller et à optimiser vos dépenses cloud. L'estimateur de coûts vous aide à estimer les coûts de votre déploiement d'infrastructure et à identifier les économies potentielles. Le service Cost Management fournit une plate-forme centralisée pour la surveillance et la gestion de vos dépenses cloud dans différents services et régions. Avec ce service, vous pouvez définir des budgets, suivre l'utilisation et identifier les domaines dans lesquels vous pouvez réduire les coûts sans affecter la fiabilité de votre infrastructure.

Plan pour les grands événements

Assurer une haute disponibilité et éviter les perturbations lors de grands événements, tels que les pics saisonniers du trafic ou les fenêtres de maintenance planifiées, nécessite une planification minutieuse. OCI fournit divers outils et services tels que le redimensionnement automatique et le redimensionnement programmé qui vous aident à planifier et à ajuster vos ressources en conséquence. Le redimensionnement automatique ajuste automatiquement la capacité de vos ressources en fonction du trafic en temps réel, pour garantir la disponibilité de votre application pour les utilisateurs. La mise à l'échelle programmée vous permet de planifier et d'ajuster les ressources à l'avance pour des modèles de trafic prévisibles, réduisant ainsi le risque de surprovisionnement et les coûts inutiles. Ces outils vous aident à gérer efficacement vos ressources cloud, en garantissant une haute disponibilité et des performances optimales lors des grands événements.

Documentation Oracle Cloud Infrastructure