Résilience

La résilience est la capacité d'une application ou d'une charge de travail à se remettre rapidement des pannes et à maintenir une haute disponibilité. Il s'agit d'un aspect critique de l'infonuagique, car il garantit que les applications et les charges de travail restent accessibles et fonctionnelles, même en cas d'événements inattendus. Les informations suivantes décrivent la résilience d'Oracle Cloud Infrastructure (OCI). Ces informations mettent en évidence l'importance de la résilience dans l'infonuagique et les fonctions de résilience fournies par OCI. La résilience devrait être une considération clé, car elle assure la continuité des activités et minimise les risques d'interruption de service.

Restaurer après l'échec

OCI fournit un jeu d'outils et de services conçus pour offrir un haut niveau de résilience et de disponibilité pour les applications et les charges de travail. Une offre est la plate-forme-service (PaaS), qui inclut plusieurs mécanismes pour effectuer une récupération en cas de défaillance et garantir un temps de disponibilité élevé pour les charges de travail.

Par exemple, le service Autonomous AI Database, qui est un service PaaS, offre une tolérance intégrée aux pannes ainsi que des capacités de sauvegarde et de récupération automatiques. En cas de panne, la base de données peut basculer automatiquement vers une base de secours, ce qui réduit les temps d'arrêt et assure la continuité des processus métier critiques.

OCI fournit des fonctions de sauvegarde et de récupération automatisées pour les instances de calcul, ce qui vous permet de restaurer les instances à un état précédent en cas de défaillance. Cette fonctionnalité offre une tranquillité d'esprit, sachant que les charges de travail critiques peuvent être restaurées à un état fonctionnel en cas d'événement inattendu.

Les fonctions de résilience et de disponibilité fournies par OCI, notamment les services PaaS et la sauvegarde et la récupération automatisées, aident à garantir que les applications et les charges de travail sont toujours disponibles et performantes. Cela vous permet de continuer à exploiter et à fournir des services à vos clients, même en cas d'événements inattendus tels que des pannes matérielles ou d'autres interruptions.

Haute disponibilité

OCI fournit une architecture robuste et hautement disponible, spécialement conçue pour minimiser les temps d'arrêt et garantir que les applications restent accessibles et fonctionnelles même en cas de défaillance. Cette architecture est obtenue en déployant des ressources sur plusieurs domaines d'erreur (FD) et domaines de disponibilité (AD) dans une région. Chaque domaine d'erreur représente du matériel physique différent au sein d'un seul domaine de disponibilité, sans affinité. Chaque domaine de disponibilité est un centre de données indépendant, isolé des autres domaines de disponibilité, assurant la redondance et la tolérance aux pannes. Chaque domaine de disponibilité contient trois domaines d'erreur.

Par exemple, envisagez une application hautement disponible, telle qu'une avec deux serveurs Web et une base de données clusterisée. Dans ce scénario, le positionnement idéal pour chaque composant est de regrouper un serveur Web et un noeud de base de données dans un domaine d'erreur, et l'autre moitié de chaque paire dans un autre domaine d'erreur. Cette stratégie de positionnement garantit qu'une défaillance d'un domaine d'erreur ne provoque pas d'interruption pour votre application, car l'autre moitié de chaque paire de composants continue de fonctionner.

L'architecture hautement disponible fournie par OCI, y compris le déploiement de ressources sur plusieurs domaines d'erreur et domaines de disponibilité, en plus des régions appariées pour la reprise après sinistre, assure que vos applications et charges de travail restent disponibles et fonctionnelles, même en cas d'événements inattendus. Cela vous donne l'assurance que vos services resteront accessibles à vos clients, ce qui contribuera à maintenir la satisfaction de la clientèle et la continuité des activités. Pour plus d'informations, voir Recommandations du cadre d'adoption de l'environnement en nuage et meilleures pratiques en matière de haute disponibilité.

En outre, OCI offre des régions appariées pour la récupération après sinistre, ce qui vous permet de répliquer vos ressources dans deux régions pour une résilience supplémentaire.

Récupération après sinistre

La reprise après sinistre est le processus de restauration des systèmes et de l'infrastructure des TI après un événement catastrophique. Les régions sont indépendantes les unes des autres et peuvent être séparées par des distances importantes, dans différents pays ou continents. En règle générale, vous déployez une application dans la région où elle est la plus utilisée, car l'utilisation de ressources proches est plus rapide que l'utilisation de ressources lointaines. Cependant, vous pouvez également déployer des applications dans différentes régions pour atténuer le risque d'événements catastrophiques à l'échelle de la région et répondre à différentes exigences pour les juridictions légales, les domaines fiscaux et d'autres critères commerciaux ou sociaux.

OCI offre plusieurs options de récupération après sinistre, notamment des solutions de secours à chaud, à chaud et à froid. Les solutions de secours à chaud fournissent une réplication des données en temps réel et sont idéales pour les charges de travail critiques qui nécessitent un temps d'arrêt quasi nul. Les solutions de secours à chaud répliquent les données à intervalles réguliers et conviennent aux charges de travail pouvant tolérer un temps d'arrêt. Les solutions de secours à froid impliquent la restauration manuelle des systèmes à partir de sauvegardes et conviennent aux charges de travail pouvant tolérer un temps d'arrêt important.

OCI prend également en charge plusieurs modèles de reprise après sinistre haute disponibilité, notamment les architectures active-passive et active-active. Les architectures Active-Passive impliquent la réplication des ressources dans un environnement de secours activé en cas de panne. Les architectures actives-actives impliquent la réplication des ressources dans plusieurs régions ou domaines de disponibilité, et la répartition du trafic entre eux afin de réduire le temps d'arrêt.

Architecture de disponibilité maximale

OCI fournit une gamme de modèles de reprise après sinistre haute disponibilité hautement efficaces, y compris des architectures active-passive et active-active, pour assurer une continuité transparente et une haute disponibilité des ressources critiques en cas de défaillance ou de maintenance. Par exemple, dans une architecture active-passive, l'environnement de secours réplique les ressources et ne devient actif que lorsque l'environnement principal tombe en panne. En revanche, une architecture active-active implique la réplication des ressources dans plusieurs régions ou domaines de disponibilité pour répartir le trafic et réduire les temps d'arrêt.

Pour garantir une disponibilité optimale des applications et des bases de données de bout en bout, OCI utilise Chaos Engineering, une discipline qui expérimente un système pour renforcer la confiance dans sa capacité à résister à des conditions de production turbulentes. Les architectures de disponibilité maximale (MAA) tirent parti de Chaos Engineering tout au long des cycles de vie de test et de développement, injectant de manière agressive diverses défaillances et événements de maintenance planifiés pour évaluer l'impact de l'application et de la base de données. Grâce à cette expérimentation, les meilleures pratiques, les défauts et les leçons apprises sont dérivés et mis en pratique pour évoluer et améliorer les solutions MAA en nuage d'OCI.

La sauvegarde automatique de base de données (ADB) dans OCI est stockée dans le stockage d'objets OCI et répliquée vers un autre domaine de disponibilité, ce qui vous permet de restaurer vos bases de données en cas de sinistre. De plus, pour Oracle Autonomous AI Database on Exadata Cloud@Customer (ADB-C@C), vous pouvez choisir de sauvegarder sur NFS ou Zero Data Loss Recovery Appliance (ZDLRA); toutefois, vous êtes responsable de la configuration et de la gestion de la réplication de ces sauvegardes.

Les modèles avancés de reprise après sinistre haute disponibilité d'OCI, l'ingénierie du chaos et les sauvegardes automatiques de base de données avec réplication vers plusieurs domaines de disponibilité vous offrent une protection complète contre les pertes de données potentielles ou les pannes de système, ce qui assure une disponibilité et une continuité maximales des ressources critiques.

Temps moyen de restauration

Le temps moyen de restauration (MTTR) est une mesure critique qui mesure le temps moyen nécessaire à la restauration d'un service ou d'un système après une panne. Un MTTR prolongé peut causer d'importants dommages financiers et de réputation aux entreprises, entraînant une perte de revenus, une diminution de la satisfaction des clients et même des amendes réglementaires.

OCI fournit plusieurs outils et services, tels que Terraform et Ansible, pour réduire le temps moyen de réparation moyen et assurer une disponibilité maximale des services. Par exemple, des sauvegardes et des processus de récupération automatisés sont disponibles pour récupérer rapidement les données et les applications en cas de panne ou de sinistre. En outre, la réplication en temps réel des données dans plusieurs domaines de disponibilité permet la restauration rapide des services, réduisant ainsi les temps d'arrêt et réduisant l'incidence des défaillances.

Il est essentiel de mesurer continuellement le MTTR pour comprendre le temps nécessaire à la restauration des services dans des conditions défavorables. Cette évaluation est essentielle pour identifier les domaines à améliorer et réduire le MTTR au fil du temps, en assurant une disponibilité de service optimale et en réduisant le risque de dommages causés par des temps d'arrêt prolongés.

Intégration continue et déploiement continu

L'intégration et le déploiement continus (CI/CD) sont des pratiques DevOps importantes qui vous aident à simplifier vos processus de développement de logiciels, à augmenter la productivité et à réduire les erreurs. Ces pratiques impliquent l'automatisation du processus de création, de test et de déploiement de logiciels, ce qui vous permet de publier du code plus fréquemment, avec une qualité et une cohérence améliorées.

OCI prend en charge ces meilleures pratiques grâce à l'intégration aux outils d'intégration et de développement en continu populaires, tels que Jenkins, GitLab et GitHub. Ces outils fournissent un pipeline automatisé efficace pour le développement et le déploiement de logiciels, des modifications de code aux tests et au déploiement. En intégrant ces outils à OCI, vous pouvez tirer parti de l'évolutivité et de la flexibilité du nuage pour accélérer le processus de développement et améliorer la productivité globale.

Par exemple, en tirant parti de Jenkins sur OCI, vous pouvez automatiser les processus de création et de déploiement, ce qui garantit que le code est testé de manière approfondie et déployé rapidement dans les environnements de production. De même, l'utilisation de GitLab dans OCI peut permettre une collaboration transparente entre les équipes, ce qui facilite le partage efficace du code et le suivi des modifications. En outre, l'intégration de GitHub à OCI fournit une plate-forme vous permettant de gérer les référentiels de code, d'activer le contrôle des versions et de faciliter la révision de code.

Le service OCI DevOps est un service en nuage entièrement géré conçu pour prendre en charge les flux de travail d'intégration et de développement en continu pour les développeurs. Grâce à cette plate-forme, les ingénieurs de DevOps peuvent créer, tester et déployer facilement des logiciels et des applications dans Oracle Cloud, en fournissant une solution de bout en bout qui simplifie le processus de développement.

Le service permet de créer des pipelines de compilation et de déploiement DevOps qui réduisent les erreurs associées aux modifications et réduisent le temps requis pour créer et déployer des versions, améliorant ainsi la qualité globale et la cohérence du code. En outre, le service offre des référentiels Git privés pour le stockage de code sécurisé et prend en charge les connexions aux référentiels de code externes, ce qui permet une collaboration simplifiée avec les équipes externes.

En tant que service en nuage entièrement géré, le service DevOps d'OCI offre une mise à l'échelle et une maintenance automatisées, vous permettant de vous concentrer sur le code sans vous soucier de la gestion de l'infrastructure. Cela garantit que la plate-forme est toujours à jour et disponible pour soutenir le processus de développement, ce qui en fait une solution idéale lorsque vous souhaitez rationaliser les flux de travail DevOps et atteindre des cycles de lancement plus rapides avec un code de qualité supérieure.

DevOps, SecOps, DevSecOps, IaC

DevOps, SecOps et DevSecOps sont des méthodologies critiques qui vous permettent de répondre aux exigences du développement de logiciels modernes en mettant l'accent sur la collaboration, l'automatisation et la sécurité. L'infrastructure en tant que code (IaC) joue un rôle important pour provisionner et configurer l'infrastructure pour un déploiement automatisé.

DevOps : Essentielle, car elle favorise la collaboration entre les équipes de développement et d'exploitation, assurant que les logiciels sont livrés plus rapidement, avec une meilleure qualité et plus de fiabilité. Cette méthodologie souligne l'importance de l'automatisation, permettant aux équipes de créer, tester et déployer du code plus efficacement, réduisant ainsi le temps de mise sur le marché. Dans OCI, vous pouvez utiliser les exercices DevOps à l'aide d'outils tels que Jenkins, GitLab et GitHub pour automatiser le processus de développement de logiciels.
SecOps : Important car il intègre la sécurité dans le processus de développement pour garantir que les vulnérabilités de sécurité sont identifiées et résolues rapidement, réduisant ainsi le risque de violations et assurant la protection des données sensibles. En mettant l'accent sur l'importance de la sécurité, cette méthodologie garantit que vous pouvez créer et déployer des applications logicielles sécurisées. Dans OCI, vous pouvez utiliser des intégrations à des outils de sécurité tiers tels que Check Point et Fortinet pour fournir une détection et une protection avancées des menaces.
DevSecOps : Combinaison de ces deux méthodologies, avec la sécurité intégrée au processus DevOps dès le début. Cette approche garantit que les applications sont sécurisées, fiables et répondent aux exigences de conformité. En mettant l'accent sur la sécurité dès le départ, vous pouvez créer et déployer des applications sécurisées plus rapidement, avec une meilleure qualité et plus de fiabilité. Dans OCI, vous pouvez utiliser des fonctions de sécurité intégrées, telles que des zones de sécurité, pour isoler les charges de travail et contrôler le trafic réseau afin d'améliorer la sécurité et la résilience.
IaC : Pratique importante qui consiste à écrire du code pour automatiser le déploiement et la gestion de l'infrastructure. Cette méthodologie assure la cohérence et la fiabilité des déploiements d'infrastructure, réduisant le risque d'erreurs et améliorant la résilience. Dans OCI, vous pouvez utiliser des outils tels que Terraform et Ansible pour automatiser le provisionnement et la configuration des ressources d'infrastructure.

Automatiser tout

L'automatisation est un aspect crucial de la création et de la maintenance d'une infrastructure infonuagique résiliente. En automatisant les processus et les tâches, les erreurs peuvent être réduites et l'efficacité peut être augmentée. Il est essentiel de bâtir une culture qui donne la priorité à l'automatisation et à la résilience pour maintenir une haute disponibilité dans le nuage. Pour ce faire, vous pouvez utiliser des outils et des services tels que Terraform, Ansible et Jenkins, qui fournissent des fonctions d'automatisation pour le déploiement, la configuration et la gestion de l'infrastructure.

Par exemple, OCI fournit une gamme d'outils d'automatisation, notamment le gestionnaire de ressources, qui vous permet d'automatiser la création, la configuration et le déploiement des ressources en nuage à l'aide des API natives Terraform ou Oracle Cloud Infrastructure. En outre, l'utilisation de l'automatisation pour effectuer des tâches de routine telles que les sauvegardes et les mises à jour peut réduire considérablement le risque d'erreur et augmenter la résilience globale de votre infrastructure en nuage.

Exigences non fonctionnelles - SLI, SLO et SLA

Les exigences non fonctionnelles, telles que la performance, l'extensibilité et la disponibilité, jouent un rôle crucial pour s'assurer que les applications et les charges de travail répondent aux besoins de l'entreprise. Pour ce faire, il est important de disposer de mesures qui mesurent le rendement et la disponibilité des services et des ressources. Les indicateurs de niveau de service (SLI), les objectifs de niveau de service (SLO) et les contrats de niveau de service (SLA) sont des mesures qui vous aident à mesurer l'efficacité de votre infrastructure infonuagique.

OCI fournit une gamme d'outils et de services qui vous permettent de surveiller et de gérer ces mesures, notamment la surveillance en nuage, la journalisation et les avis. Le service de surveillance en nuage vous permet de collecter, d'analyser et d'alerter les mesures et les journaux des ressources et services OCI. Il fournit une vue unifiée de l'état et des performances de votre infrastructure, vous permettant d'identifier et de résoudre rapidement les problèmes qui pourraient avoir une incidence sur vos SLA, SLO et SLA. La journalisation vous permet de saisir et d'analyser les données de journal provenant de diverses sources, notamment les services, les applications et les composants d'infrastructure OCI. Le service d'avis vous permet de recevoir des alertes et des avis lorsque les conditions prédéfinies sont remplies, ce qui vous permet de prendre des mesures avant que les problèmes n'aient une incidence sur vos numéros de niveau de service, vos numéros de série et vos contrats de niveau de service.

En tirant parti de ces outils et services, vous pouvez obtenir une visibilité en profondeur sur votre infrastructure infonuagique, et surveiller et gérer de manière proactive les SLA, les SLO et les SLA. Cela permet de s'assurer que vos applications et charges de travail répondent aux besoins d'affaires et leur permet de répondre rapidement à tous les problèmes qui surviennent, en minimisant les temps d'arrêt et en améliorant la résilience globale.

Par exemple, vous pouvez utiliser le service de surveillance en nuage pour surveiller le temps de réponse et la disponibilité d'une application Web hébergée dans OCI, tout en utilisant le service de journalisation pour suivre les erreurs et diagnostiquer les problèmes de performance. Des avis peuvent être utilisés pour alerter les administrateurs lorsque des interruptions de service ou des problèmes de performance se produisent, ce qui leur permet de prendre des mesures avant que le problème ne devienne grave.

Domaine d'erreur et de disponibilité

Les domaines d'erreur et les domaines de disponibilité sont des concepts importants dans l'infonuagique qui améliorent la résilience et réduisent l'impact des défaillances potentielles. En cas d'erreur dans une zone particulière, les domaines d'erreur peuvent être utilisés pour garantir que les ressources critiques ne sont pas touchées, réduisant ainsi l'incidence globale sur le système. Les domaines de disponibilité assurent l'isolement entre les centres de données afin de garantir la redondance et la tolérance aux pannes. Ainsi, en cas de défaillance dans un domaine de disponibilité, la charge de travail peut basculer vers un autre domaine de disponibilité afin de garantir que les services restent disponibles, même en cas de défaillance.

OCI tire parti des domaines d'erreur et des domaines de disponibilité pour vous offrir une haute disponibilité. Par exemple, dans OCI, chaque région est composée de trois domaines de disponibilité, qui sont physiquement isolés les uns des autres et fournissent des domaines de défaillance indépendants. OCI utilise des domaines d'erreur pour s'assurer que les instances d'un domaine de disponibilité donné sont réparties entre plusieurs domaines d'erreur, ce qui garantit une haute disponibilité et une protection contre les défaillances.

Régions multiples

Les régions d'OCI sont un composant crucial pour assurer la résilience et la continuité en cas de sinistre. Les régions sont deux régions géographiquement séparées qui fournissent la redondance et la tolérance aux pannes. En cas d'événement catastrophique tel qu'une catastrophe naturelle, une cyberattaque ou une erreur humaine, les régions jumelées veillent à ce que les ressources critiques soient répliquées et disponibles dans une autre région. Cela réduit le risque de temps d'arrêt et de perte de données, offrant ainsi une tranquillité d'esprit aux entreprises et à vos clients.

Par exemple, si une entreprise opère aux États-Unis et qu'il y a un événement catastrophique tel qu'une catastrophe naturelle, des troubles politiques ou une panne de courant dans une région, l'autre région peut prendre le relais et assurer la continuité des activités. Si la région principale est États-Unis - Est (Ashburn) et connaît une interruption, la région secondaire Ouest des États-Unis (Phoenix) peut prendre le contrôle et fournir les services nécessaires jusqu'à ce que la région principale soit de nouveau en ligne. Cette approche garantit que l'expérience utilisateur n'est pas perturbée et que les données sont disponibles tout au long de la panne. La réplication active-active ou active-passive des ressources d'OCI dans les régions appariées garantit que les données sont disponibles en continu, ce qui permet de basculer vers la région de sauvegarde sans interruption.

Les régions multiples permettent aux entreprises de mettre en œuvre un plan de reprise après sinistre efficace, garantissant ainsi la protection des données et la disponibilité permanente des services.

Data Guard et GoldenGate

Data Guard est une fonction d'Oracle Database qui assure la récupération après sinistre et la haute disponibilité des bases de données d'entreprise. Il permet la création d'une base de données de secours qui peut prendre le relais en cas de défaillance de la base principale. La base de données de secours est synchronisée en continu avec la base principale, ce qui garantit que les données sont toujours à jour. Cela fournit une couche supplémentaire de résilience pour les systèmes et les applications critiques.

GoldenGate est un outil d'intégration et de réplication de données qui permet l'intégration de données en temps réel entre différentes bases de données. Il prend en charge l'intégration de données hétérogènes, ce qui signifie qu'il peut répliquer des données entre différents fournisseurs de base de données et au sein d'un seul fournisseur. GoldenGate peut également être utilisé pour la migration de bases de données, l'entreposage de données et l'intelligence d'affaires.

OCI fournit différentes versions de Data Guard et de GoldenGate pour répondre à différents besoins et cas d'utilisation. Par exemple, Data Guard Standard Edition fournit des fonctionnalités de base de reprise après sinistre, tandis que Data Guard Enterprise Edition fournit des fonctionnalités plus avancées telles que le basculement automatique et la protection des données. GoldenGate Édition Standard fournit une réplication des données en temps réel entre les bases de données, tandis que GoldenGate Enterprise Edition inclut des fonctions supplémentaires telles que la détection et la résolution des conflits.

En utilisant ces technologies conjointement avec OCI, vous pouvez améliorer la résilience de votre système en vous assurant que les données critiques sont toujours disponibles et à jour, même en cas de sinistre ou de défaillance du système. Par exemple, une société de services financiers peut utiliser Data Guard pour répliquer une base de données de production vers une base de données de secours dans une autre région, telle que les régions Nord et Sud des États-Unis dans OCI, afin de s'assurer qu'elle peut rapidement se remettre d'un événement catastrophique et continuer à servir les clients sans interruption.

Réplication de date

La réplication des données est un aspect essentiel de la résilience en nuage, car elle garantit que les données sont disponibles même en cas de défaillance. La réplication consiste à créer des copies des données et à les stocker dans plusieurs emplacements, qui peuvent être utilisés pour effectuer une récupération en cas de panne ou de sinistre.

OCI fournit plusieurs options de stockage pour la réplication des données. Le service de stockage d'objets est un service hautement évolutif et durable qui permet la réplication des données entre les régions. En configurant la réplication inter-région, les données sont automatiquement répliquées dans une autre région, offrant un haut niveau de résilience. En cas de sinistre ou de panne, les données sont facilement accessibles à partir de l'emplacement répliqué, assurant ainsi la continuité des activités.

Le service de stockage de fichiers fournit des systèmes de fichiers hautement disponibles et durables accessibles simultanément par plusieurs instances. Grâce aux politiques de réplication, les fichiers sont automatiquement répliqués vers un autre domaine de disponibilité, ce qui garantit une tolérance aux pannes et une haute disponibilité.

Le service de volume par blocs est un service de stockage par blocs hautement disponible et durable qui fournit une fonction de réplication. En configurant la réplication de volume par blocs, les données sont automatiquement répliquées vers un autre volume par blocs dans un domaine de disponibilité différent dans la même région. Cela garantit que les données sont disponibles même en cas de panne ou de panne.

La réplication des données est cruciale pour assurer la résilience en nuage, et OCI offre plusieurs options pour répliquer les données entre les régions, les domaines de disponibilité et les instances. En utilisant ces options, vous pouvez vous assurer que vos données sont hautement disponibles, durables et facilement récupérables en cas de défaillance ou de sinistre.

Calculer la fiabilité globale

La fiabilité est cruciale pour le déploiement d'une application ou d'une charge de travail dans le nuage. Il est essentiel de mesurer la probabilité et l'incidence des défaillances pour assurer le bon fonctionnement des opérations commerciales. OCI fournit une gamme d'outils et de services qui vous aident à calculer la fiabilité et le coût globaux de votre infrastructure en nuage. Par exemple, Cloud Advisor vous aide à identifier les problèmes potentiels de votre architecture et fournit des recommandations pour améliorer la fiabilité, tandis que l'évaluateur de coût vous aide à estimer le coût de mise en oeuvre de votre infrastructure en nuage. Grâce à ces outils et services, vous pouvez vous assurer que vos applications et charges de travail sont déployées de manière fiable et rentable.

Planifier l'application de correctifs et de mises à niveau

Il est important de tenir à jour les applications et l'infrastructure pour assurer une sécurité et une performance optimales dans le nuage. Le fait de ne pas appliquer les correctifs et les mises à niveau nécessaires peut rendre les systèmes vulnérables aux attaques et peut entraîner des problèmes de performance qui perturbent les opérations commerciales. OCI fournit une gamme d'outils et de services pour rationaliser et automatiser le processus d'application de correctifs et de mise à niveau.

Les services Patching Automation et Upgrade Advisor fournis par OCI sont conçus pour faciliter la planification et l'exécution du processus d'application de correctifs et de mise à niveau. En outre, le service de gestion du système d'exploitation (OSMS) vous permet d'automatiser l'application de correctifs aux instances Oracle Linux ou Windows. Avec OSMS, vous pouvez organiser vos systèmes en groupes et programmer des tâches pour appliquer les dernières mises à jour à tous les systèmes. Ce service donne accès à un large éventail de sources de logiciels prédéfinies, fournissant la gamme complète de référentiels Oracle yum aux systèmes Linux. Par conséquent, les systèmes peuvent être constamment à jour avec les derniers correctifs, ce qui améliore la sécurité et les performances.

Plan de continuité des activités

Un plan de continuité des activités solide est essentiel pour toute organisation afin de s'assurer qu'elle peut continuer à fonctionner même face à des événements perturbateurs. Il peut s'agir de catastrophes naturelles, de pannes de courant ou de cyberattaques.

OCI fournit une gamme d'outils et de services pour prendre en charge ce type de planification. Par exemple, le service RPV site à site vous permet de créer une connexion sécurisée et chiffrée entre votre réseau sur place et votre réseau en nuage virtuel (VCN) OCI, ce qui vous permet d'étendre votre centre de données au nuage. De même, le service FastConnect fournit une connexion privée à bande passante élevée entre votre infrastructure sur place et vos ressources OCI, ce qui vous permet de répliquer des données et d'exécuter des applications critiques dans le nuage.

Utilisation d'une architecture à couplage lâche

L'architecture à faible couplage est un élément crucial de la construction de systèmes résilients car elle contribue à minimiser l'impact des défaillances en réduisant les dépendances entre les composants. En réduisant les dépendances, chaque composant peut être mis à l'échelle et évolué indépendamment, ce qui rend le système plus flexible et adaptable aux changements. OCI fournit des outils et des services qui prennent en charge cette architecture, tels qu'Oracle Functions, qui permet aux développeurs de créer et de déployer des applications sans serveur qui peuvent s'adapter automatiquement en fonction de la demande de charge de travail, sans être étroitement associées à d'autres composants. Un autre exemple est Oracle Kubernetes Engine (OKE), qui fournit une plate-forme hautement évolutive et flexible pour exécuter des applications conteneurisées. OKE utilise une architecture basée sur les microservices qui vous permet de créer et de déployer des applications modulaires et à faible interdépendance qui peuvent être facilement mises à l'échelle et gérées.

Surveiller et s'adapter aux modèles inhabituels

Pour assurer la résilience de votre système, il est important de surveiller et de s'adapter aux modèles inhabituels d'utilisation, de trafic et de comportement des ressources. Ces modèles peuvent aider à identifier les problèmes potentiels avant qu'ils ne deviennent critiques et ont une incidence sur les performances et la disponibilité de votre système. OCI fournit des outils et des services tels que le service de protection d'infrastructure en nuage et les zones de sécurité qui fournissent une surveillance et une analyse continues de l'utilisation des ressources, du trafic réseau et du comportement des utilisateurs. Le service de protection d'infrastructure en nuage automatise la surveillance de vos ressources et aide à détecter les menaces de sécurité et les erreurs de configuration dans votre environnement en nuage. En outre, les zones de sécurité fournissent un environnement sécurisé pour les charges de travail et les ressources qui nécessitent des niveaux de sécurité supérieurs.

Choix entre SaaS, PaaS et IaaS

Il est crucial de sélectionner le modèle de service en nuage approprié, car il détermine le niveau de contrôle, de flexibilité et de gestion requis pour vos applications et charges de travail. Les modèles de service en nuage tels que le logiciel-service (SaaS), la plate-forme-service (PaaS) et l'infrastructure-service (IaaS) présentent des avantages et des inconvénients distincts. SaaS fournit une solution entièrement gérée qui peut être facilement déployée et nécessite peu de maintenance, tandis que PaaS fournit une plate-forme de développement avec plus d'options de contrôle et de personnalisation. IaaS offre un contrôle complet sur l'infrastructure, mais nécessite plus de gestion et de maintenance. Le choix du bon modèle de service pour votre entreprise est essentiel pour maximiser le rendement, réduire les coûts et maintenir des niveaux élevés de résilience.

Anticiper l'échec

Il est essentiel d'atténuer l'incidence des défaillances potentielles pour assurer la résilience de votre infrastructure en nuage. OCI fournit une variété d'outils et de services qui vous permettent d'anticiper les points d'échec potentiels et de planifier votre atténuation. Par exemple, les domaines d'erreur et les domaines de disponibilité sont des concepts utilisés dans l'infonuagique pour accroître la résilience et réduire l'incidence des défaillances. En regroupant les ressources et en les répartissant entre différents domaines d'erreur et domaines de disponibilité, vous pouvez réduire le risque de point de défaillance unique. De plus, les zones de sécurité dans OCI vous permettent d'isoler les charges de travail et de réduire l'incidence des incidents ou des défaillances de sécurité.

Fiabilité par rapport aux coûts

Pour garantir la rentabilité tout en maintenant la fiabilité, il est essentiel d'équilibrer le coût et la performance de votre infrastructure infonuagique. OCI fournit divers outils et services, tels que l'évaluateur de coût et la gestion des coûts, qui vous aident à surveiller et à optimiser vos dépenses infonuagiques. L'évaluateur de coût vous aide à estimer les coûts du déploiement de votre infrastructure et à identifier les économies potentielles. Le service Cost Management fournit une plate-forme centralisée pour la surveillance et la gestion de vos dépenses en nuage dans différentes régions et services. Grâce à ce service, vous pouvez définir des budgets, suivre l'utilisation et identifier les domaines dans lesquels vous pouvez réduire les coûts sans affecter la fiabilité de votre infrastructure.

Planifier les grands événements

Assurer une haute disponibilité et éviter les perturbations lors des grands événements, tels que les pics saisonniers de trafic ou les fenêtres de maintenance planifiée, nécessite une planification minutieuse. OCI fournit divers outils et services, tels que l'ajustement automatique et l'ajustement programmé, qui vous aident à planifier et à ajuster vos ressources en conséquence. L'ajustement automatique ajuste automatiquement la capacité de vos ressources en fonction du trafic en temps réel, pour garantir que votre application est disponible pour vos utilisateurs. La mise à l'échelle programmée vous permet de planifier et d'ajuster les ressources à l'avance pour établir des modèles de trafic prévisibles, réduisant ainsi le risque de surprovisionnement et de coûts inutiles. Ces outils vous aident à gérer efficacement vos ressources en nuage, assurant ainsi une haute disponibilité et une performance optimale lors des grands événements.

Documentation sur Oracle Cloud Infrastructure