Solutions d'interruption planifiées et non planifiées

Des pannes planifiées et non planifiées peuvent se produire dans votre environnement PeopleSoft. Découvrez les solutions Oracle disponibles pour réduire les temps d'arrêt des applications. La réduction du temps d'arrêt de votre application PeopleSoft est basée sur l'application, et non sur le temps d'arrêt d'un composant individuel.

Solutions d'interruption non planifiées

Les types d'interruption non planifiée suivants peuvent être causés par des défaillances système ou humaines dans un environnement PeopleSoft, ainsi que par les solutions technologiques que vous pouvez utiliser pour récupérer et réduire au minimum les temps d'arrêt.

Nous vous recommandons de tester les scénarios de base ci-dessous pour vous assurer qu'ils sont configurés correctement dans votre environnement et pour vous assurer que vous êtes prêt à agir en cas d'urgence.

Type d'interruption Solution Oracle Avantages Temps de récupération
équilibreur de charge Équilibreur de charge logiciel, configuration répliquée localement Les connexions migrent de façon transparente vers l'équilibreur de charge survivant Aucun temps d'arrêt.
PeopleSoft Échec du noeud ou du composant du serveur Web PIA Serveurs Web redondants sans cluster de serveurs de cache Coherence*Web Les connexions sont redistribuées aux noeuds survivants. Les noeuds survivants continuent le traitement. Aucun temps d'arrêt. Une nouvelle authentification et une nouvelle soumission du travail peuvent être nécessaires.
PeopleSoft Échec du noeud ou du composant du serveur Web PIA Serveurs Web redondants avec cluster de serveurs de cache Coherence*Web Les connexions sont redistribuées aux noeuds survivants, en préservant l'état de la session. Les noeuds survivants continuent le traitement. Aucun temps d'arrêt et aucune nouvelle authentification ou nouvelle soumission du travail.
PeopleSoft Échec du noeud ou du composant du serveur de domaine d'application

Serveurs de domaine d'application redondants

Les serveurs PIA configurés avec des connexions actives ont une charge équilibrée entre les serveurs d'applications, resoumet le travail à un serveur d'applications survivant.

Les connexions sont redistribuées aux noeuds survivants. Les nœuds survivants récupèrent les demandes, sans perte de contexte Aucun temps d'arrêt.
Défaillance du serveur de base de données ou de l'instance Événements Oracle RAC, Application Continuity et FAN Récupération automatique du travail sur l'instance en échec - les sessions basculent de façon transparente, les mises à jour sont resoumises automatiquement Quelques secondes à quelques minutes.
Échec du site Oracle Data Guard, rsync Basculement complet du site avec perte de données minimale ou nulle Moins de 10 minutes après la prise de décision, pour la transition de rôle de base de données, le montage du système de fichiers et le démarrage de l'application PeopleSoft.
Échec du stockage Disque ASM Mise en miroir et rééquilibrage automatique. Aucun temps d'arrêt.
Échec du stockage Oracle RMAN avec zone de récupération rapide. Récupération de base de données entièrement gérée et sauvegardes sur disque. Plusieurs minutes ou heures.
Échec du stockage Stockage d'objets Oracle local par région Récupération de base de données gérée en nuage et sauvegardes sur disque Plusieurs minutes ou heures.
Échec du stockage Oracle Data Guard, rsync Basculement complet du site avec une perte de données minimale ou nulle. Moins de 10 minutes après la prise de décision, pour la transition de rôle de base de données, le montage du système de fichiers et le démarrage de l'application PeopleSoft.
Erreur humaine Oracle Data Guard avec Flashback Database. Recherche sur la copie (standby) Heures (recherche par correction de données).
Corruption de données Oracle RMAN avec zone de récupération rapide. Restauration physique de blocs en ligne et sauvegardes sur disque gérées. Plusieurs minutes ou heures.
Corruption de données Oracle Active Data Guard Détecte et répare automatiquement les blocs endommagés à l'aide de la base de secours physique. Aucun temps d'arrêt, transparent pour l'application.
Corruption de données Oracle Data Guard Validation et retransmission automatiques des blocs de journalisation corrompus Aucun temps d'arrêt, transparent pour l'application.
Corruption de données Oracle Data Guard Broker Basculement rapide vers une base de données de secours locale ou basculement complet vers un site de reprise après sinistre.

Base de secours locale : Moins de 5 minutes après la prise de décision, pour la transition de rôle de base de données, le montage du système de fichiers et le démarrage de l'application PeopleSoft.

Basculement complet du site : Moins de 10 minutes après la prise de décision, pour la transition de rôle de base de données, le montage du système de fichiers et PeopleSoft.

Note :

Il peut être possible de récupérer rapidement d'un défaut au site primaire et de reprendre les opérations là-bas, ce qui peut être moins perturbateur pour le fonctionnement global que de passer au site secondaire. Ainsi, dans le tableau ci-dessus, nous avons mentionné la décision de faire le basculement et le temps qu'il est prévu de prendre pour effectuer une transition scriptée une fois la décision prise. Si vous décidez de ne pas avoir besoin d'une décision humaine avant un basculement vers un site de reprise après sinistre, vous configurez Fast-Start Failover dans la base de données.

Si la fonction Fast-Start Failover est configurée et si le délai d'application de la base de secours se situe dans la limite du délai d'exécution de la fonction Fast-Start Failover, le délai d'exécution du site de récupération après sinistre n'ajoute que le seuil de temporisation de la fonction Fast-Start Failover à la durée globale de transition vers la base de secours.

Que l'action soit effectuée automatiquement ou non, le processus de basculement doit être entièrement codé pour garantir une exécution rapide et précise.

Solutions de maintenance planifiée

Ce qui suit est un résumé des activités de maintenance planifiée qui se produisent généralement dans un environnement PeopleSoft, et des solutions technologiques recommandées pour réduire au minimum les temps d'arrêt.

Activité d'entretien Solution PeopleSoft Interruption
Mise à niveau du système d'exploitation ou du matériel de niveau intermédiaire Equilibrage de la charge, services redondants sur les serveurs d'applications Web et Tuxedo. Aucun temps d'arrêt, à condition que Coherence*Web soit en cours d'exécution.
PeopleSoft (application et PeopleTools) Application de correctifs dans un emplacement différent de PeopleSoft. Minutes (aucune modification de schéma) en heures (modifications de schéma requises)
PeopleSoft Modification de la configuration de l'application Redémarrage du repositionnement de l'application PeopleSoft. Aucun temps d'arrêt
Mises à niveau PeopleSoft PeopleSoft Mises à niveau dans un emplacement différent. Heures en jours (des modifications de schéma seront nécessaires; le temps dépend de la taille de la base de données)*
Application de correctifs au système d'exploitation de niveau base de données ou maintenance matérielle Oracle RAC Rolling, Standby-First. Aucun temps d'arrêt
Application de correctifs à la mise à jour de version d'Oracle Database Oracle RAC Rolling, Standby-First. Aucun temps d'arrêt
Mises à niveau d'Oracle Database Mise à niveau non simultanée logique transitoire de Data Guard. Voir : Réduction du temps d'arrêt PeopleSoft à l'aide d'une base de données de secours locale. Quelques secondes à quelques minutes
Mise à niveau et correctifs d'Oracle Grid et d'Oracle Clusterware Oracle RAC Rolling, Standby-First. Aucun temps d'arrêt

* En pratique, il existe des moyens d'atténuer l'impact des temps d'arrêt prolongés de la mise à niveau, par exemple en fournissant une réplique en lecture seule. Oracle Consulting Services peut vous aider à planifier et à exécuter la mise à niveau.