Soluciones de interrupción planificada y no planificada

Pueden producirse interrupciones planificadas y no planificadas en el entorno PeopleSoft. Obtenga información sobre las soluciones de Oracle disponibles para minimizar el tiempo de inactividad de las aplicaciones. Minimizar el tiempo de inactividad de la aplicación PeopleSoft se basa en la aplicación, no en el tiempo de inactividad de un componente individual.

Soluciones de Caídas del Sistema No Planificadas

A continuación se muestran los tipos de interrupciones no planificadas que pueden deberse a fallos del sistema o humanos en un entorno PeopleSoft, así como las soluciones tecnológicas que puede utilizar para recuperar y mantener el tiempo de inactividad al mínimo.

Le recomendamos que pruebe los siguientes escenarios básicos para asegurarse de que están configurados correctamente en su entorno y para estar seguro de que está listo para actuar si se produce una emergencia.

Tipo de Interrupción Solución de Oracle Ventajas Tiempo de Recuperación
Load Balancer Equilibrador de Carga de Software, Configuración Replicada Local Las conexiones migran sin problemas al equilibrador de carga superviviente Sin tiempo de inactividad.
Fallo de componente o nodo del servidor web de PIA PeopleSoft Servidores web redundantes sin cluster de servidor de caché de Coherence*Web Las conexiones se redistribuyen a los nodos supervivientes. Los nodos supervivientes continúan el procesamiento. Sin tiempo de inactividad. Puede ser necesaria la reautentificación y la nueva presentación del trabajo.
Fallo de componente o nodo del servidor web de PIA PeopleSoft Servidores web redundantes con cluster de servidor de caché Coherence*Web Las conexiones se redistribuyen a los nodos supervivientes, preservando el estado de la sesión. Los nodos supervivientes continúan el procesamiento. Sin tiempo de inactividad ni reautenticación ni reenvío del trabajo.
Fallo de componente o nodo del servidor de dominio de aplicación PeopleSoft

Servidores de dominio de aplicaciones redundantes

Los servidores PIA configurados con conexiones activas equilibran la carga entre los servidores de aplicaciones. Vuelve a enviar el trabajo a un servidor de aplicaciones superviviente.

Las conexiones se redistribuyen a los nodos supervivientes. Los nodos supervivientes recogen las solicitudes, sin pérdida de contexto Sin tiempo de inactividad.
Fallo de instancia o servidor de base de datos Eventos de Oracle RAC, Continuidad de Aplicaciones y FAN Recuperación automática del trabajo en la instancia con fallos: las sesiones realizan un failover de forma transparente y las actualizaciones se vuelven a enviar automáticamente De segundos a minutos.
Fallo de Ubicación Oracle Data Guard, rsync Failover de sitio completo con una pérdida mínima o nula de datos Menos de 10 minutos después de tomar la decisión, para la transición de roles de base de datos, el montaje del sistema de archivos y el inicio de la aplicación PeopleSoft.
Fallo de Almacenamiento ASM Reflejo y reequilibrio automático. Sin tiempo de inactividad.
Fallo de Almacenamiento Oracle RMAN con área de recuperación de flash. Recuperación de base de datos y copias de seguridad basadas en disco completamente gestionadas. Minutos a horas.
Fallo de Almacenamiento Almacenamiento de objetos de Oracle local de región Recuperación de base de datos y copias de seguridad basadas en disco gestionadas en la nube Minutos a horas.
Fallo de Almacenamiento Oracle Data Guard, rsync Failover de sitio completo con una pérdida mínima o nula de datos. Menos de 10 minutos después de tomar la decisión, para la transición de roles de base de datos, el montaje del sistema de archivos y el inicio de la aplicación PeopleSoft.
Error Humano Oracle Data Guard con flashback de base de datos. Investigación en copia (en espera) Horas (investigación a través de la corrección de datos).
corrupción de datos Oracle RMAN con área de recuperación rápida. Recuperación de medios físicos de bloque en línea y copias de seguridad gestionadas basadas en disco. Minutos a horas.
corrupción de datos Oracle Active Data Guard Detecta y repara automáticamente los bloques corruptos mediante la base de datos física en espera. Sin tiempo de inactividad, transparente para la aplicación.
corrupción de datos Oracle Data Guard Validación automática y nueva transmisión de bloques de redo corruptos Sin tiempo de inactividad, transparente para la aplicación.
corrupción de datos Oracle Data Guard Broker Failover rápido a una base de datos en espera local o failover de ubicación completa a una ubicación de DR.

Base de datos en espera local: menos de 5 minutos después de tomar la decisión, para la transición de roles de base de datos, el montaje del sistema de archivos y el inicio de la aplicación PeopleSoft.

Failover de sitio completo: menos de 10 minutos después de tomar la decisión, para la transición de roles de base de datos, el montaje del sistema de archivos y PeopleSoft.

Note:

Puede ser posible recuperarse rápidamente de un fallo en el sitio principal y reanudar las operaciones allí, lo que puede ser menos perjudicial para la operación general que cambiar al sitio secundario. Por lo tanto, en la tabla anterior, mencionamos la decisión de realizar el failover y el tiempo que se espera que tarde en realizar una transición con scripts una vez que se tome la decisión. Si decide no requerir una decisión humana antes de un failover a un sitio de DR, configurará Fast-Start Failover en la base de datos.

Si el failover de inicio rápido está configurado y la demora de aplicación de la base de datos en espera está dentro del límite de demora de failover de inicio rápido, el tiempo de activación de la ubicación de DR solo agregará el umbral de timeout de failover de inicio rápido al tiempo general de transición a la base de datos en espera.

Independientemente de si la acción se realiza automáticamente o no, el proceso de conmutación por error debe tener scripts completos para garantizar una ejecución rápida y precisa.

Soluciones de mantenimiento planificadas

A continuación, se muestra un resumen de las actividades de mantenimiento planificadas que suelen tener lugar en un entorno PeopleSoft y las soluciones tecnológicas recomendadas para mantener el tiempo de inactividad al mínimo.

Actividad de Mantenimiento Solución PeopleSoft Interrupción
Actualización de hardware o sistema operativo de nivel medio Equilibrio de carga y servicios redundantes en servidores de aplicaciones Web y Tuxedo. Sin tiempo de inactividad, suponiendo que Coherence*Web se está ejecutando.
PeopleSoft (aplicación y PeopleTools) PeopleSoft aplicación de parches externa. Minutos (sin cambios de esquema) a horas (se necesitan cambios de esquema)
Cambio de configuración de la aplicación PeopleSoft Reinicio dinámico de aplicación PeopleSoft. Sin tiempo de inactividad
Actualizaciones de PeopleSoft PeopleSoft actualizaciones externas. Horas a días (se necesitarán cambios de esquema; el tiempo depende del tamaño de la base de datos)*
Aplicación de parches al sistema operativo de nivel de base de datos o mantenimiento del hardware Renovación de Oracle RAC, en Espera Primero. Sin tiempo de inactividad
Aplicación de parches de Oracle Database Release Update Renovación de Oracle RAC, en Espera Primero. Sin tiempo de inactividad
Actualizaciones de Oracle Database Actualización sucesiva lógica transitoria de Data Guard. Consulte: Reducción del tiempo de inactividad PeopleSoft mediante una base de datos local en espera. Segundos a minutos
Actualización y parches de Oracle Grid y Oracle Clusterware Renovación de Oracle RAC, en Espera Primero. Sin tiempo de inactividad

* En la práctica, hay formas de mitigar el impacto del tiempo de inactividad de la actualización ampliada, por ejemplo, proporcionando una réplica de solo lectura. Oracle Consulting Services puede ayudarle a planificar y ejecutar la actualización.