Soluções de Interrupção Planejadas e Não Planejadas

Interrupções planejadas e não planejadas podem ocorrer em seu ambiente PeopleSoft. Saiba mais sobre as soluções Oracle disponíveis para minimizar o tempo de inatividade do aplicativo. Minimizar o tempo de inatividade do aplicativo PeopleSoft é baseado no aplicativo, não no tempo de inatividade de um componente individual.

Soluções de Paralisação Não Planejadas

A seguir estão os tipos de interrupções não planejadas que podem ser causadas por falhas do sistema ou humanas em um ambiente PeopleSoft e as soluções de tecnologia que você pode usar para recuperar e manter o tempo de inatividade mínimo.

Recomendamos que você teste os cenários básicos abaixo para garantir que eles estejam configurados corretamente em seu ambiente e para ter certeza de que está pronto para agir em caso de emergência.

Tipo de Paralisação do Sistema Solução da Oracle Benefícios Tempo de Recuperação
Balanceador de carga Balanceador de carga do software, configuração replicada localmente As conexões migram perfeitamente para o balanceador de carga restante Sem tempo de inatividade.
PeopleSoft Falha no nó ou componente do Servidor Web PIA Servidores Web redundantes sem cluster do servidor de cache Coherence*Web As conexões são redistribuídas para nós sobreviventes. Os nós sobreviventes continuam sendo processados. Sem tempo de inatividade. A reautenticação e o reenvio do trabalho podem ser necessários.
PeopleSoft Falha no nó ou componente do Servidor Web PIA Servidores Web redundantes com cluster de servidores de cache Coherence*Web As conexões são redistribuídas para nós sobreviventes, preservando o estado da sessão. Os nós sobreviventes continuam sendo processados. Sem tempo de inatividade e sem reautenticação ou reenvio de trabalho.
PeopleSoft Falha no nó ou componente do Servidor de Domínio do Aplicativo

Servidores de domínio de aplicativos redundantes

Servidores PIA configurados com carga de conexões ativas balanceada entre servidores de aplicativos, reenvia o trabalho para um servidor de aplicativos sobrevivente.

As conexões são redistribuídas para nós sobreviventes. Os nós sobreviventes selecionam as solicitações, sem perda de contexto Sem tempo de inatividade.
Falha no servidor de banco de dados ou na instância Oracle RAC, Continuidade de Aplicativos, eventos FAN Recuperação automática do trabalho na instância com falha – as sessões fazem failover de forma transparente; as atualizações são reenviadas automaticamente Segundos para minutos.
Falha do site Oracle Data Guard, rsync Failover completo do site com perda de dados mínima ou nenhuma Menos de 10 minutos após a decisão ser tomada, para transição de atribuição de banco de dados, montagem do sistema de arquivos e inicialização do aplicativo PeopleSoft.
Falha de armazenamento ASM Espelhamento e reequilíbrio automático. Sem tempo de inatividade.
Falha de armazenamento Oracle RMAN com área de recuperação flash. Recuperação de bancos de dados totalmente gerenciada e backups baseados em disco. Minutos a horas.
Falha de armazenamento Armazenamento de objetos Oracle local na região Recuperação de banco de dados gerenciada na nuvem e backups baseados em disco Minutos a horas.
Falha de armazenamento Oracle Data Guard, rsync Failover de site completo com perda de dados mínima ou nenhuma. Menos de 10 minutos após a decisão ser tomada, para transição de atribuição de banco de dados, montagem do sistema de arquivos e inicialização do aplicativo PeopleSoft.
Erro humano Oracle Data Guard com Flashback Database. Pesquisa sobre cópia (standby) Horas (pesquisa por meio de correção de dados).
corrupção de dados Oracle RMAN com área de recuperação rápida. Recuperação de mídia de bloco on-line e backups gerenciados baseados em disco. Minutos a horas.
corrupção de dados Oracle Active Data Guard Detecta e repara automaticamente blocos corrompidos usando o banco de dados stand-by físico. Sem tempo de inatividade, transparente para o aplicativo.
corrupção de dados Oracle Data Guard Validação automática e re-transmissão de blocos de redo corrompidos Sem tempo de inatividade, transparente para o aplicativo.
corrupção de dados Oracle Data Guard Broker Failover rápido para um banco de dados stand-by local ou failover do site completo para o site de DR.

Stand-by local: Menos de 5 minutos após a decisão ser tomada, para transição de atribuição de banco de dados, montagem do sistema de arquivos e inicialização do aplicativo PeopleSoft.

Failover de site completo: Menos de 10 minutos após a decisão ser tomada, para transição de atribuição de banco de dados, montagem do sistema de arquivos e PeopleSoft.

Observação:

Pode ser possível recuperar rapidamente de uma falha no local principal e retomar as operações lá, o que pode ser menos perturbador para a operação geral do que mudar para o local secundário. Assim, na tabela acima, mencionamos tomar uma decisão para fazer o failover e o tempo que se espera para realizar uma transição com script assim que a decisão for tomada. Se você decidir não exigir uma decisão humana antes de um failover para um site de DR, configurará o Failover de Inicialização Rápida no banco de dados.

Se o Failover de Inicialização Rápida estiver configurado e se o lag de aplicação do banco de dados stand-by estiver dentro do limite de lag de failover de inicialização rápida, o tempo para ativar o site de DR só adicionará o limite de timeout de failover de inicialização rápida ao tempo geral para fazer a transição para o stand-by.

Independentemente de a ação ser tomada automaticamente ou não, o processo de failover deve ser totalmente roteado para garantir uma execução rápida e precisa.

Soluções de Manutenção Planejada

Veja a seguir um resumo das atividades de manutenção planejadas que geralmente ocorrem em um ambiente PeopleSoft e as soluções de tecnologia recomendadas para manter o tempo de inatividade mínimo.

Atividade de Manutenção Solução Interrupção de Serviço PeopleSoft
Atualização de hardware ou sistema operacional de camada intermediária Balanceamento de carga, serviços redundantes em servidores de aplicativos Web e Tuxedo. Sem tempo de inatividade, supondo que o Coherence*Web esteja em execução.
PeopleSoft (aplicativo e PeopleTools) PeopleSoft aplicação de patches fora do local. Minutos (sem alterações de esquema) para horas (alterações de esquema necessárias)
PeopleSoft alteração da configuração do aplicativo Reinicialização incremental do aplicativo PeopleSoft. Sem tempo de inatividade
Atualizações do PeopleSoft PeopleSoft upgrades fora do local. Horas para dias (as alterações de esquema serão necessárias; o tempo depende do tamanho do banco de dados)*
Patches ou manutenção de hardware do sistema operacional da camada do banco de dados Rolagem do Oracle RAC, Primeiro Stand-by. Sem tempo de inatividade
Aplicação de patches da Atualização da Release do Oracle Database Rolagem do Oracle RAC, Primeiro Stand-by. Sem tempo de inatividade
Atualizações do Oracle Database Upgrade incremental lógico transitório do Data Guard. Consulte: Reduzindo o Tempo de Inatividade de PeopleSoft Usando um Banco de Dados Stand-by Local. Segundos para minutos
Atualização e patches do Oracle Grid e Oracle Clusterware Rolagem do Oracle RAC, Primeiro Stand-by. Sem tempo de inatividade

* Na prática, existem maneiras de mitigar o impacto do tempo de inatividade de upgrade estendido - por exemplo, fornecendo uma réplica somente leitura. O Oracle Consulting Services pode ajudar você a planejar e executar a atualização.