Soluções de Interrupção Planejadas e Não Planejadas
Interrupções planejadas e não planejadas podem ocorrer em seu ambiente PeopleSoft. Saiba mais sobre as soluções Oracle disponíveis para minimizar o tempo de inatividade do aplicativo. Minimizar o tempo de inatividade do aplicativo PeopleSoft é baseado no aplicativo, não no tempo de inatividade de um componente individual.
Soluções de Paralisação Não Planejadas
A seguir estão os tipos de interrupções não planejadas que podem ser causadas por falhas do sistema ou humanas em um ambiente PeopleSoft e as soluções de tecnologia que você pode usar para recuperar e manter o tempo de inatividade mínimo.
Recomendamos que você teste os cenários básicos abaixo para garantir que eles estejam configurados corretamente em seu ambiente e para ter certeza de que está pronto para agir em caso de emergência.
Tipo de Paralisação do Sistema | Solução da Oracle | Benefícios | Tempo de Recuperação |
---|---|---|---|
Balanceador de carga | Balanceador de carga do software, configuração replicada localmente | As conexões migram perfeitamente para o balanceador de carga restante | Sem tempo de inatividade. |
PeopleSoft Falha no nó ou componente do Servidor Web PIA | Servidores Web redundantes sem cluster do servidor de cache Coherence*Web | As conexões são redistribuídas para nós sobreviventes. Os nós sobreviventes continuam sendo processados. | Sem tempo de inatividade. A reautenticação e o reenvio do trabalho podem ser necessários. |
PeopleSoft Falha no nó ou componente do Servidor Web PIA | Servidores Web redundantes com cluster de servidores de cache Coherence*Web | As conexões são redistribuídas para nós sobreviventes, preservando o estado da sessão. Os nós sobreviventes continuam sendo processados. | Sem tempo de inatividade e sem reautenticação ou reenvio de trabalho. |
PeopleSoft Falha no nó ou componente do Servidor de Domínio do Aplicativo |
Servidores de domínio de aplicativos redundantes Servidores PIA configurados com carga de conexões ativas balanceada entre servidores de aplicativos, reenvia o trabalho para um servidor de aplicativos sobrevivente. |
As conexões são redistribuídas para nós sobreviventes. Os nós sobreviventes selecionam as solicitações, sem perda de contexto | Sem tempo de inatividade. |
Falha no servidor de banco de dados ou na instância | Oracle RAC, Continuidade de Aplicativos, eventos FAN | Recuperação automática do trabalho na instância com falha – as sessões fazem failover de forma transparente; as atualizações são reenviadas automaticamente | Segundos para minutos. |
Falha do site | Oracle Data Guard, rsync | Failover completo do site com perda de dados mínima ou nenhuma | Menos de 10 minutos após a decisão ser tomada, para transição de atribuição de banco de dados, montagem do sistema de arquivos e inicialização do aplicativo PeopleSoft. |
Falha de armazenamento | ASM | Espelhamento e reequilíbrio automático. | Sem tempo de inatividade. |
Falha de armazenamento | Oracle RMAN com área de recuperação flash. | Recuperação de bancos de dados totalmente gerenciada e backups baseados em disco. | Minutos a horas. |
Falha de armazenamento | Armazenamento de objetos Oracle local na região | Recuperação de banco de dados gerenciada na nuvem e backups baseados em disco | Minutos a horas. |
Falha de armazenamento | Oracle Data Guard, rsync | Failover de site completo com perda de dados mínima ou nenhuma. | Menos de 10 minutos após a decisão ser tomada, para transição de atribuição de banco de dados, montagem do sistema de arquivos e inicialização do aplicativo PeopleSoft. |
Erro humano | Oracle Data Guard com Flashback Database. | Pesquisa sobre cópia (standby) | Horas (pesquisa por meio de correção de dados). |
corrupção de dados | Oracle RMAN com área de recuperação rápida. | Recuperação de mídia de bloco on-line e backups gerenciados baseados em disco. | Minutos a horas. |
corrupção de dados | Oracle Active Data Guard | Detecta e repara automaticamente blocos corrompidos usando o banco de dados stand-by físico. | Sem tempo de inatividade, transparente para o aplicativo. |
corrupção de dados | Oracle Data Guard | Validação automática e re-transmissão de blocos de redo corrompidos | Sem tempo de inatividade, transparente para o aplicativo. |
corrupção de dados | Oracle Data Guard Broker | Failover rápido para um banco de dados stand-by local ou failover do site completo para o site de DR. |
Stand-by local: Menos de 5 minutos após a decisão ser tomada, para transição de atribuição de banco de dados, montagem do sistema de arquivos e inicialização do aplicativo PeopleSoft. Failover de site completo: Menos de 10 minutos após a decisão ser tomada, para transição de atribuição de banco de dados, montagem do sistema de arquivos e PeopleSoft. |
Observação:
Pode ser possível recuperar rapidamente de uma falha no local principal e retomar as operações lá, o que pode ser menos perturbador para a operação geral do que mudar para o local secundário. Assim, na tabela acima, mencionamos tomar uma decisão para fazer o failover e o tempo que se espera para realizar uma transição com script assim que a decisão for tomada. Se você decidir não exigir uma decisão humana antes de um failover para um site de DR, configurará o Failover de Inicialização Rápida no banco de dados.Se o Failover de Inicialização Rápida estiver configurado e se o lag de aplicação do banco de dados stand-by estiver dentro do limite de lag de failover de inicialização rápida, o tempo para ativar o site de DR só adicionará o limite de timeout de failover de inicialização rápida ao tempo geral para fazer a transição para o stand-by.
Independentemente de a ação ser tomada automaticamente ou não, o processo de failover deve ser totalmente roteado para garantir uma execução rápida e precisa.
Soluções de Manutenção Planejada
Veja a seguir um resumo das atividades de manutenção planejadas que geralmente ocorrem em um ambiente PeopleSoft e as soluções de tecnologia recomendadas para manter o tempo de inatividade mínimo.
Atividade de Manutenção | Solução | Interrupção de Serviço PeopleSoft |
---|---|---|
Atualização de hardware ou sistema operacional de camada intermediária | Balanceamento de carga, serviços redundantes em servidores de aplicativos Web e Tuxedo. | Sem tempo de inatividade, supondo que o Coherence*Web esteja em execução. |
PeopleSoft (aplicativo e PeopleTools) | PeopleSoft aplicação de patches fora do local. | Minutos (sem alterações de esquema) para horas (alterações de esquema necessárias) |
PeopleSoft alteração da configuração do aplicativo | Reinicialização incremental do aplicativo PeopleSoft. | Sem tempo de inatividade |
Atualizações do PeopleSoft | PeopleSoft upgrades fora do local. | Horas para dias (as alterações de esquema serão necessárias; o tempo depende do tamanho do banco de dados)* |
Patches ou manutenção de hardware do sistema operacional da camada do banco de dados | Rolagem do Oracle RAC, Primeiro Stand-by. | Sem tempo de inatividade |
Aplicação de patches da Atualização da Release do Oracle Database | Rolagem do Oracle RAC, Primeiro Stand-by. | Sem tempo de inatividade |
Atualizações do Oracle Database | Upgrade incremental lógico transitório do Data Guard. Consulte: Reduzindo o Tempo de Inatividade de PeopleSoft Usando um Banco de Dados Stand-by Local. | Segundos para minutos |
Atualização e patches do Oracle Grid e Oracle Clusterware | Rolagem do Oracle RAC, Primeiro Stand-by. | Sem tempo de inatividade |
* Na prática, existem maneiras de mitigar o impacto do tempo de inatividade de upgrade estendido - por exemplo, fornecendo uma réplica somente leitura. O Oracle Consulting Services pode ajudar você a planejar e executar a atualização.