Diagnóstico e Solução de Problemas nos Sistemas Oracle Exadata Database Service on Cloud@Customer

Estes tópicos abrangem alguns problemas comuns que você pode encontrar e como resolvê-los.

Falhas de Patch nos Sistemas Oracle Exadata Database Service on Cloud@Customer
Obtendo Assistência Adicional
A Atualização do Sistema Operacional da VM é Suspensa Durante a Drenagem da Conexão do Banco de Dados
Falha ao Adicionar uma VM a um Cluster de VMs
A Lista de Nós não está Atualizada para Bancos de Dados Ativados pelo Data Guard
Falha no Dimensionamento Off-line de CPU
A Reinicialização do Banco de Dados Stand-by Falha Após o Switchover na Configuração do Oracle Data Guard do Oracle Database 11g
O Uso da Porta do Listener SCAN Personalizada com o Data Guard na Rede de Recuperação de Desastres Causa Falhas na Verificação de Associação do Data Guard
Falha na Criação do PDB Depois de Mover o Banco de Dados para um Novo Home de BD (26ai)
Falha Intermitente na Criação do PDB Quando Vários PDBs São Criados em Paralelo
Falha na Criação da Associação do Data Guard ao Usar a Rede DR

Tópico principal: Guias de Referência do Oracle Exadata Database Service on Cloud@Customer

Falhas de Aplicação de Patch nos Sistemas Oracle Exadata Database Service on Cloud@Customer

As operações de aplicação de patch podem falhar por diversos motivos. Geralmente, uma operação falha porque um nó de banco de dados está inativo, não há espaço suficiente no sistema de arquivos ou a máquina virtual não pode acessar o armazenamento de objetos.

Determinando o Problema
Na Console, você pode identificar uma operação de patch com falha, exibindo o histórico de patches de um sistema Oracle Exadata Database Service on Cloud@Customer ou de um banco de dados individual.
Solução de Problemas e Diagnóstico
Diagnostique os problemas mais comuns que podem ocorrer durante o processo de aplicação de patch de qualquer componente do Oracle Exadata Database Service on Cloud@Customer.

Tópico principal: Solução de Problemas nos Sistemas Oracle Exadata Database Service on Cloud@Customer

Determinando o Problema

Na Console, você pode identificar uma operação de patch com falha, exibindo o histórico de patches de um sistema Oracle Exadata Database Service on Cloud@Customer ou de um banco de dados individual.

Um patch que não foi aplicado com sucesso exibe o status Failed e inclui uma breve descrição do erro que causou a falha. Se a mensagem de erro não contiver informações suficientes para indicar uma solução, use a CLI do banco de dados e os arquivos de log para coletar mais dados. Em seguida, consulte a seção aplicável neste tópico para obter uma solução.

Tópico principal: Falhas de Aplicação de Patch nos Sistemas Oracle Exadata Database Service on Cloud@Customer

Diagnóstico e Solução de Problemas

Diagnostique os problemas mais comuns que podem ocorrer durante o processo de aplicação de patch de qualquer componente do Oracle Exadata Database Service on Cloud@Customer.

Problemas na VM do Servidor de Banco de Dados
Uma ou mais das condições a seguir na VM do servidor de banco de dados podem causar falha nas operações de aplicação de patch.
Problemas do Oracle Grid Infrastructure
Uma ou mais das condições a seguir no Oracle Grid Infrastructure pode fazer com que as operações de aplicação de patch falhem.
Problemas de Bancos de Dados Oracle
Um estado incorreto do banco de dados pode levar a falhas de aplicação de patch.

Tópico principal: Falhas de Aplicação de Patch nos Sistemas Oracle Exadata Database Service on Cloud@Customer

Problemas na VM do Servidor de Banco de Dados

Uma ou mais das condições a seguir na VM do servidor de banco de dados podem fazer com que as operações de aplicação de patch falhem.

Problemas de Conectividade na VM do Servidor de Banco de Dados

O conjunto de ferramentas da nuvem depende da configuração correta de rede e conectividade entre as máquinas virtuais de um determinado cluster de VMs. Se a configuração não for definida corretamente, isso poderá resultar em falhas em todas as operações que exigem processamento entre nós. Um exemplo pode não ser capaz de fazer download dos arquivos necessários para aplicar um determinado patch.

Conforme o caso, você pode executar as seguintes ações:

Verifique se a configuração de DNS está correta para que os endereços das máquinas virtuais relevantes possam ser resolvidos no cluster de VMs.
Consulte os logs relevantes do Conjunto de Ferramentas da Nuvem, conforme instruções na seção Obtendo Assistência Adicional, e entre em contato com o Suporte Técnico da Oracle para obter mais ajuda.

Tópico principal: Diagnóstico e Solução de Problemas

Problemas do Oracle Grid Infrastructure

Uma ou mais das condições a seguir no Oracle Grid Infrastructure pode fazer com que as operações de aplicação de patch falhem.

O Oracle Grid Infrastructure está Inativo

O Oracle Clusterware permite que os servidores se comuniquem uns com os outros de modo que possam funcionar como unidade coletiva. O programa de software do cluster deve estar ativo e em execução no Cluster de VMs para que as operações de aplicação de patch sejam concluídas. Às vezes, pode ser necessário reiniciar o Oracle Clusterware para resolver uma falha de aplicação de patch.

Nesses casos, verifique o status do Oracle Grid Infrastructure da seguinte forma:

./crsctl check cluster
CRS-4537: Cluster Ready Services is online
CRS-4529: Cluster Synchronization Services is online
CRS-4533: Event Manager is online

Se o Oracle Grid Infrastructure estiver inativo, reinicie executando os seguintes comandos:

crsctl start cluster -all

crsctl check cluster

Tópico principal: Diagnóstico e Solução de Problemas

Problemas nos Bancos de Dados Oracle

Um estado incorreto do banco de dados pode levar a falhas de aplicação de patch.

O Oracle Database está Inativo

O banco de dados deve estar ativo e em execução em todos os nós ativos para que as operações de aplicação de patch possam ser concluídas com sucesso no cluster.

Use o seguinte comando para verificar o estado do banco de dados e verifique se foram resolvidos quaisquer problemas que possam ter colocado o banco de dados em um estado incorreto:

srvctl status database -d db_unique_name -verbose

O sistema retorna uma mensagem incluindo o status da instância do banco de dados. O status da instância deve ser Aberto para que a operação de patch seja bem-sucedida.

Se o banco de dados não estiver em execução, use este comando para iniciá-lo:

srvctl start database -d db_unique_name -o open

Tópico principal: Diagnóstico e Solução de Problemas

Obtendo Assistência Adicional

Se não foi possível resolver o problema usando as informações deste tópico, execute os procedimentos a seguir para coletar informações relevantes sobre o banco de dados e de diagnóstico. Depois de obter essas informações, entre em contato com o Suporte Técnico da Oracle.

Coletando Logs do Conjunto de Ferramentas da Nuvem
Use os arquivos de log relevantes que possam ajudar o Suporte Técnico da Oracle a investigar e resolver melhor um determinado problema.
Coletando Diagnósticos da Oracle

Tópicos Relacionados

Suporte Técnico da Oracle

Tópico principal: Solução de Problemas nos Sistemas Oracle Exadata Database Service on Cloud@Customer

Coletando Logs do Conjunto de Ferramentas da Nuvem

Use os arquivos de log relevantes que possam ajudar o Suporte Técnico da Oracle a investigar e resolver melhor um determinado problema.

Logs do DBAASCLI

/var/opt/oracle/log/dbaascli

dbaascli.log

Tópico principal: Obtendo Assistência Adicional

Coletando Diagnósticos da Oracle

Para coletar as informações e os logs de diagnóstico relevantes da Oracle, execute o comando dbaascli diag collect.

Para obter mais informações sobre o uso desse utilitário, consulte Conjunto de Ferramentas do DBAAS: Usando o dbaascli para Coletar Logs do Conjunto de Ferramentas da Nuvem e Executar uma Verificação de Integridade do Conjunto de Ferramentas da Nuvem.

Tópicos Relacionados

Conjunto de Ferramentas do DBAAS: Usando o dbaascli para Coletar Logs do Conjunto de Ferramentas da Nuvem e Executar uma Verificação de Integridade do Conjunto de Ferramentas da Nuvem

Tópico principal: Obtendo Assistência Adicional

A Atualização do Sistema Operacional da VM é Suspensa Durante a Drenagem da Conexão do Banco de Dados

Descrição: Esse é um problema intermitente. Durante a atualização do sistema operacional da máquina virtual com o Grid Infrastructure 19c e os bancos de dados em execução, dbnodeupdate.sh aguarda que RHPhelper drene as conexões, que não terão andamento por causa de um bug conhecido "DBNODEUPDATE.SH HANGS IN RHPHELPER TO DRAIN SESSIONS AND SHUTDOWN INSTANCE".

Sintomas: Há dois resultados possíveis por causa desse bug:

A atualização do sistema operacional da VM é suspensa em rhphelper
- Suspende a automação
- Algumas ou nenhuma das conexões do banco de dados será drenada e algumas ou todas as instâncias do banco de dados permanecerão em execução.
A atualização do sistema operacional da VM não drena as conexões de banco de dados porque o rhphelper travou
- Não suspende a automação
- Algumas ou nenhuma drenagem de conexão do banco de dados é concluída

/var/log/cellos/dbnodeupdate.trc mostrará isso como última linha:

(ACTION:) Executing RHPhelper to drain sessions and shutdown instances. 
(trace:/u01/app/grid/crsdata/scaqak04dv0201/rhp//executeRHPDrain.150721125206.trc)

Ação:

Faça upgrade do Grid Infrastructure para a versão 19.11 ou acima.
(OU)

Desative rhphelper antes de atualizar e ative-o novamente após a atualização.
Para desativar antes de iniciar a atualização:
```
/u01/app/19.0.0.0/grid/srvm/admin/rhphelper /u01/app/19.0.0.0/grid 19.10.0.0.0 -setDrainAttributes ENABLE=false
```
Para ativar depois que a atualização for concluída:
```
/u01/app/19.0.0.0/grid/srvm/admin/rhphelper /u01/app/19.0.0.0/grid oracle-home-current-version -setDrainAttributes ENABLE=true
```
Se você desativar rhphelper, não haverá drenagem da conexão do banco de dados antes do shutdown de serviços e instâncias do banco de dados em um nó antes da atualização do sistema operacional.
Se você tiver esquecido de desativar o RHPhelper e o upgrade não estiver em andamento e suspenso, será observado que a drenagem dos serviços está demorando:
1. Examine o arquivo de rastreamento /var/log/cellos/dbnodeupdate.trc, que contém um parágrafo semelhante ao seguinte:
```
(ACTION:) Executing RHPhelper to drain sessions and shutdown instances. 
(trace: /u01/app/grid/crsdata/<nodename>/rhp//executeRHPDrain.150721125206.trc)
```
2. Abra o arquivo de rastreamento /var/log/cellos/dbnodeupdate.trc.
  Se rhphelper falhar, o arquivo de rastreamento conterá a mensagem da seguinte forma:
```
"Failed execution of RHPhelper"
```
  Se rhphelper for suspenso, o arquivo de rastreamento conterá a mensagem da seguinte forma:
```
(ACTION:) Executing RHPhelper to drain sessions and shutdown instances.
```
3. Identifique os processos rhphelper em execução no nível do sistema operacional e elimine-os.
  Há dois comandos que terão a string "rhphelper" no nome - um shell Bash e o programa Java subjacente, que na verdade é rhphelper em execução.
  
  rhphelper é executado como root; portanto, deve ser eliminado como root (sudo de opc).
  Por exemplo:
```
[opc@<HOST> ~] pgrep –lf rhphelper
191032 rhphelper
191038 java
```
```
[opc@<HOST> ~] sudo kill –KILL 191032 191038
```
4. Verifique se o arquivo dbnodeupdate.trc é movido e se a pilha do Grid Infrastructure no nó é encerrada.
Para obter mais informações sobre o RHPhelper, consulte Usando o RHPhelper para Minimizar a Inatividade Durante a Manutenção Planejada no Exadata (ID do Documento 2385790.1).

Tópicos Relacionados

Usando o RHPhelper para Minimizar a Inatividade Durante a Manutenção Planejada no Exadata (ID do Documento 2385790.1)

Tópico principal: Solução de Problemas nos Sistemas Oracle Exadata Database Service on Cloud@Customer

Falha ao Adicionar uma VM a um Cluster de VMs

Descrição: Ao adicionar uma VM a um cluster de VMs, você poderá encontrar o seguinte problema:

[FATAL] [INS-32156] Installer has detected that there are non-readable files in oracle home.
CAUSE: Following files are non-readable, due to insufficient permission oracle.ahf/data/scaqak03dv0104/diag/tfa/tfactl/user_root/tfa_client.trc
ACTION: Ensure the above files are readable by grid.

Causa: O instalador detectou um arquivo de rastreamento ilegível, oracle.ahf/data/scaqak03dv0104/diag/tfa/tfactl/user_root/tfa_client.trc criado pelo Autonomous Health Framework (AHF) no Oracle home que causa a falha na adição de uma VM no cluster.

O AHF foi executado como root criou um arquivo trc com propriedade root, que o usuário grid não pode ler.

Ação: Certifique-se de que os arquivos de rastreamento AHF possam ser lidos pelo usuário grid antes de adicionar VMs a um cluster de VMs. Para corrigir o problema de permissão, execute os seguintes comandos como root em todas as VMs do cluster de VMs existentes:

chown grid:oinstall /u01/app/19.0.0.0/grid/srvm/admin/logging.properties

chown -R grid:oinstall /u01/app/19.0.0.0/grid/oracle.ahf*

chown -R grid:oinstall /u01/app/grid/oracle.ahf*

Tópico principal: Solução de Problemas nos Sistemas Oracle Exadata Database Service on Cloud@Customer

A Lista de Nós não está Atualizada para Bancos de Dados Ativados pelo Data Guard

Descrição: A adição de uma VM a um cluster de VMs é concluída com sucesso; no entanto, para bancos de dados ativados pelo Data Guard, a nova VM não é adicionada à lista de nós no arquivo /var/opt/oracle/creg/<db>.ini.

Causa: Os bancos de dados ativados pelo Data Guard não serão estendidos para a VM recém-adicionada. Portanto, o arquivo <db>.ini também não será atualizado porque a instância do banco de dados não está configurada na nova VM.

Ação: Para adicionar uma instância aos bancos de dados principal e stand-by e às novas VMs (não relacionadas ao Data Guard) e para remover uma instância de um ambiente do Data Guard, consulte a Nota 2811352.1 do My Oracle Support.

Tópicos Relacionados

https://support.oracle.com/epmos/faces/DocContentDisplay?id=2811352.1

Tópico principal: Solução de Problemas nos Sistemas Oracle Exadata Database Service on Cloud@Customer

Falha no Dimensionamento Off-line da CPU

Descrição: O dimensionamento off-line de CPU falha com o seguinte erro:

** CPU Scale Update **An error occurred during module execution. Please refer to the log file for more information

Causa: Após o provisionamento de um cluster de VMs, o arquivo /var/opt/oracle/cprops/cprops.ini, que é gerado automaticamente pelo banco de dados como serviço (DBaaS) não é atualizado com os parâmetros common_dcs_agent_bindHost e common_dcs_agent_port e isso faz com que o dimensionamento off-line de CPU falhe.

Ação: Como usuário root, adicione manualmente as entradas a seguir no arquivo /var/opt/oracle/cprops/cprops.ini.

common_dcs_agent_bindHost=<IP_Address>
common_dcs_agent_port=7070

Observação

O valor common_dcs_agent_port é 7070 sempre.

Execute o seguinte comando para obter o endereço IP:

netstat -tunlp | grep 7070

Por exemplo:

netstat -tunlp | grep 7070
tcp 0 0 <IP address 1>:7070 0.0.0.0:* LISTEN 42092/java
tcp 0 0 <IP address 2>:7070 0.0.0.0:* LISTEN 42092/java

Você pode especificar um dos dois endereços IP, <IP address 1> ou <IP address 2>, para o parâmetro common_dcs_agent_bindHost.

Tópico principal: Solução de Problemas nos Sistemas Oracle Exadata Database Service on Cloud@Customer

A Reinicialização do Banco de Dados Stand-by Falha Após o Switchover na Configuração do Oracle Data Guard do Oracle Database 11g

Descrição: Após a execução do switchover, o novo banco de dados stand-by (antigo principal) permanece encerrado e falha ao ser reiniciado.

Ação: Depois de executar o switchover, faça o seguinte:

Reinicie o banco de dados stand-by usando o comando srvctl start database -db <standby dbname>.
Recarregue o listener como usuário grid em todos os nós de cluster principal e stand-by.
- Para recarregar o listener usando alta disponibilidade, faça download do patch 25075940 e aplique-o ao Grid home e, em seguida, execute lsnrctl reload -with_ha.
- Para recarregar o listener, execute lsrnctl reload.

Após recarregar o listener, verifique se os serviços <dbname>_DGMGRL foram carregados no listener usando o comando lsnrctl status.

Para fazer download do patch 25075940

Efetue Log-in em My Oracle Support.
Clique em Patches e Atualizações.
Selecione Número do Bug na lista drop-down Número/Nome ou Número do Bug (Simples).
Informe o número do bug 34741066 e clique em Pesquisar.
Nos resultados da pesquisa, clique no nome do patch mais recente.
Você será redirecionado para a página Patch 34741066: LSNRCTL RELOAD -WITH_HA FAILED TO READ THE STATIC ENTRY IN LISTENER.ORA.
Clique em Fazer Download.

Tópico principal: Solução de Problemas nos Sistemas Oracle Exadata Database Service on Cloud@Customer

O Uso da Porta do Listener SCAN Personalizada com o Data Guard na Rede de Recuperação de Desastre Causa Falhas na Verificação de Associação do Data Guard

Descrição: Se a porta do listener SCAN para a rede do cliente e a rede de recuperação de desastres (rede de DR) forem diferentes, a configuração do Data Guard (DG) falhará durante a fase de verificação da associação de criação do data guard.

Ação: Use as mesmas portas de listener SCAN (ou porta padrão) em todas as redes. Para corrigir a porta do listener após a configuração do cluster, execute o comando GI home/bin/srvctl modify listener -listener listener_name -endpoints endpoints. Para obter mais informações, consulte srvctl modify listener no Oracle Real Application Clusters Administration and Deployment Guide.

Tópico principal: Solução de Problemas nos Sistemas Oracle Exadata Database Service on Cloud@Customer

Falha na Criação do PDB Depois de Mover o Banco de Dados para um Novo Home de Banco de Dados (26ai)

Descrição: Após a realocação de um banco de dados para outro Home de Banco de Dados, a criação de um novo PDB (Banco de Dados Plugável) falha. Falha na inicialização do serviço PDB, resultando no seguinte erro:

[FATAL] [DBAAS-60022] Command '/u02/app/oracle/product/23.0.0.0/dbhome_3/bin/srvctl 'start' 'service' '-db' 'db23ano' '-service' 'db23ano_PDBJULY242.paas.oracle.com'' has failed on nodes [localnode].

Ação: Se a versão do Grid Infrastructure for 23.4.0.24.05, faça upgrade para a versão 23.5.0.24.07 para resolver esse problema.

Tópico principal: Diagnosticando e Solucionando Problemas nos Sistemas Oracle Exadata Database Service on Cloud@Customer

Falha Intermitente na Criação do PDB Quando Vários PDBs São Criados em Paralelo

Descrição: A criação do PDB pode falhar para o subconjunto de PDBs quando vários PDBs estão sendo criados em paralelo.

Causa: A criação do PDB pode notar o seguinte erro intermitentemente.

ORA-03113: end-of-file on communication channel

Ação: Repita a criação do PDB com falha.

Tópico principal: Diagnosticando e Solucionando Problemas nos Sistemas Oracle Exadata Database Service on Cloud@Customer

Falha na Criação da Associação do Data Guard ao Usar a Rede de DR

Descrição:

Uma falha de workflow pode ocorrer ao criar uma associação do Data Guard na rede DR (Recuperação de Desastre) (terceira NIC instalada por meio de uma exceção PM). Embora o sistema esteja configurado com uma rede DR, o fluxo de trabalho ainda requer conectividade através da rede cliente por padrão. Em ambientes onde a comunicação cliente-rede entre os dois data centers é restrita, a criação da associação falhará.

Causa:

Por padrão, o workflow de associação do Data Guard tenta usar a rede cliente, mesmo quando existe uma rede de DR. Se as instâncias do banco de dados não forem registradas no listener da rede DR, o workflow retornará à rede do cliente, resultando em uma falha quando os caminhos da rede cliente estiverem bloqueados ou indisponíveis.

Ação:

Registre as instâncias do banco de dados com o listener na rede de DR atualizando o parâmetro listener_networks. Isso garante que o workflow use a rede DR exclusivamente para a associação do Data Guard.

Exemplo de configuração

Instância 1

(( NAME=net2)
 (LOCAL_LISTENER=
   (DESCRIPTION=
     (ADDRESS=(PROTOCOL=TCP)(HOST=VIPDR-1)(PORT=1521))
   )
 )
),
(( NAME=net2)(REMOTE_LISTENER=SCAN-DR-NAME:1521))

Instância 2

(( NAME=net2)
 (LOCAL_LISTENER=
   (DESCRIPTION=
     (ADDRESS=(PROTOCOL=TCP)(HOST=VIPDR-2)(PORT=1521))
   )
 )
),
(( NAME=net2)(REMOTE_LISTENER=SCAN-DR-NAME:1521))

Resumo:

Embora uma rede DR esteja disponível, o workflow ainda requer conectividade cliente-rede por padrão durante a criação da associação do Data Guard.
Para usar apenas a rede DR, você deve registrar manualmente o serviço no listener de rede DR usando o parâmetro listener_networks.
Depois que o listener for atualizado e o serviço for registrado corretamente, o workflow de associação do Data Guard prosseguirá pela rede de DR em vez da rede cliente.

Tópico principal: Diagnosticando e Solucionando Problemas dos Sistemas Oracle Exadata Database Service on Cloud@Customer

Documentação do Oracle Cloud Infrastructure

Diagnóstico e Solução de Problemas nos Sistemas Oracle Exadata Database Service on Cloud@Customer

Falhas de Aplicação de Patch nos Sistemas Oracle Exadata Database Service on Cloud@Customer

Determinando o Problema

Diagnóstico e Solução de Problemas

Problemas na VM do Servidor de Banco de Dados

Problemas do Oracle Grid Infrastructure

Problemas nos Bancos de Dados Oracle

Obtendo Assistência Adicional

Coletando Logs do Conjunto de Ferramentas da Nuvem

Coletando Diagnósticos da Oracle

A Atualização do Sistema Operacional da VM é Suspensa Durante a Drenagem da Conexão do Banco de Dados

Falha ao Adicionar uma VM a um Cluster de VMs

A Lista de Nós não está Atualizada para Bancos de Dados Ativados pelo Data Guard

Falha no Dimensionamento Off-line da CPU

A Reinicialização do Banco de Dados Stand-by Falha Após o Switchover na Configuração do Oracle Data Guard do Oracle Database 11g

O Uso da Porta do Listener SCAN Personalizada com o Data Guard na Rede de Recuperação de Desastre Causa Falhas na Verificação de Associação do Data Guard

Falha na Criação do PDB Depois de Mover o Banco de Dados para um Novo Home de Banco de Dados (26ai)

Falha Intermitente na Criação do PDB Quando Vários PDBs São Criados em Paralelo

Falha na Criação da Associação do Data Guard ao Usar a Rede de DR