Diagnóstico e Solução de Problemas nos Sistemas Oracle Exadata Database Service on Cloud@Customer
Estes tópicos abrangem alguns problemas comuns que você pode encontrar e como resolvê-los.
- Falhas de Patch nos Sistemas Oracle Exadata Database Service on Cloud@Customer
- Obtendo Assistência Adicional
- A Atualização do Sistema Operacional da VM é Suspensa Durante a Drenagem da Conexão do Banco de Dados
- Falha ao Adicionar uma VM a um Cluster de VMs
- A Lista de Nós não está Atualizada para Bancos de Dados Ativados pelo Data Guard
- Falha no Dimensionamento Off-line de CPU
- A Reinicialização do Banco de Dados Stand-by Falha Após o Switchover na Configuração do Oracle Data Guard do Oracle Database 11g
- O Uso da Porta do Listener SCAN Personalizada com o Data Guard na Rede de Recuperação de Desastres Causa Falhas na Verificação de Associação do Data Guard
- Falha na Criação do PDB Depois de Mover o Banco de Dados para um Novo Home de Banco de Dados (23ai)
- Falha Intermitente na Criação do PDB Quando Vários PDBs São Criados em Paralelo
Tópico principal: Guias de Referência do Oracle Exadata Database Service on Cloud@Customer
Falhas de Aplicação de Patch nos Sistemas Oracle Exadata Database Service on Cloud@Customer
As operações de aplicação de patch podem falhar por diversos motivos. Geralmente, uma operação falha porque um nó de banco de dados está inativo, não há espaço suficiente no sistema de arquivos ou a máquina virtual não pode acessar o armazenamento de objetos.
- Determinando o Problema
Na Console, você pode identificar uma operação de patch com falha, exibindo o histórico de patches de um sistema Oracle Exadata Database Service on Cloud@Customer ou de um banco de dados individual. - Solução de Problemas e Diagnóstico
Diagnostique os problemas mais comuns que podem ocorrer durante o processo de aplicação de patch de qualquer componente do Oracle Exadata Database Service on Cloud@Customer.
Determinando o Problema
Na Console, você pode identificar uma operação de patch com falha, exibindo o histórico de patches de um sistema Oracle Exadata Database Service on Cloud@Customer ou de um banco de dados individual.
Um patch que não foi aplicado com sucesso exibe o status Failed
e inclui uma breve descrição do erro que causou a falha. Se a mensagem de erro não contiver informações suficientes para indicar uma solução, use a CLI do banco de dados e os arquivos de log para coletar mais dados. Em seguida, consulte a seção aplicável neste tópico para obter uma solução.
Diagnóstico e Solução de Problemas
Diagnostique os problemas mais comuns que podem ocorrer durante o processo de aplicação de patch de qualquer componente do Oracle Exadata Database Service on Cloud@Customer.
- Problemas na VM do Servidor de Banco de Dados
Uma ou mais das condições a seguir na VM do servidor de banco de dados podem causar falha nas operações de aplicação de patch. - Problemas do Oracle Grid Infrastructure
Uma ou mais das condições a seguir no Oracle Grid Infrastructure pode fazer com que as operações de aplicação de patch falhem. - Problemas de Bancos de Dados Oracle
Um estado incorreto do banco de dados pode levar a falhas de aplicação de patch.
Problemas na VM do Servidor de Banco de Dados
Uma ou mais das condições a seguir na VM do servidor de banco de dados podem fazer com que as operações de aplicação de patch falhem.
Problemas de Conectividade na VM do Servidor de Banco de Dados
O conjunto de ferramentas da nuvem depende da configuração correta de rede e conectividade entre as máquinas virtuais de um determinado cluster de VMs. Se a configuração não for definida corretamente, isso poderá resultar em falhas em todas as operações que exigem processamento entre nós. Um exemplo pode não ser capaz de fazer download dos arquivos necessários para aplicar um determinado patch.
Conforme o caso, você pode executar as seguintes ações:
- Verifique se a configuração de DNS está correta para que os endereços das máquinas virtuais relevantes possam ser resolvidos no cluster de VMs.
- Consulte os logs relevantes do Conjunto de Ferramentas da Nuvem, conforme instruções na seção Obtendo Assistência Adicional, e entre em contato com o Suporte Técnico da Oracle para obter mais ajuda.
Tópico principal: Diagnóstico e Solução de Problemas
Problemas do Oracle Grid Infrastructure
Uma ou mais das condições a seguir no Oracle Grid Infrastructure pode fazer com que as operações de aplicação de patch falhem.
O Oracle Grid Infrastructure está Inativo
O Oracle Clusterware permite que os servidores se comuniquem uns com os outros de modo que possam funcionar como unidade coletiva. O programa de software do cluster deve estar ativo e em execução no Cluster de VMs para que as operações de aplicação de patch sejam concluídas. Às vezes, pode ser necessário reiniciar o Oracle Clusterware para resolver uma falha de aplicação de patch.
./crsctl check cluster
CRS-4537: Cluster Ready Services is online
CRS-4529: Cluster Synchronization Services is online
CRS-4533: Event Manager is online
crsctl start cluster -all
crsctl check cluster
Tópico principal: Diagnóstico e Solução de Problemas
Problemas nos Bancos de Dados Oracle
Um estado incorreto do banco de dados pode levar a falhas de aplicação de patch.
O Oracle Database está Inativo
O banco de dados deve estar ativo e em execução em todos os nós ativos para que as operações de aplicação de patch possam ser concluídas com sucesso no cluster.
srvctl status database -d db_unique_name -verbose
O sistema retorna uma mensagem incluindo o status da instância do banco de dados. O status da instância deve ser Aberto para que a operação de patch seja bem-sucedida.
srvctl start database -d db_unique_name -o open
Tópico principal: Diagnóstico e Solução de Problemas
Obtendo Assistência Adicional
Se não foi possível resolver o problema usando as informações deste tópico, execute os procedimentos a seguir para coletar informações relevantes sobre o banco de dados e de diagnóstico. Depois de obter essas informações, entre em contato com o Suporte Técnico da Oracle.
- Coletando Logs do Conjunto de Ferramentas da Nuvem
Use os arquivos de log relevantes que possam ajudar o Suporte Técnico da Oracle a investigar e resolver melhor um determinado problema. - Coletando Diagnósticos da Oracle
Tópicos Relacionados
Coletando Logs do Conjunto de Ferramentas da Nuvem
Use os arquivos de log relevantes que possam ajudar o Suporte Técnico da Oracle a investigar e resolver melhor um determinado problema.
Logs do DBAASCLI
/var/opt/oracle/log/dbaascli
dbaascli.log
Tópico principal: Obtendo Assistência Adicional
Coletando Diagnósticos da Oracle
Para coletar as informações e os logs de diagnóstico relevantes da Oracle, execute o comando dbaascli diag collect
.
Para obter mais informações sobre o uso desse utilitário, consulte Conjunto de Ferramentas do DBAAS: Usando o dbaascli para Coletar Logs do Conjunto de Ferramentas da Nuvem e Executar uma Verificação de Integridade do Conjunto de Ferramentas da Nuvem.
A Atualização do Sistema Operacional da VM é Suspensa Durante a Drenagem da Conexão do Banco de Dados
Descrição: Esse é um problema intermitente. Durante a atualização do sistema operacional da máquina virtual com o Grid Infrastructure 19c e os bancos de dados em execução, dbnodeupdate.sh
aguarda que RHPhelper
drene as conexões, que não terão andamento por causa de um bug conhecido "DBNODEUPDATE.SH HANGS IN RHPHELPER TO DRAIN SESSIONS AND SHUTDOWN INSTANCE".
- A atualização do sistema operacional da VM é suspensa em
rhphelper
- Suspende a automação
- Algumas ou nenhuma das conexões do banco de dados será drenada e algumas ou todas as instâncias do banco de dados permanecerão em execução.
- A atualização do sistema operacional da VM não drena as conexões de banco de dados porque o
rhphelper
travou- Não suspende a automação
- Algumas ou nenhuma drenagem de conexão do banco de dados é concluída
/var/log/cellos/dbnodeupdate.trc
mostrará isso como última linha:
(ACTION:) Executing RHPhelper to drain sessions and shutdown instances. (trace:/u01/app/grid/crsdata/scaqak04dv0201/rhp//executeRHPDrain.150721125206.trc)
- Faça upgrade do Grid Infrastructure para a versão 19.11 ou acima.
(OU)
Desative
rhphelper
antes de atualizar e ative-o novamente após a atualização.Para desativar antes de iniciar a atualização:/u01/app/19.0.0.0/grid/srvm/admin/rhphelper /u01/app/19.0.0.0/grid 19.10.0.0.0 -setDrainAttributes ENABLE=false
Para ativar depois que a atualização for concluída:/u01/app/19.0.0.0/grid/srvm/admin/rhphelper /u01/app/19.0.0.0/grid oracle-home-current-version -setDrainAttributes ENABLE=true
Se você desativar
rhphelper
, não haverá drenagem da conexão do banco de dados antes do shutdown de serviços e instâncias do banco de dados em um nó antes da atualização do sistema operacional. - Se você tiver esquecido de desativar o RHPhelper e o upgrade não estiver em andamento e suspenso, será observado que a drenagem dos serviços está demorando:
- Examine o arquivo de rastreamento
/var/log/cellos/dbnodeupdate.trc
, que contém um parágrafo semelhante ao seguinte:(ACTION:) Executing RHPhelper to drain sessions and shutdown instances. (trace: /u01/app/grid/crsdata/<nodename>/rhp//executeRHPDrain.150721125206.trc)
- Abra o arquivo de rastreamento
/var/log/cellos/dbnodeupdate.trc
.Serhphelper
falhar, o arquivo de rastreamento conterá a mensagem da seguinte forma:"Failed execution of RHPhelper"
Serhphelper
for suspenso, o arquivo de rastreamento conterá a mensagem da seguinte forma:(ACTION:) Executing RHPhelper to drain sessions and shutdown instances.
- Identifique os processos
rhphelper
em execução no nível do sistema operacional e elimine-os.Há dois comandos que terão a string "rhphelper" no nome - um shell Bash e o programa Java subjacente, que na verdade é
rhphelper
em execução.rhphelper
é executado comoroot
; portanto, deve ser eliminado comoroot
(sudo
deopc
).Por exemplo:[opc@<HOST> ~] pgrep –lf rhphelper 191032 rhphelper 191038 java
[opc@<HOST> ~] sudo kill –KILL 191032 191038
- Verifique se o arquivo
dbnodeupdate.trc
é movido e se a pilha do Grid Infrastructure no nó é encerrada.
Para obter mais informações sobre o RHPhelper, consulte Usando o RHPhelper para Minimizar a Inatividade Durante a Manutenção Planejada no Exadata (ID do Documento 2385790.1).
- Examine o arquivo de rastreamento
Falha ao Adicionar uma VM a um Cluster de VMs
[FATAL] [INS-32156] Installer has detected that there are non-readable files in oracle home. CAUSE: Following files are non-readable, due to insufficient permission oracle.ahf/data/scaqak03dv0104/diag/tfa/tfactl/user_root/tfa_client.trc ACTION: Ensure the above files are readable by grid.
Causa: O instalador detectou um arquivo de rastreamento ilegível, oracle.ahf/data/scaqak03dv0104/diag/tfa/tfactl/user_root/tfa_client.trc
criado pelo Autonomous Health Framework (AHF) no Oracle home que causa a falha na adição de uma VM no cluster.
O AHF foi executado como root
criou um arquivo trc
com propriedade root
, que o usuário grid
não pode ler.
grid
antes de adicionar VMs a um cluster de VMs. Para corrigir o problema de permissão, execute os seguintes comandos como root
em todas as VMs do cluster de VMs existentes:chown grid:oinstall /u01/app/19.0.0.0/grid/srvm/admin/logging.properties
chown -R grid:oinstall /u01/app/19.0.0.0/grid/oracle.ahf*
chown -R grid:oinstall /u01/app/grid/oracle.ahf*
A Lista de Nós não está Atualizada para Bancos de Dados Ativados pelo Data Guard
Descrição: A adição de uma VM a um cluster de VMs é concluída com sucesso; no entanto, para bancos de dados ativados pelo Data Guard, a nova VM não é adicionada à lista de nós no arquivo /var/opt/oracle/creg/<db>.ini
.
Causa: Os bancos de dados ativados pelo Data Guard não serão estendidos para a VM recém-adicionada. Portanto, o arquivo <db>.ini
também não será atualizado porque a instância do banco de dados não está configurada na nova VM.
Ação: Para adicionar uma instância aos bancos de dados principal e stand-by e às novas VMs (não relacionadas ao Data Guard) e para remover uma instância de um ambiente do Data Guard, consulte a Nota 2811352.1 do My Oracle Support.
Tópicos Relacionados
Falha no Dimensionamento Off-line da CPU
** CPU Scale Update **An error occurred during module execution. Please refer to the log file for more information
Causa: Após o provisionamento de um cluster de VMs, o arquivo /var/opt/oracle/cprops/cprops.ini
, que é gerado automaticamente pelo banco de dados como serviço (DBaaS) não é atualizado com os parâmetros common_dcs_agent_bindHost
e common_dcs_agent_port
e isso faz com que o dimensionamento off-line de CPU falhe.
root
, adicione manualmente as entradas a seguir no arquivo /var/opt/oracle/cprops/cprops.ini
.common_dcs_agent_bindHost=<IP_Address>
common_dcs_agent_port=7070
O valor
common_dcs_agent_port
é 7070 sempre.
netstat -tunlp | grep 7070
netstat -tunlp | grep 7070
tcp 0 0 <IP address 1>:7070 0.0.0.0:* LISTEN 42092/java
tcp 0 0 <IP address 2>:7070 0.0.0.0:* LISTEN 42092/java
Você pode especificar um dos dois endereços IP, <IP address 1> ou <IP address 2>, para o parâmetro common_dcs_agent_bindHost
.
A Reinicialização do Banco de Dados Stand-by Falha Após o Switchover na Configuração do Oracle Data Guard do Oracle Database 11g
Descrição: Após a execução do switchover, o novo banco de dados stand-by (antigo principal) permanece encerrado e falha ao ser reiniciado.
Ação: Depois de executar o switchover, faça o seguinte:
- Reinicie o banco de dados stand-by usando o comando
srvctl start database -db <standby dbname>
. - Recarregue o listener como usuário
grid
em todos os nós de cluster principal e stand-by.- Para recarregar o listener usando alta disponibilidade, faça download do patch 25075940 e aplique-o ao Grid home e, em seguida, execute
lsnrctl reload -with_ha
. - Para recarregar o listener, execute
lsrnctl reload
.
- Para recarregar o listener usando alta disponibilidade, faça download do patch 25075940 e aplique-o ao Grid home e, em seguida, execute
Após recarregar o listener, verifique se os serviços <dbname>_DGMGRL
foram carregados no listener usando o comando lsnrctl status
.
Para fazer download do patch 25075940
- Efetue Log-in em My Oracle Support.
- Clique em Patches e Atualizações.
- Selecione Número do Bug na lista drop-down Número/Nome ou Número do Bug (Simples).
- Informe o número do bug 34741066 e clique em Pesquisar.
- Nos resultados da pesquisa, clique no nome do patch mais recente.
Você será redirecionado para a página Patch 34741066: LSNRCTL RELOAD -WITH_HA FAILED TO READ THE STATIC ENTRY IN LISTENER.ORA.
- Clique em Fazer Download.
O Uso da Porta do Listener SCAN Personalizada com o Data Guard na Rede de Recuperação de Desastre Causa Falhas na Verificação de Associação do Data Guard
Descrição: Se a porta do listener SCAN para a rede do cliente e a rede de recuperação de desastres (rede de DR) forem diferentes, a configuração do Data Guard (DG) falhará durante a fase de verificação da associação de criação do data guard.
Ação: Use as mesmas portas de listener SCAN (ou porta padrão) em todas as redes. Para corrigir a porta do listener após a configuração do cluster, execute o comando GI home/bin/srvctl modify listener -listener listener_name -endpoints endpoints
. Para obter mais informações, consulte srvctl modify listener no Oracle Real Application Clusters Administration and Deployment Guide.
Falha na Criação do PDB Depois de Mover o Banco de Dados para um Novo Home de Banco de Dados (23ai)
[FATAL] [DBAAS-60022] Command '/u02/app/oracle/product/23.0.0.0/dbhome_3/bin/srvctl 'start' 'service' '-db' 'db23ano' '-service' 'db23ano_PDBJULY242.paas.oracle.com'' has failed on nodes [localnode].
Ação: Se a versão do Grid Infrastructure for 23.4.0.24.05, faça upgrade para a versão 23.5.0.24.07 para resolver esse problema.
Falha Intermitente na Criação do PDB Quando Vários PDBs São Criados em Paralelo
Descrição: A criação do PDB pode falhar para o subconjunto de PDBs quando vários PDBs estão sendo criados em paralelo.
ORA-03113: end-of-file on communication channel
Ação: Repita a criação do PDB com falha.