Diagnosticar e Solucionar Problemas do Stack Monitoring
Os tópicos desta seção fornecem informações de solução de problemas para identificar e tratar problemas comuns que podem ocorrer durante o trabalho com o Stack Monitoring.
- Solucionar Problemas Gerais
- Solucionar Problemas de uma Janela de Manutenção
- Diagnosticar e Solucionar Problemas do Policy Manager
- Solucionar problemas de um host
- Diagnosticar e Solucionar Problemas do EBS
- Diagnosticar e Solucionar Problemas do OUD
- Diagnosticar e Solucionar Problemas do PeopleSoft
- Diagnosticar e Solucionar Problemas do SOA
Solucionar Problemas Gerais
Em alguns casos, pode ser necessário revisar os logs do Management Agent para obter detalhes adicionais:
Para o plug-in do Management Agent no Oracle Cloud Agent (OCA) nas Instâncias do OCI Compute:
/var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/log/mgmt_agent.log
Para o Agente de Gerenciamento Standalone (agente instalado manualmente):
/opt/oracle/mgmt_agent/agent_inst/log/mgmt_agent.log
As novas permissões em resource-types não são propagadas
Isso acontece porque o serviço IAM não recompila uma política, a menos que haja uma alteração na instrução da política.
Para qualquer política existente que use tipos de recursos, quando novas permissões forem adicionadas ao tipo de recurso, edite a política adicionando um espaço em branco. Em seguida, salve a política.
Para obter mais informações, consulte Novas permissões em tipos de recursos não são propagadas.
Isso acontece quando uma Definição de Chave de Tag com um Value Type=List
inclui uma variável de tag como um elemento. A atribuição dessa tag a um recurso funciona inicialmente. No entanto, a validação falha durante ações como atualizar ou designar uma nova tag, resultando no erro Tags inválidas.
Uso Correto:
- As variáveis de tag podem ser usadas em tags padrão, mas não são suportadas em tags definidas com valores predefinidos (listas).
- Uma Definição de Chave de Tag não pode incluir variáveis de tag como valores de lista predefinidos.
Para obter mais informações, consulte Tagging.
Diagnosticar e Solucionar Problemas de uma Janela de Manutenção
Repetir uma Janela de Manutenção
Uma nova tentativa só poderá ser executada depois que uma operação for marcada como Sucesso Parcial, para Janelas de Manutenção Ativas.
Acesse o menu de ações da Janela de Manutenção para acessar a opção Repetir.
Topologia atualizada
Quando um recurso altera sua topologia, como um cluster adicionando ou removendo um ou vários de seus servidores, a Janela de Manutenção não é atualizada automaticamente. Para atualizar os recursos incluídos na Janela de Manutenção após uma alteração de topologia, é necessário editar a Janela de Manutenção de acordo com a nova topologia do recurso.
Janela de Manutenção mantida no estado "Criando"
Se uma Janela de Manutenção tiver sido mantida no estado "Criando" por mais de 10 minutos, a Janela de Manutenção poderá ser interrompida selecionando Interromper no menu de 3 pontos.
Se a Janela de Manutenção tiver sido paralisada por menos de 10 minutos, a Janela de Manutenção não poderá interromper o processo de criação.
Diagnosticar e Solucionar Problemas do Policy Manager
Cota de política atingida

Certifique-se de que novas políticas possam ser criadas na tenancy ou use políticas existentes (a política deve existir no compartimento atual e no compartimento raiz). Para permitir a criação de novas políticas, a tenancy limpa políticas desatualizadas ou trabalha com a Oracle para aumentar os limites da política. Depois que novas políticas puderem ser criadas, repita a configuração.
Não é possível criar a ativação automática do serviço Compute
O Policy Manager espera que as configurações do Stack Monitoring estejam no status ACTIVE, pois você pode ter uma dessas configurações no compartimento. Se houver configurações com status inesperado, a criação da configuração falhará.

Configurações de limpeza em estado inválido no compartimento atual. Para limpeza, use SDK ou CLI públicos, como o comando delete.
Solucionar problemas de um host
Falha na descoberta do host do Windows
Erro:
[host] Discovery failure: ExecutionException: FetchletException: Process invocation failure: java.io.IOException:
Cannot run program "powershell.exe": CreateProcess error=2,
The system cannot find the file specified due to FetchletException: Process invocat...;
Solução:
Execute as etapas abaixo para adicionar PowerShell em Variáveis do sistema do host do Windows.
- Abra o Painel de Controle do Sistema e selecione Sistema. Selecione Definições Avançadas do Sistema, vá para a guia Avançado e selecione Variáveis de Ambiente.
- Em Variáveis do Sistema, edite
Path
e certifique-se de que o caminho abaixo tenha sido adicionado:%SYSTEMROOT%\System32\WindowsPowerShell\v1.0\
- Repetir descoberta.
Diagnosticar e Solucionar Problemas do EBS
Banco de Dados EBS com Redefinição Baseada em Edição (EBR)
Solução: Para instâncias do EBS com o EBR ativado, após cada nova edição criada no banco de dados, é necessário atualizar o recurso do EBS para atualizar conexões desatualizadas para edições antigas mantidas pelo agente de gerenciamento e continuar a coleta de métricas. Se não for atualizado, os dados de métricas deixarão de ser coletados.
Falha na Descoberta do EBS Weblogic "Exceção Inesperada em decorrência de IOException
Possível causa: Credenciais incorretas do Agente de Gerenciamento ou do host do agente selecionadas para a Descoberta de Recursos. Não é possível estabelecer uma conexão para executar a operação de descoberta.
Solução: Informe novamente os detalhes do agente e do host e tente novamente. Se não existir um Agente de Gerenciamento, instale um Agente de Gerenciamento (consulte Instalar Agente de Gerenciamento) e repita a tarefa Descoberta de Recursos.
Diagnosticar e Solucionar Problemas do OUD
Os logs podem ser encontrados em <CUSTOM_EXPORTER_DIRECTORY_PATH>/logs
.
Se o exportador do OUD tiver sido configurado com sucesso, mas nenhuma métrica estiver sendo carregada no serviço de Telemetria, consulte os logs do Management Agent, localizados em <MANAGEMENT_AGENT_INSTALLATION_DIRECTORY>/log
e procure seu OUD <RESOURCE_NAME>
.
Diagnosticar e Solucionar Problemas do PeopleSoft
Comportamento do Job de Descoberta
Ao executar um job de descoberta PeopleSoft, cada item de trabalho do Domínio do Process Scheduler gera um log. Registra detalhes de sucessos e erros (como um domínio sendo desativado). Cada entrada de log inclui um ID Item de Trabalho para facilitar o rastreamento.
Mensagens de Erro da Discovery
Erro na validação do banco de dados
Quando um job de descoberta falhar, use o ID do Item de Trabalho (WI) para procurar mensagens detalhadas. Se o seu banco de dados mostrar o status como Sem Relatório, certifique-se de que o usuário de monitoramento não tenha expirado. Se expirar, redefina sua senha.
Erros comuns e suas correções incluem:
Credenciais Inválidas:
- Erro:
Invalid username/password, logon denied
- Causa: nome de usuário ou senha incorreta.
- Solução: Informe novamente as credenciais corretas na seção Credenciais do Banco de Dados.
- Erro:
IO Error: The Network Adapter could not establish a connection due to UnknownHostException. Name or service not known
- Causa: Host incorreto ou com erro de ortografia na seção Banco de Dados PSFT.
- Solução: Corrija o nome do host e repita o job de descoberta.
- Erro:
Connection refused, socket connect lapse
- Causa: número de porta incorreto.
- Solução: Informe a porta correta do banco de dados e tente novamente.
- Erro:
Failed to connect: java.sql.SQLException: ORA-01017: invalid username/password
- Causa: O caractere numérico inicial da senha DBSNMP é a causa raiz, pois está em conflito com as especificações de monitoramento do Stack.
- Solução: Para resolver isso, modifique sua senha DBSNMP, garantindo que ela comece com um caractere alfabético ou um sublinhado. Isso garante a conformidade com os padrões de monitoramento do Stack. Em seguida, atualize seus arquivos ou definições de configuração de monitoramento com as novas credenciais de senha. Em seguida, inicie um processo de redescoberta.
Erro de Listener:
- Erro:
Listener refused the connection with the following error: ORA-12514, TNS: listener does not currently know of service requested in connect descriptor
- Causa: Nome incorreto do serviço de banco de dados.
- Solução: Informe o Nome do Serviço de Banco de Dados correto na seção Banco de Dados PSFT.
Os recursos do Domínio do Process Scheduler estão sendo exibidos como inativos:
- Erro: O log do agente mostra o erro:
“WARN - failed to connect for cache: url service:jmx:rmi:///jndi/rmi://<ps_domain_host>:<admin_port>/<domain_name>/DomainRuntime/DefaultConnector
- Causa: A conexão JMX do host do Agente de Monitoramento com o Domínio do Process Scheduler falhou devido a uma alteração no número da Porta de Administração do Domínio.
- Solução: Reinicie o domínio no
psadmin
e atualize o Peoplesoft conforme descrito em PeopleSoft Refresh.
Erro na validação das famílias de recursos
PeopleSoft tem as seguintes famílias de recursos:
- Domínio do Application Server
- Domínio do Process Scheduler
- PeopleSoft Arquitetura de Internet (PIA)
Pode haver vários recursos de cada família em um trabalho de descoberta. Um job de descoberta será marcado como bem-sucedido se pelo menos um recurso de cada tipo for bem-sucedido. Portanto, um job pode ser bem-sucedido mesmo se houver alguns itens de trabalho com falha para alguns recursos filhos.
Falha na descoberta de oracle_psft_appserv" (também se aplica a oracle_psft_pcrs):
- Causa: Credenciais inválidas
- Solução: Informe as credenciais corretas.
Falha ao recuperar NameNotFoundException
- Causa: domínio inativo
- Solução: Certifique-se de que o aplicativo/domínio esteja em execução no console PeopleSoft e reinicie, se necessário.
Configuração Incorreta do Domínio PIA
- Causa: Ocorre quando um domínio PIA está inativo ou configurado incorretamente.
- Solução: Corrija a configuração do domínio PIA.
Erros do Elasticsearch
Se a Pesquisa Elástica for descoberta junto com a descoberta PeopleSoft, essa descoberta de item de trabalho definirá o sucesso ou a falha da descoberta PeopleSoft. Se ocorrer um erro ao descobrir a Pesquisa Elástica e o item de trabalho falhar, o job de descoberta PeopleSoft também não será bem-sucedido.
500 ERRO DE SERVIDOR:
-
Causa: falha ao coletar dados devido ao nome de usuário inválido.
-
Solução: Insira o nome de usuário correto.
401 Acesso Não-Autorizado:
-
Causa: credenciais inválidas.
-
Solução: Certifique-se de que a senha correta seja fornecida.
FileNotFoundException:
-
Causa: o caminho do arquivo TrustStore está incorreto ou o arquivo está ausente.
-
Solução: Corrija o caminho TrustStore e certifique-se de que o arquivo esteja acessível pelo host do agente.
Diagnosticar e Solucionar Problemas do SOA
Monitorando aplicativos SOA criados com base em imagens do Marketplace:
Quando uma aplicação SOA é provisionada usando Imagem de Mercado, os dados nas métricas relacionadas à SOA não são preenchidos. As imagens do Marketplace colocam arquivos de configuração SOA e WebLogic em dois locais separados. Para preencher as métricas SOA, copie os arquivos de configuração dos arquivos de configuração para o diretório WebLogic.
Copie os arquivos conforme indicado e reinicie o Weblogic. As Métricas de Infra SOA começarão a aparecer em alguns minutos após a reinicialização do Weblogic A imagem do Marketplace está instalando SOA Suites em um local diferente da pilha do Weblogic
|
Copie os seguintes arquivos: De: -rwxrwxr-x. 1 oracle 21156 18 de maio de 2011 server-scheduler_service.xml -rwxrwxr-x. 1 oracle 15788 domínio 18 de maio de 2011-scheduler_service.xml -rwxrwxr-x. 1 oracle 2929 11 de novembro de 2013 server-bea_alsb.xml -rwxrwxr-x. 1 oracle oracle 242238 servidor em 28 de fevereiro de 2016-oracle_soainfra.xml -rwxrwxr-x. 1 oracle 232504 Jul 10 2016 server-oracle_soainfra_partition.xml -rwxrwxr-x. 1 oracle 2992 15 de agosto de 2016 server-oracle_soa_composite-11.0.xml -rwxrwxr-x. 1 oracle 95241 16 de janeiro de 2017 domain-oracle_soainfra.xml Para: |