Definindo Alarmes

Você pode usar o serviço Oracle Cloud Infrastructure Monitoring para gerar alarmes quando métricas ultrapassam limites.

Primeiro, familiarize-se com os conceitos e recursos do serviço Monitoring revisando a Visão Geral do Serviço Monitoring. Para obter mais informações sobre como configurar alarmes, consulte Gerenciando Alarmes. Consulte Referência de MQL (Monitoring Query Language) para construir consultas avançadas para monitoramento e alarmes.

Certifique-se também de definir as políticas apropriadas para usar regras de alarme. Consulte Conceitos Básicos.

Antes de continuar, você deve ter criado um destino de alarme, por exemplo, serviço de Notificação, bem como tópico(s) que definem quem receberá esses alarmes.

A tabela a seguir lista os detalhes da métrica necessários para criar regras de alarme para métricas usadas no Stack Monitoring.

Tipo de Recurso Namespace da Métrica Grupo de Recursos da Regra de Alerta Regras de alarme Referência de Métricas
Host
  • GPU
oracle_appmgmt host
Oracle Databases não contêiner, contêiner e plugável oracle_oci_database não aplicável Oracle Database Oracle Database
Sistema, ASM, Cluster e Listener do Oracle Database oracle_oci_database_cluster oracle_asm, oracle_cluster, oracle_db_node, oracle_lsnr Oracle Database Cluster do Oracle Database

Domínio do Oracle WebLogic

Oracle WebLogic Cluster

oracle_appmgmt

weblogic_cluster

Oracle Weblogic Server WebLogic Métrica
Oracle WebLogic Server oracle_appmgmt weblogic_j2eeserver Oracle Weblogic Server WebLogic Métrica
Oracle HTTP Server (OHS) oracle_appmgmt oracle_http_server Oracle HTTP Server (OHS) Métricas do Oracle HTTP Server (OHS)
OIM (Oracle Identity Manager) oracle_appmgmt oracle_oim / oracle_oim_cluster OIM (Oracle Identity Manager) OIM (Oracle Identity Manager)
OAM (Oracle Access Manager) oracle_appmgmt oracle_oam / oracle_oam_cluster OAM (Oracle Access Manager) OAM (Oracle Access Manager)
Runtime do Oracle JVM oracle_appmgmt oracle_jvm Oracle JVM Métricas do Oracle JVM
Oracle E-Business Suite oracle_appmgmt ebs_instance Oracle E-Business Suite Métricas do E-Business Suite
Listener do Aplicativo EBS oracle_appmgmt oracle_ebs_app_lsnr Oracle E-Business Suite Métricas do E-Business Suite
EBS Concurrent Processing oracle_appmgmt oracle_ebs_conc_mgmt_service Processamento Simultâneo Métricas do E-Business Suite
EBS Concurrent Processing - Especializado oracle_appmgmt oracle_ebs_conc_mgmt_service_specialized Processamento Simultâneo Métricas do E-Business Suite
Nó de Processamento Simultâneo EBS oracle_appmgmt oracle_ebs_cp_node Oracle E-Business Suite Métricas do E-Business Suite
EBS Forms System oracle_appmgmt oracle_ebs_forms_system Oracle E-Business Suite Métricas do E-Business Suite
EBS Workflow Agent Listener oracle_appmgmt oracle_ebs_wf_agent_lsnr Oracle E-Business Suite Métricas do E-Business Suite
EBS Workflow Background Engine oracle_appmgmt oracle_ebs_wf_bkgd_engine Oracle E-Business Suite Métricas do E-Business Suite
EBS Workflow Group oracle_appmgmt oracle_ebs_wf_group Oracle E-Business Suite Métricas do E-Business Suite
EBS Workflow Notification Mailer oracle_appmgmt oracle_ebs_wf_notification_mailer Workflow Notification Mailer Métricas do E-Business Suite
Apache Tomcat oracle_appmgmt apache_tomcat Apache Tomcat Métricas do Apache Tomcat
Microsoft SQL Server oracle_appmgmt sql_server Microsoft SQL Server Métricas do Microsoft SQL Server
PeopleSoft Domínio do Servidor de Aplicativos oracle_appmgmt oracle_psft_appserv PeopleSoft PeopleSoft Métricas
Domínio do PeopleSoft Process Scheduler oracle_appmgmt oracle_psft_prcs PeopleSoft PeopleSoft Métricas
PeopleSoft PIA oracle_appmgmt oracle_psft_pia PeopleSoft PeopleSoft Métricas
PeopleSoft Mecanismo de Pesquisa

(OpenSearch / Elasticsearch)

oracle_appmgmt elastic_search, open_search PeopleSoft PeopleSoft Métricas
PeopleSoft Monitor de Processos oracle_appmgmt oracle_psft_prcm PeopleSoft PeopleSoft Métricas
Apache HTTP Server oracle_appmgmt apache_http_server Apache HTTP Server Métricas do Apache HTTP Server
Servidor de Diretórios do OUD oracle_appmgmt oud_directory Oracle Unified Directory Métricas do Oracle Unified Directory
Servidor Proxy do OUD oracle_appmgmt oud_proxy Oracle Unified Directory Métricas do Oracle Unified Directory
Gateway de Replicação do OUD oracle_appmgmt oud_gateway Oracle Unified Directory Métricas do Oracle Unified Directory
GoldenGate oracle_appmgmt oracle_goldengate Oracle GoldenGate Métricas do Oracle GoldenGate
GoldenGate ServiceManager oracle_appmgmt oracle_goldengate_service_manager Oracle GoldenGate Métricas do Oracle GoldenGate
GoldenGate AdminServer oracle_appmgmt oracle_goldengate_admin_server Oracle GoldenGate Métricas do Oracle GoldenGate
Servidor de Métricas de Desempenho do GoldenGate oracle_appmgmt oracle_goldengate_pm_server Oracle GoldenGate Métricas do Oracle GoldenGate
GoldenGate Extrair oracle_appmgmt oracle_goldengate_extract Oracle GoldenGate Métricas do Oracle GoldenGate
GoldenGate Processo Replicat oracle_appmgmt oracle_goldengate_replicat Oracle GoldenGate Métricas do Oracle GoldenGate
GoldenGate DistributionServer oracle_appmgmt oracle_goldengate_distribution_server Oracle GoldenGate Métricas do Oracle GoldenGate
GoldenGate Caminho de Distribuição oracle_appmgmt oracle_goldengate_distribution_path Oracle GoldenGate Métricas do Oracle GoldenGate

GoldenGate Servidor de Recebimento

oracle_appmgmt oracle_goldengate_receiver_server Oracle GoldenGate Métricas do Oracle GoldenGate
GoldenGate Caminho do Destinatário oracle_appmgmt oracle_goldengate_receiver_path Oracle GoldenGate Métricas do Oracle GoldenGate
Recurso Personalizado oracle_appmgmt custom_resource Regras de Alarme de Amostra de Recurso Personalizado com Base em Processo Métricas de Recursos Personalizados Baseadas em Processo
do Oracle Service Bus oracle_appmgmt oracle_servicebus OSS (Oracle Service Bus) OSS (Oracle Service Bus)
IIS da Microsoft oracle_appmgmt microsoft_iis IIS da Microsoft Métricas do Microsoft IIS
Site do Microsoft IIS oracle_appmgmt microsoft_iis_website IIS da Microsoft Métricas do Microsoft IIS
O nas oracle_appmgmt nginx O nas Métricas NGINX

Melhores práticas para cenários de alarme comuns

  1. Crie suas regras de alarme no mesmo compartimento no qual você descobriu seus recursos.
  2. Para configurar uma regra de alarme para gerar um alarme quando um recurso estiver inativo, especifique o namespace de métricas e o grupo de recursos apropriados e use a seguinte regra de métrica e acionamento:

    Nome da Métrica: MonitoringStatus

    Regra do acionador:

    • Operador: equal to

    • Valor: 0

    • Minutos de atraso do trigger: 1

  3. Para configurar uma regra de alarme a ser acionada para instâncias de recursos individuais, além de escolher a métrica, você também precisará adicionar dimensões de métrica para identificar exclusivamente o recurso.

    Para identificar exclusivamente uma instância de recurso:

    1. Você pode usar resourceName e resourceType OU
    2. Você pode usar resourceId

      A maioria das métricas define dimensões adicionais que podem ser usadas para definir alarmes avançados.

  4. Sempre consulte a descrição da métrica encontrada na Referência da Métrica e verifique o período de avaliação (com que frequência cada métrica é coletada). Ao configurar alarmes, certifique-se de fornecer o mesmo valor do Intervalo do alarme. Isso pode ser feito por meio de Alternar para o Modo Avançado no canto superior direito da página de criação de alarme. Você pode fornecer MQL avançado na seção Query code editor da página de modo avançado.

Hosts

Regra de Alarme de Amostra: Monitoramento do Host

  • Tipo de Recurso: Host
  • Namespace da Métrica: oracle_appmgmt
  • Grupo de Recursos: host
Período de Avaliação (minutos) Regra de Alarme Aviso Crítico Descrição
4

Host Desativado

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[4m].mean() != 1 || MonitoringStatus[4m].absent()
não aplicável não aplicável Alarme crítico para qualquer host em um determinado compartimento relatando estar inativo ou não relatando status por mais de 1 minuto.
4

Alta Utilização da CPU

Nome da métrica: CpuUtilization

MQL de Advertência:

CpuUtilization[4m]{type="Total"}.mean() > 80

MQL Crítico:

CpuUtilization[4m]{type="Total"}.mean() > 90
> 80 > 90 Alarme de advertência para qualquer host em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 3 minutos.

Alarme crítico para qualquer host em um determinado compartimento que reporta mais de 90% de utilização de CPU nos últimos 3 minutos.

4

Alta Utilização da Memória

Nome da métrica: MemoryUtilization

MQL de Advertência:

MemoryUtilization[4m]{type="Logical"}.mean() > 80

MQL Crítico:

MemoryUtilization[4m]{type="Logical"}.mean() > 90
> 80 > 90 Alarme de advertência para qualquer host em um determinado compartimento que reporte mais de 80% de utilização de memória nos últimos 3 minutos.

Alarme de advertência para qualquer host em um determinado compartimento que reporte mais de 90% de utilização de memória nos últimos 3 minutos.

4

Utilização do Sistema de Arquivos

Nome da métrica: FilesystemUtilization

MQL de Advertência:

FilesystemUtilization[4m].mean() > 80

MQL Crítico:

FilesystemUtilization[4m].mean() > 90
> 80 > 90 Alarme de advertência para qualquer sistema de arquivos em qualquer host de um determinado compartimento que reporte mais de 80% de utilização de memória.

Alarme crítico para qualquer sistema de arquivos em qualquer host em um determinado compartimento que reporte mais de 90% de utilização de memória.

Observação

Para monitorar sistemas de arquivos selecionados, você pode especificar ainda mais a dimensão fileSystemName e personalizar seus alarmes de acordo com suas necessidades específicas. Por exemplo, o MQL FilesystemUtilization[1m]{fileSystemName = "/", osType = "Linux"}.mean() > 80 a seguir só se aplicará a qualquer sistema de arquivos raiz em qualquer host Linux em determinado compartimento.

GPU

Regra de Alarme de Amostra: GPU

1

Temperatura da GPU

Nome da métrica: GPUTemperature

MQL de Advertência:

GPUTemperature[4m]{Type="GPU"}.mean() > 98

MQL Crítico:

GPUTemperature[4m]{Type="GPU"}.mean() > 101
> 98 > 101

Alarme de aviso quando qualquer GPU excede a temperatura de desaceleração.

Alarme crítico quando qualquer GPU excede a temperatura de desligamento.

As temperaturas de desaceleração e desligamento podem variar de acordo com o modelo de GPU; os valores corretos para uma GPU descoberta podem ser revisados na home page da GPU do Stack Monitoring.

  1. Ir para a página inicial de uma GPU individual
  2. Selecione a opção de menu Configuração
  3. Na seção Propriedades específicas do Recurso, procure as entradas temperatureSlowdown e temperatureShutdown.

Oracle Database

Opcionalmente, para minimizar o risco de alarmes falsos, inclua collectionName="sensor".

Exemplo :

MonitoringStatus[4m]{collectionName="sensor"}.groupBy(resourceName).last() < 1 || MonitoringStatus[4m] collectionName="sensor"}.groupBy(resourceName).absent()

Regra de Alarme de Amostra: Banco de Dados Não Contêiner

  • Tipo de Recurso: Banco de Dados Não Contêiner

  • Namespace da Métrica: oracle_oci_database

  • Grupo de Recursos: n/d

Período de avaliação (minutos) Regra de Alarme Advertência Crítico Valor Recomendado Usado do DBM? Descrição
30

Utilização de Armazenamento

Nome da métrica: StorageUtilizationByTablespace

Dimensão: tablespaceContents = PERMANENT

ou

MQL de Advertência:

StorageUtilizationByTablespace[30m]{tablespaceContents ="PERMANENT"}.mean()> 75

MQL Crítico:

StorageUtilizationByTablespace[30m]{tablespaceContents ="PERMANENT"}.mean() > 85
>75 >85 Y Condições de regra de alarme de Advertência e Crítico para tablespaces permanentes cuja utilização é maior que 75% ou 85% nos últimos 30 minutos.
24 horas InvalidObjects >150 >200 não aplicável  
15 BlockingSessions >1 >10 Y Condições de regra de alarme de Advertência e Crítico para acionar um alarme quando o número de sessões de bloqueio for maior que 1 ou 10 nos últimos 15 minutos.
15 UsableFRA <20 <10 não aplicável Aviso e condições de regra de alarme Crítico para acionar um alarme quando a porcentagem da área de recuperação rápida utilizável for inferior a 20% ou 10% nos últimos 15 minutos.
5 ProcessLimitUtilization >70 >80 Y Condições de regra de alarme Advertência e Crítico para acionar um alarme quando a utilização do processo (%) for maior que 70% ou 80% nos últimos 5 minutos.
5 SessionLimitUtilization >90 >97 não aplicável  
5 CPUUtilization >80 >85 Y  
5 FRAUtilization >70 >75 Y  
5 StorageUtilization >75 >85 Y  
5

Status de Monitoramento

Nome da métrica:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
não aplicável n/d   Alarme crítico para qualquer relatório do Oracle Database não contêiner que esteja inativo ou não reporte o status por mais de 1 minuto.

Regra de Alarme de Amostra: Banco de Dados Contêiner

  • Tipo de Recurso: BD do Contêiner

  • Namespace da Métrica: oracle_oci_database

  • Grupo de Recursos: n/d

Período de avaliação (minutos) Regra de Alarme Advertência Crítico Valor Recomendado Usado do DBM? Descrição
1

Status de Monitoramento

Nome da métrica:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
n/d n/d n/d Alarme crítico para qualquer relatório do Oracle Database não contêiner que esteja inativo ou não reporte o status por mais de 1 minuto.
30

Métrica: StorageUtilizationByTablespace

Dimensão: tablespaceContents = PERMANENT

ou

MQL de Advertência:

StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 75

MQL Crítico:

StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 85

>75 >85 Y Condições de regra de alarme Advertência e Crítico para tablespaces permanentes cuja utilização é maior que 85% ou 90% nos últimos 30 minutos.
5 ProcessLimitUtilization >70 >80 Y Condições de regra de alarme Advertência e Crítico para acionar um alarme quando a utilização do processo (%) for maior que 90% ou 95% nos últimos 5 minutos.
5 SessionLimitUtilization >90 >97 n/d  
15 UsableFRA <20 <10 n/d Aviso e condições de regra de alarme Crítico para acionar um alarme quando a porcentagem da área de recuperação rápida utilizável for inferior a 20% ou 10% nos últimos 15 minutos.
5 CPUUtilization >80 >85 Y  
5 FRAUtilization >70 >75 Y  
5 StorageUtilization >75 >85 Y  

Regra de Alarme de Amostra: Banco de Dados Plugável

  • Tipo de Recurso: Banco de Dados Plugável

  • Namespace da Métrica: oracle_oci_database

  • Grupo de Recursos: n/d

Período de avaliação (minutos) Regra de alarme Advertência Crítico Valor Recomendado Usado do DBM? Descrição
1

Status de Monitoramento

Nome da métrica:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
n/d n/d n/d Alarme crítico para qualquer relatório do Oracle Database Não Contêiner que esteja inativo ou que não esteja informando o status por mais de 1 minuto.
5 CPUUtilization >80 >85 Y  
5 StorageUtilization >75 >85 Y  
15 BlockingSessions >1 >10 Y Condições de regra de alarme de Advertência e Crítico para acionar um alarme quando o número de sessões de bloqueio for maior que 1 ou 5 nos últimos 15 minutos.
24 horas InvalidObjects >150 >200 n/d  
30

Métrica: StorageUtilizationByTablespace

Dimensão: tablespaceContents = PERMANENT

ou

MQL de Advertência:

StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 75

MQL Crítico:

StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 85

>75 >85 Y Condições de regra de alarme Advertência e Crítico para tablespaces permanentes cuja utilização é maior que 85% ou 90% nos últimos 30 minutos.

Regra de Alarme de Amostra: Instância ASM/ASM

  • Tipo de Recurso: ASM

  • Namespace da Métrica: oracle_oci_database_cluster

  • Grupo de Recursos: oracle_asm

Período de avaliação (minutos) Regra de Alarme Advertência Crítico Descrição
1

Status de Monitoramento

Nome da métrica:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer relatório do Oracle Database Não Contêiner que esteja inativo ou que não esteja informando o status por mais de 1 minuto.
30 DiskGroupUtilization >85 >95  
30 DiskUtilization >85 >95  
Regra de Alarme de Amostra: Cluster ASM
  • Tipo de Recurso: Cluster

  • Namespace da Métrica: oracle_oci_database_cluster

  • Grupo de Recursos: oracle_cluster

Período de avaliação (minutos) Regra de alarme Advertência Crítico Descrição
1

Status de Monitoramento

Nome da métrica:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer relatório do Oracle Database Não Contêiner que esteja inativo ou que não esteja informando o status por mais de 1 minuto.

Regra de Alarme de Amostra: Listener

  • Tipo de Recurso: Listener

  • Namespace da Métrica: oracle_oci_database_cluster

  • Grupo de Recursos: oracle_lsnr

Período de avaliação (minutos) Regra de Alarme Advertência Crítico Descrição
1

Status de Monitoramento

Nome da métrica:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer relatório do Oracle Database Não Contêiner que esteja inativo ou que não esteja informando o status por mais de 1 minuto.
5 RefusedConnections >1 >5  

E-Business Suite

Regra de Alarme de Amostra: EBS

  • Tipo de Recurso: Oracle E-Business Suite
  • Namespace da Métrica: oracle_appmgmt
  • Grupo de Recursos: ebs_instance
Período de Avaliação (minutos) Regra de Alarme Advertência Crítico Descrição
15

Programas Executados por Tempo de Execução (ms)

Nome da métrica: ExecutedProgramsByRunningTime

MQL:

ExecutedProgramsByRunningTime[15m].mean() > 4000

Tip1:

Você pode filtrar o alarme para um aplicativo específico adicionando o filtro de dimensão ProgramName ou ProgramShortName.

> 4,000 > 40,000 O tempo de execução das solicitações
15

Solicitações Concluídas por Aplicativo (proporção)

Nome da métrica: CompletedRequestsByApplication

Nome da dimensão: Category

Valor da dimensão: Error

MQL:

CompletedRequestsByApplication[15m]{Category = "Error"}.mean() > 0.001

Tip1:

Você pode filtrar o alarme para um aplicativo específico adicionando ApplicationName ou um filtro de dimensão.

MQL:

CompletedRequestsByApplication[15m]{Category = "Error", ApplicationName = "<YOUR APP NAME>"}.mean() > 0.001
> 0.001 > 0.003

A proporção de solicitações concluídas com erro em comparação com todas as solicitações em determinado intervalo de coleta.

Isso significa que, se mais de 0,1% solicitado falhar, você receberá um aviso, pois mais de 0,25% você recebe críticas

15

Sessões Ativos do Usuário

Nome da métrica: ActiveUserSessions

MQL:

ActiveUserSessions[15m].mean() > 200
> 200 > 250 O número de sessões do usuário ativas

Exemplo de Regra de Alarme: Listener do Aplicativo EBS

Tipo de Recurso: Listener do Aplicativo EBS

Namespace da Métrica: oracle_appmgmt

Grupo de Recursos: oracle_ebs_app_lsnr

Período de Avaliação (minutos) Regra de Alarme Advertência Crítico Descrição
1

Status de Monitoramento

Nome da métrica:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
n/d 0 Alarme crítico para o Listener do Aplicativo EBS em um determinado compartimento reportando estar inativo ou não relatando status por mais de 1 minuto.

Regra de Alarme de Amostra: Processamento Concorrente EBS

Tipo de Recurso: Processamento Concorrente EBS

Namespace da Métrica: oracle_appmgmt

Grupo de Recursos: oracle_ebs_conc_mgmt_service

Período de Avaliação (minutos) Regra de Alarme Aviso Crítico Descrição
1

Status de Monitoramento

Nome da métrica: MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
n/d 0 O status de disponibilidade.
15

Taxa de Erros de Solicitações Simultâneas

Nome da métrica: CompletedConcurrentRequests

Nome da dimensão: State

Valor da dimensão: Errored

MQL:

CompletedConcurrentRequests[15m]{State = "Errored"}.mean() > 0.001
> 0.001 > 0.003 A taxa de solicitações que foram concluídas com erros por hora. Se multiplicado por 100, torna-se um percentual.
15

Taxa de Advertência de Solicitações Concorrentes

Nome da métrica: CompletedConcurrentRequests

Nome da dimensão: State

Valor da dimensão: WithWarning

MQL:

CompletedConcurrentRequests[15m]{State = "WithWarning"}.mean() > 0.15
> 0.002 > 0.003 A taxa de solicitações que foram concluídas com aviso por hora. Se multiplicado por 100, torna-se um percentual.
15

Solicitações Concorrentes Concluídas com Êxito (período de avaliação/operações)

Nome da métrica: CompletedConcurrentRequests

Nome da dimensão: State

Valor da dimensão: Succ

essencial

MQL:

CompletedConcurrentRequests[15m]{State = "Successful"}.sum() > 2500
> 625 > 2,500 A taxa de solicitações que foram concluídas com êxito em um período de avaliação (15 minutos por padrão).
15

Solicitações Concorrentes em Execução

Nome da métrica: ConcurrentRequestsByStatus

Nome da dimensão: State

Valor da dimensão: Executado

ingestão

MQL:

ConcurrentRequestsByStatus[15m]{State = "Running"}.mean() > 100
> 2,500 > 10,000 O número de solicitações em execução por usuário.
15

Solicitações Concorrentes Pendentes - Normal

Nome da métrica: ConcurrentRequestsByStatus

Nome da dimensão: State

Valor da dimensão: PendingNormal

MQL:

ConcurrentRequestsByStatus[15m]{State = "PendingNormal"}.mean() > 100
> 2,500 > 10,000 O número de solicitações pendentes por usuário.
15

Solicitações Concorrentes Pendentes - Standby

Nome da métrica: ConcurrentRequestsByStatus

Nome da dimensão: State

Valor da dimensão: PendingStandBy

MQL:

ConcurrentRequestsByStatus[15m]{State = "PendingStandBy"}.mean() > 100
> 100 > 500 O número de solicitações com status stand-by pendente.
15

Solicitações Concorrentes Inativas - Sem Gerenciador

Nome da métrica: ConcurrentRequestsByStatus

Nome da dimensão: State

Valor da dimensão: InactiveNoManager

MQL:

ConcurrentRequestsByStatus[15m]{State = "InactiveNoManager"}.mean() > 100
> 100 > 500 O número de solicitações com status de não gerente inativo.
15

Solicitações Concorrentes Inativas - Em Retenção

Nome da métrica: ConcurrentRequestsByStatus

Nome da dimensão: State

Valor da dimensão: InactiveOnHold

MQL:

ConcurrentRequestsByStatus[15m]{State = "InactiveOnHold"}.mean() > 100
> 100 > 500 O número de solicitações com status inativo em retenção.
5

Solicitações Concorrentes de Longa Execução

Nome da métrica: LongActiveConcurrentRequests

MQL:

LongActiveConcurrentRequests[5m].mean() > 43200000

Tip1:

Você pode filtrar o alarme para uma solicitação Running ou Pending adicionando o filtro de dimensão Phase.

MQL:

LongActiveConcurrentRequests[5m]{Phase = "Running"}.mean() > 43200000

Tip2:

Você pode filtrar ainda mais por programa específico adicionando o filtro de dimensão ProgramName ou ProgramShortName.

MQL:

LongActiveConcurrentRequests[1m]{Phase = "Running", ProgramShortName = "<PROGRAM SHORT NAME>"}.mean() > 43200000
> 43,200,000 > 86,400,000 O tempo decorrido em ms para uma solicitação pendente ou em execução. Somente as 10 principais solicitações são rastreadas. Neste caso, estamos sugerindo obter Aviso após 12 horas e Crítico após 24 horas.

EBS Concurrent Processing - Especializado

Tipo de Recurso: Processamento Concorrente EBS - Especializado

Namespace da Métrica: oracle_appmgmt

Grupo de Recursos: oracle_ebs_conc_mgmt_service_specialized

Métrica Nome para Exibição da Métrica Unidade Descrição Frequência de Coleta Dimensão Nome do Recurso
MonitoringStatus Disponibilidade status

Status do recurso. Os valores são os seguintes:

1 = Para cima

0 = Para baixo

Somente se TODOS os outros gerentes estiverem ativos, o status estará ativo. Se apenas um gerente estiver inativo, o status geral será desativado.

1 mínimo n/d oracle_ebs_conc_mgmt_service_specialized
ConcurrentProcesingComponentStatus Status do Concurrent Manager status Disponibilidade do gerenciador concorrente 1 mínimo Nome da Fila Simultânea, Descrição, Nome do Host oracle_ebs_conc_mgmt_service_specialized
CapacityUtilizationOfConcurrentManagers Utilização da Capacidade do Concurrent Manager percentual Porcentagem de processos máximos em execução. Se o máximo de processos do gerente for 10 e 5 estiverem em execução, a utilização da capacidade será de 50% 1 mínimo Nome do Gerenciador oracle_ebs_conc_mgmt_service_specialized
ManagerMaxProcesses Máx. de Processos do Concurrent Manager contagem Número máximo de processos na fila do gerente. 1 mínimo Nome do Gerenciador oracle_ebs_conc_mgmt_service_specialized
ManagerRunningProcesses Processos em Execução no Concurrent Manager contagem Número de processos em execução na fila do gerente 1 mínimo Nome do Gerenciador oracle_ebs_conc_mgmt_service_specialized

Regra de Alerta de Amostra: Mailer de Notificação do Workflow do EBS

Tipo de Recurso: EBS Mailer de Notificação do Workflow

Namespace da Métrica: oracle_appmgmt

Grupo de Recursos: oracle_ebs_wf_notification_mailer

Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
1

Status de Monitoramento

Nome da métrica: MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
n/d 0 Alarme crítico para EBS Concurrent Processing Specialized em um determinado compartimento reportando estar inativo ou não relatando status para mais de 1min.
1

Utilização da Capacidade do Concurrent Manager

Nome da métrica: CapacityUtilizationOfConcurrentManagers

MQL:

CapacityUtilizationOfConcurrentManagers[1m].mean() < 100
< 50 < 100 Porcentagem de utilização da capacidade de todos os gerentes ativados.

Apache Tomcat

Regra de Alarme de Amostra: Apache Tomcat

Tipo de recurso: Apache Tomcat

Namespace da Métrica: oracle_appmgmt

Grupo de Recursos: apache_tomcat

Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
3

Apache Tomcat Inativo

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()
n/d n/d Alarme crítico para qualquer Apache Tomcat em um determinado compartimento reportando estar inativo ou não relatando status por mais de 3 minutos.
5

Alta Utilização da CPU

Nome da métrica: CPUUtilization

MQL de Advertência:

CPUUtilization[5m].mean() > 80

MQL Crítico:

CPUUtilization[5m].mean() > 90
>80 >90

Alarme de advertência para qualquer Apache Tomcat em um determinado compartimento que reporte mais de 80% de utilização da CPU nos últimos 5 minutos.

Alarme crítico para qualquer Apache Tomcat em um determinado compartimento que reporte mais de 90% de utilização da CPU nos últimos 5 minutos.

5

Alta Utilização da Memória Heap da JVM

Nome da métrica: JVMMemoryUtilization

MQL de Advertência:

JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 80

MQL Crítico:

JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 90
>80 >90

Alarme de advertência para qualquer Apache Tomcat em um determinado compartimento que reporte mais de 80% de utilização de memória heap JVM nos últimos 5 minutos.

Alarme de advertência para qualquer Apache Tomcat em um determinado compartimento que reporte mais de 90% de utilização de memória heap JVM nos últimos 5 minutos.

5

Tempo de Processamento de Solicitação Web Alto

Nome da métrica: WebRequestProcessingTime

MQL de Advertência:

WebRequestProcessingTime[5m].mean() > 1000

MQL Crítico:

WebRequestProcessingTime[5m].mean() > 1500
>1,500 >3,000

Alarme de advertência para qualquer Apache Tomcat em um determinado compartimento que reporta mais de 1500 ms significa tempo de processamento de solicitação da Web nos últimos 5 minutos.

Alarme de advertência para qualquer Apache Tomcat em um determinado compartimento que reporta mais de 3000 ms significa tempo de processamento de solicitação da Web nos últimos 5 minutos.

Microsoft SQL Server

Regras de Alarme de Amostra: Microsoft SQL Server

Tipo de Recurso: Microsoft SQL Server

Namespace da Métrica: oracle_appmgmt

Grupo de Recursos: sql_server

Período de Avaliação (minutos) Regra de Alarme Advertência Crítico Descrição
3

Status de Disponibilidade do SQL Server

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()
n/d n/d Alarme crítico para qualquer SQL Server em um determinado compartimento relatando estar inativo ou não relatando status por mais de 3 minutos.
10

Utilização de CPU do SQL Server (%)

Nome da métrica: CPUUtilization

MQL de Advertência:

CpuUtilization[10m].mean() > 80

MQL Crítico:

CpuUtilization[10m].mean() > 95
>80 >95 Alarme de advertência para qualquer SQL Server em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 10 minutos.

Alarme crítico para qualquer SQL Server em um determinado compartimento que reporta mais de 90% de utilização de CPU nos últimos 10 minutos.

15

Utilização do Banco de Dados SQL Server

Nome da métrica: StorageDatabaseUtilization

MQL de Advertência:

StorageDatabaseUtilization[15m].mean() > 80

MQL Crítico:

StorageDatabaseUtilization[15m].mean() > 95
>80 >95 Alarme de advertência para qualquer SQL Server em um determinado compartimento que reporte mais de 80% de utilização do banco de dados nos últimos 15 minutos.

Alarme crítico para qualquer SQL Server em um determinado compartimento que reporta mais de 90% de utilização do banco de dados nos últimos 15 minutos.

PeopleSoft

PeopleSoft Servidor de Aplicativos

  • Tipo de Recurso: PeopleSoft Domínio do Servidor de Aplicativos
  • Namespace da Métrica: oracle_appmgmt
  • Grupo de Recursos: oracle_psft_appserv
Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
5

Integralidade

Nome da métrica: Health

MQL de Advertência:

Health[1m]{HealthState = "Warning"}.mean() = 1

MQL Crítico:

Health[1m]{HealthState = "Critical"}.mean() = 1
1 1

Integridade geral do domínio do servidor de aplicativos.

Um alarme de advertência será acionado se o "aviso" do estado for igual a 1.

Um alarme crítico será acionado se o estado "crítico" for igual a 1.

5

Carga

Nome da métrica: Load

MQL de Advertência:

Load[1m]{LoadState = "Medium"}.mean() = 1

MQL Crítico

Load[1m]{LoadState = "Heavy"}.mean() = 1
1 1

Carga geral do domínio do servidor de aplicativos.

Um alarme de aviso será acionado se o estado "médio" for igual a 1.

Um alarme crítico será disparado se o estado "pesado" for igual a 1.

5

Tempo Médio de Execução da Solicitação de Serviço

Nome da métrica: AverageServiceRequestExecutionTime

MQL de Advertência:

AverageServiceRequestExecutionTime[5m].mean()> 1000
> 1,000 n/d

Tempo médio, em milissegundos, necessário para executar uma solicitação de serviço.

O alarme de aviso é acionado quando, em média, uma solicitação leva mais de um segundo (1000 ms) para ser executada.

5

Processos em Fila do Servidor de Aplicativos

Nome da métrica: QueuedTuxedoProcesses

Nome da dimensão: Category

Valor da dimensão: ApplicationServer

MQL Crítico:

QueuedTuxedoProcesses[5m]{Category = "ApplicationServer"}.mean() > 1
n/d > 1 Número de processos que estão atualmente na fila para o Servidor de Aplicativos. Mais de 1 processo na fila disparará um alarme crítico.
5

Processos Enfileirados para Handler BRK

Nome da métrica: QueuedTuxedoProcesses

Nome da dimensão: Category

Valor da dimensão: BRKHandler

MQL Crítico:

QueuedTuxedoProcesses[5m]{Category = "BRKHandler"}.mean() > 1
n/d > 1 Número de processos que estão atualmente na fila para o Manipulador BRK. Mais de 1 processo na fila disparará um alarme crítico.
5

Processos Enfileirados para o Dispatcher BRK

Nome da métrica: QueuedTuxedoProcesses

Nome da dimensão: Category

Valor da dimensão: BRKDispatcher

MQL Crítico:

QueuedTuxedoProcesses[5m]{Category = "BRKDispatcher"}.mean() > 1
n/d > 1 Número de processos que estão atualmente na fila para o Expedidor BRK. Mais de 1 processo na fila disparará um alarme crítico.
5

Processos Enfileirados para o Dispatcher PUB

Nome da métrica: QueuedTuxedoProcesses

Nome da dimensão: Category

Valor da dimensão: PUBDispatcher

MQL:

QueuedTuxedoProcesses[5m]{Category = "PUBDispatcher"}.mean() > 1
n/d > 1 Número de processos que estão atualmente na fila para o Despachador PUB. Mais de 1 processo na fila disparará um alarme crítico.
5

Processos enfileirados para manipulador PUB

Nome da métrica: QueuedTuxedoProcesses

Nome da dimensão: Category

Valor da dimensão: PUBHandler

MQL Crítico:

QueuedTuxedoProcesses[5m]{Category = "PUBHandler"}.mean() > 1
n/d > 1 Número de processos que estão atualmente na fila para o manipulador PUB. Mais de 1 processo na fila disparará um alarme crítico.
5

Processos Enfileirados para Despachador SUB

Nome da métrica: QueuedTuxedoProcesses

Nome da dimensão: Category

Valor da dimensão: SUBDispatcher

MQL Crítico:

QueuedTuxedoProcesses[5m]{Category = "SUBDispatcher"}.mean() > 1
n/d > 1 Número de processos que estão atualmente na fila para o Expedidor SUB. Mais de 1 processo na fila disparará um alarme crítico.
5

Processos Enfileirados para Handler SUB

Nome da métrica: QueuedTuxedoProcesses

Nome da dimensão: Category

Valor da dimensão: SUBHandler

MQL Crítico:

QueuedTuxedoProcesses[5m]{Category = "SUBHandler"}.mean() > 1
n/d > 1 Número de processos que estão atualmente na fila para o manipulador SUB. Mais de 1 processo na fila disparará um alarme crítico.
5

Falha nos Processos do Servidor

Nome da métrica: FailedServerProcesses

MQL Crítico:

FailedServerProcesses[5m].mean() > 0
n/d > 0 Número de processos do servidor que falharam ou estão inativos no domínio. Se qualquer processo do servidor falhar, um alarme crítico será acionado.
15

Arquivos State

Nome da métrica: PeopleToolsStateFiles

MQL de Advertência:

PeopleToolsStateFiles[15m].mean() > 0
> 0 n/d Número de arquivos de estado PeopleTools gerados no diretório de logs do domínio. Se qualquer arquivo de estado for gerado, um alarme de aviso será acionado.

PeopleSoft Process Scheduler

  • Tipo de Recurso: Domínio do PeopleSoft Process Scheduler
  • Namespace da Métrica: oracle_appmgmt
  • Grupo de Recursos: oracle_psft_prcs
Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
5

Integralidade

Nome da métrica: Health

MQL de Advertência:

Health[1m]{HealthState = "Warning"}.mean() = 1

MQL Crítico:

Health[1m]{HealthState = "Critical"}.mean() = 1
1 1

Integridade geral do domínio do Process Scheduler.

Um alarme de advertência será acionado se o "aviso" do estado for igual a 1.

Um alarme crítico será acionado se o estado "crítico" for igual a 1.

5

Carregar

Nome da métrica: Load

MQL de Advertência:

Load[1m]{LoadState = "Medium"}.mean() = 1

MQL Crítico:

Load[1m]{LoadState = "Heavy"}.mean() = 1
1 1

Carga geral do domínio do Process Scheduler.

Um alarme de aviso será acionado se o estado "médio" for igual a 1.

Um alarme crítico será disparado se o estado "pesado" for igual a 1.

5

Processos Enfileirados para PSPRCSRV

Nome da métrica: QueuedTuxedoProcesses

Nome da dimensão: ProcessType

Valor da dimensão: PSPRCSRV

MQL Crítico:

QueuedTuxedoProcesses[5m]{ProcessType = "PSPRCSRV"}.mean() > 1
n/d > 1 Número de processos que estão atualmente na fila para o Process Scheduler (PSPRCSRV). Mais de 1 processo na fila disparará um alarme crítico.
5

Processos em Fila para PSDSTSRV

Nome da métrica: QueuedTuxedoProcesses

Nome da dimensão: ProcessType

Valor da dimensão: PSDSTSRV

MQL Crítico:

QueuedTuxedoProcesses[5m]{ProcessType = "PSDSTSRV"}.mean() > 1
n/d > 1 Número de processos que estão atualmente em fila para o servidor de distribuição (PSDSTSRV). Mais de 1 processo na fila disparará um alarme crítico.
5

Processos com Falha

Nome da métrica: FailedProcesses

MQL Crítico:

FailedProcesses[5m].mean() > 1
n/d > 0 Número de processos do servidor que falharam ou estão inativos no domínio. Se qualquer processo do servidor falhar, um alarme crítico será acionado.

PeopleSoft PIA

  • Tipo de Recurso: PeopleSoft PIA
  • Namespace da Métrica: oracle_appmgmt
  • Grupo de Recursos: oracle_psft_pia
Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
5

Saúde

Nome da métrica: Health

MQL de Advertência:

Health[1m]{HealthState = "Warning"}.mean() = 1

MQL Crítico:

Health[1m]{HealthState = "Critical"}.mean() = 1
1 1

A saúde geral da PIA.

Um alarme de advertência será acionado se o "aviso" do estado for igual a 1.

Um alarme crítico será acionado se o estado "crítico" for igual a 1.

5

Carga

Nome da métrica: Load

MQL de Advertência:

Load[1m]{LoadState = "Medium"}.mean() = 1

MQL Crítico:

Load[1m]{LoadState = "Heavy"}.mean() = 1
1 1

Carga total do PIA.

Um alarme de aviso será acionado se o estado "médio" for igual a 1.

Um alarme crítico será disparado se o estado "pesado" for igual a 1.

5

Soquetes do Estado de Espera

Nome da métrica: WaitStateSockets

MQL de Advertência:

WaitStateSockets[5m].mean() > 100
> 100 n/d Número de soquetes do servidor Web que estão no estado WAIT. Se mais de 100 soquetes de servidor Web estiverem no estado WAIT, um alarme de aviso será acionado.
5

Erros Fatais

Nome da métrica: FatalErrors

MQL de Advertência:

FatalErrors[5m].mean() > 0
> 0 n/d Número de erros fatais nos logs do servlet JOLTService. Se ocorrer algum erro no servlet JOLTService, um alarme de advertência será acionado.

PeopleSoft Mecanismo de Pesquisa

  • Tipo de Recurso: PeopleSoft Elasticsearch, PeopleSoft OpenSearch
  • Namespace da Métrica: oracle_appmgmt
  • Grupo de Recursos: elastic_search, open_search
Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
1

Cluster Integridade

Nome da métrica: ClusterHealth

MQL:

ClusterHealth[1m]{Status = "Red"}.mean() = 1ClusterHealth[1m]{Status = "Yellow"}.mean() = 1
1 1

Integridade geral do cluster do mecanismo de pesquisa.

Um alerta de aviso será acionado se o status 'amarelo' for igual a 1.

Um alerta crítico será acionado se o status 'vermelho' for igual a 1.

10

Utilização da Memória

Nome da métrica: MemoryUsage

MQL:

MemoryUsage[10m].mean()
> 80 > 90

Heap máximo configurado do nó do mecanismo de pesquisa.

Um alerta de advertência será acionado se a utilização da memória for superior a 80%.

Um alerta crítico será acionado se a utilização da memória for superior a 90%.

PeopleSoft Monitor de Processos

  • Tipo de Recurso: PeopleSoft Process Monitor
  • Namespace da Métrica: oracle_appmgmt
  • Grupo de Recursos: oracle_psft_prcm
Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
5

Estado de Distribuição Ativo

Nome da Métrica: ActiveDistributionState

MQL:

ActiveDistributionState[5m]{State = "NotPosted"}.mean() > 1
n/d > 1

Um alerta crítico será acionado se muitos processos no estado de distribuição não forem lançados.

5

Status da Execução

Nome da Métrica: ActiveRunState

MQL:

ActiveRunState[5m]{State = "NoSuccess"}.mean() > 1
n/d > 1

Um alerta crítico será acionado se muitos processos em execução não tiverem sucesso.

5

Status da Execução

Nome da Métrica: RunStatus

MQL:

RunStatus[5m]{Status = "Error"}.mean() > 0
n/d > 0

Um alerta crítico será acionado se muitos processos estiverem no estado de erro de execução.

Oracle Weblogic Server

Regra de Alarme de Amostra: Oracle Weblogic Server

  • Tipo de recurso: Servidor OracleWeblogic
  • Namespace da Métrica: oracle_appmgmt
  • Grupo de Recursos: weblogic_j2eeserver
Período de Avaliação (minutos) Regra de Alarme Advertência Crítico Descrição
3

WebLogic Servidor Inativo

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()

n/d n/d Alarme crítico para qualquer Servidor WebLogic em um determinado compartimento reportando estar inativo ou não relatando status por mais de 3 minutos.
5

Alta Utilização da CPU

Nome da métrica: CpuUtilization

MQL de Advertência:

CpuUtilization[5m].mean() > 80

MQL Crítico:

CpuUtilization[5m].mean() > 90

> 80 > 90

Alarme de advertência para qualquer Servidor WebLogic em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos.

Alarme crítico para qualquer Servidor WebLogic em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos.

5

Alta Utilização de Heap

Nome da métrica: JVMMemroyUtilization

MQL de Advertência:

JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 80

MQL Crítico:

JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 90
> 80 > 90

Alarme de advertência para qualquer Servidor WebLogic em um determinado compartimento que reporte mais de 80% de utilização de Heap nos últimos 5 minutos.

Alarme crítico para qualquer Servidor WebLogic em um determinado compartimento que reporte mais de 90% de utilização de Heap nos últimos 5 minutos.

5

Threads Mantidos do Gerenciador de Trabalho

Nome da métrica: WorkManagerStuckThreads

Advertência:

WorkManagerStuckThreads[5m].mean() > 10

Crítico:

WorkManagerStuckThreads[5m].mean() > 15
> 10 > 15

Alarme de advertência para qualquer Servidor WebLogic em um determinado compartimento que reporte mais de 10 threads paralisados do gerenciador de trabalho nos últimos 5 minutos.

Alarme crítico para qualquer Servidor WebLogic em um determinado compartimento que reporte mais de 15 threads paralisados do gerenciador de trabalho nos últimos 5 minutos.

5

Solicitações de Conexão em Espera

Nome da métrica:

ServerConnectionPoolConnections

MQL de Advertência:

ServerConnectionPoolConnections[5m].mean() > 1

MQL Crítico:

ServerConnectionPoolConnections[5m].mean() > 2

>1 >2  
5

Tempo de Processamento de Solicitação Web

Nome da métrica: WebRequestProcessingTime

Advertência:

WebRequestProcessingTime[5m].mean() > 10000

Crítico:

WebRequestProcessingTime[5m].mean() > 15000
>10,000 >15,000  
5

Threads do Pool de Threads Ativos

Nome da métrica: ThreadPoolThreads

Advertência:

ThreadPoolThreads[5m]{Status = "Active"}.mean() > 1000

Crítico:

ThreadPoolThreads[5m]{Status = "Active"}.mean() > 1250
>1,000 >1,250  

Regra de Alarme de Amostra: Cluster do Oracle Weblogic Server

  • Tipo de Recurso: Cluster do Oracle Weblogic Server

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: weblogic_cluster

Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
1

WebLogic Cluster Desativado

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer Cluster WebLogic em um determinado compartimento relatando estar inativo ou não relatando status por mais de 1 minuto.

Regras de Alarme de Amostra: Oracle HTTP Server (OHS)

  • Tipo de Recurso: Oracle HTTP Server

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: oracle_http_server

Período de Avaliação (minutos) Regra de Alarme Advertência Crítico Descrição
3

Oracle HTTP Server Inativo

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()

n/d n/d Alarme crítico para qualquer Oracle HTTP Server em um determinado compartimento reportando estar inativo ou não relatando status por mais de 3 minutos.
5

Alta Utilização da CPU

Nome da métrica: CPUUtilization

MQL de Advertência:

CPUUtilization[5m].mean() > 80

MQL Crítico:

CPUUtilization[5m].mean() > 90
>80 >90

Alarme de advertência para qualquer Oracle HTTP Server em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos.

Alarme crítico para qualquer Oracle HTTP Server em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos.

5

Alta Utilização da Memória

Nome da métrica: MemoryUtilization

MQL de Advertência:

MemoryUtilization[5m].mean() > 80

MQL Crítico:

MemoryUtilization[5m].mean() > 90

>80 >90

Alarme de advertência para qualquer Oracle HTTP Server em um determinado compartimento que reporte mais de 80% de utilização de memória nos últimos 5 minutos.

Alarme crítico para qualquer Oracle HTTP Server em um determinado compartimento que reporte mais de 90% de utilização de memória nos últimos 5 minutos.

5

Tempo de Processamento de Solicitação Web Alto

Nome da métrica: WebRequestProcessingTime

MQL de Advertência:

WebRequestProcessingTime[5m].mean() > 1500

MQL Crítico:

WebRequestProcessingTime[5m].mean() > 3000

>1,500 >3,000

Alarme de advertência para qualquer Oracle HTTP Server em um determinado compartimento que reporta mais de 1500 ms significa tempo de processamento de solicitação da Web nos últimos 5 minutos.

Alarme crítico para qualquer Oracle HTTP Server em um determinado compartimento que reporta mais de 3000 ms significa tempo de processamento de solicitação da Web nos últimos 5 minutos.

OIM (Oracle Identity Manager)

Regra de Alarme de Amostra: OIM (Oracle Identity Manager)

  • Tipo de Recurso: Cluster do Oracle Identity Manager/Oracle Identity Manager

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: oracle_oim / oracle_oim_cluster

Período de Avaliação (minutos) alarme Advertência Crítico Descrição
1

Status de Monitoramento

Nome da métrica: MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
n/d < 1

Status de disponibilidade do cluster/servidor do OIM.

Um alerta crítico será acionado se o valor da resposta for diferente de 1.

15

Orquestração - Tempo Médio de Execução

Nome da Métrica: Orchestration-AverageExecutionTime

MQL:

Orchestration-AverageExecutionTime[15m].mean() > 300 Orchestration-AverageExecutionTime[15m].mean() > 500
> 300 > 500

Tempo médio de execução da orquestração

Um alerta de advertência será acionado se o tempo médio de execução da orquestração for superior a 300 ms

Um alerta crítico será acionado se o tempo médio de execução da orquestração for superior a 500 ms

OAM (Oracle Access Manager)

Regra de Alarme de Amostra: OAM (Oracle Access Manager)

  • Tipo de Recurso: Oracle Access Manager/Cluster do Oracle Access Manager

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: oracle_oam / oracle_oam_cluster

Período de Avaliação (minutos) Regra de Alarme Advertência Crítico Descrição
1

Status de Monitoramento

Nome da métrica: MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
n/d < 1

Status de disponibilidade do cluster/servidor do OAM.

Um alerta crítico será acionado se o valor da resposta for diferente de 1.

5

Latência de Autorização

Nome da Métrica: AuthorizationLatency

MQL:

authorizationLatency[5m].mean() > 300 authorizationLatency[5m].mean() > 500
> 500 > 800

Latência de Autorização

Um alerta de aviso será acionado se a latência da autorização for superior a 500 ms

Um alerta crítico será acionado se a latência da autorização for superior a 800 ms

Oracle JVM

Tipo de Recurso: Runtime do Oracle JVM

ServerMetric Namespace: oracle_appmgmt

Grupo de Recursos: oracle_jvm

Período de Avaliação (minutos) Regra de Alarme Advertência Crítico Descrição
1

Runtime do Oracle JVM Inativo

Nome da Métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[1m].mean()!=1||MonitoringStatus[1m].absent()
n/d n/d Alarme Crítico para não ser mais possível estabelecer conexão com o Oracle JVM Runtime
5

Utilização do Pool de Memória

Nome da Métrica: MemoryPoolUtilization

Nome da dimensão: Type

Valor da dimensão: Used

MQL de Advertência:

MemoryPoolUtilization[5m]{Type="Used"}.mean()>80%

MQL Crítico:

MemoryPoolUtilization[5m]{Type=Used"}.mean()>90%
>80% >90% A porcentagem de memória usada nos pools de memória relativa ao máximo disponível
5

Utilização da Memória Heap Usada

Nome da Métrica:

HeapMemoryUtilization

Nome da dimensão: Type

Valor da dimensão: Used

MQL de Advertência:

HeapMemoryUtilization[5m]{Type="Used"}.mean()>80%

MQL Crítico:

HeapMemoryUtilization[5m]{Type = "Used"}.mean() >90%
>80% >90% A porcentagem de memória usada na memória heap em relação ao máximo disponível.
5

Utilização de Memória Não Heap Usada

Nome da Métrica:

NonHeapMemoryUtilization

Nome da dimensão: Type

Valor da dimensão: Used

MQL de Advertência:

NonHeapMemoryUtilization[5m]{Type="Used"}.mean()>80%

MQL Crítico:

NonHeapMemoryUtilization[5m]{Type = "Used"}.mean() >90%
>80% >90% A porcentagem de memória usada na memória não heap em relação ao máximo disponível.
5

Utilização da CPU

Nome da Métrica:

CPUUtilization

MQL de Advertência:

CPUUtilization[5m]. mean() > 80%

MQL Crítico:

CPUUtilization[5m]. mean() > 90%
>80% >90% A porcentagem de recursos de CPU consumidos pelo processo JVM

Apache HTTP Server

Tipo de Recurso: Apache HTTP

ServerMetric Namespace: oracle_appmgmt

Grupo de Recursos: apache_http_server

Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
3

Apache HTTP Server Inativo

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()

n/d n/d Alarme crítico para qualquer Apache HTTP Server em um determinado compartimento reportando estar inativo ou não relatando status por mais de 3 minutos.
5

Alta Utilização da CPU

Nome da métrica: CPUUtilization

MQL de Advertência:

CPUUtilization[5m].mean() > 80

MQL Crítico:

CPUUtilization[5m].mean() > 90

>80 >90

Alarme de advertência para qualquer Apache HTTP Server em um determinado compartimento que reporte mais de 80% de utilização da CPU nos últimos 5 minutos.

Alarme crítico para qualquer Apache HTTP Server em um determinado compartimento que reporta mais de 90% de utilização da CPU nos últimos 5 minutos.

5

Alta Utilização da Memória

Nome da métrica: MemoryUtilization

MQL de Advertência:

MemoryUtilization[5m].mean() > 80

MQL Crítico:

MemoryUtilization[5m].mean() > 90

>80 >90

Alarme de advertência para qualquer Apache HTTP Server em um determinado compartimento que reporte mais de 80% de utilização de memória nos últimos 5 minutos.

Alarme crítico para qualquer Apache HTTP Server em um determinado compartimento que reporta mais de 90% de utilização de memória nos últimos 5 minutos.

5

Tempo de Processamento de Solicitação Web Alto

Nome da métrica: WebRequestProcessingTime

MQL de Advertência:

WebRequestProcessingTime[5m].mean() > 1500

MQL Crítico:

WebRequestProcessingTime[5m].mean() > 3000

>1,500 >3,000

Alarme de advertência para qualquer Apache HTTP Server em um determinado compartimento que reporta mais de 1500 ms significa tempo de processamento de solicitações da Web nos últimos 5 minutos.

Alarme crítico para qualquer Apache HTTP Server em um determinado compartimento que reporta mais de 3000 ms significa tempo de processamento de solicitações da Web nos últimos 5 minutos.

Oracle Unified Directory

Regra de Alarme de Amostra: Oracle Unified Directory (OUD)

  • Tipo de Recurso: Oracle Unified Directory

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: oud_directory, oud_proxy, oud_gateway

alarme Advertência Crítico Descrição

Status de Monitoramento

Nome da métrica: oud_base_status

MQL:

oud_base_status[1m].mean() != 1 || oud_base_status[1m].absent()
n/d < 1

Status de disponibilidade do servidor OUD.

Um alerta crítico será acionado se o valor da resposta for menor que 1.

Handler de Conexões - Estado

Nome da Métrica: ConnectionHandlerState

MQL:

ConnectionHandlerState[1m].mean() < 1
n/d <1

Handler de Conexões

Um alerta crítico será acionado se o Estado do Handler de Conexão for menor que 1.

Backend - Entradas

Nome da Métrica: BackendEntries

MQL de Advertência:

BackendEntries[5m].mean() > 30

MQL Crítico:

BackendEntries[5m].mean() > 50
> 30 >50

Backend - Entradas

Um alerta de aviso será acionado se a Hora das Entradas de Backend for maior que 30.

Um alerta crítico será acionado se as Entradas de Backend forem maiores que 50.

Tempo Total de Permanência do Handler de Conexões

Nome da Métrica: ConnectionHandlerAllResidentTime

MQL de Advertência:

ConnectionHandlerAllResidentTime[5m].mean() > 300

MQL Crítico:

ConnectionHandlerAllResidentTime[5m].mean() > 500
> 300 > 500

Tempo Total de Permanência do Handler de Conexões

Um alerta de aviso será acionado se todo o tempo residente do manipulador de conexão for maior que 60.

Um alerta crítico será acionado se todo o tempo residente do manipulador de conexão for maior que 90.

Handler de Conexões - Conexões

Nome da Métrica: ConnectionHandlerConnections

MQL de Advertência:

ConnectionHandlerConnections[5m].mean() > 30

MQL Crítico:

ConnectionHandlerConnections[5m].mean() > 50
> 30 >50

Handler de Conexões - Conexões

Um alerta de aviso será acionado se as Conexões do Handler de Conexão forem maiores que 30.

Um alerta crítico será acionado se as Conexões do Handler de Conexão forem maiores que 50.

JVM - Memória Usada

Nome da Métrica: JVMUsedMemory

MQL de Advertência:

JVMUsedMemory[5m].mean() > 1.5

MQL Crítico:

JVMUsedMemory[5m].mean() > 3
> 1.5 > 3

JVM - Memória Usada

Um alerta de advertência será acionado se a Memória Usada da JVM for maior que 1,5 mb.

Um alerta crítico será acionado se a Memória Usada da JVM for maior que 3 mb.

Memória Usada do Sistema Operacional

Nome da Métrica: OSUsedMemory

MQL de Advertência:

OSUsedMemory[5m].mean() > 1.5

MQL Crítico:

OSUsedMemory[5m].mean() > 3
> 1.5 > 3

Memória Usada do Sistema Operacional

Um alerta de advertência será acionado se a Memória Usada do SO for maior que 1,5 mb.

Um alerta crítico será acionado se a Memória Usada do SO for maior que 3 mb.

Estado do Domínio de Replicação

Nome da Métrica: ReplicationDomainState

MQL:

ReplicationDomainState[5m].mean() < 1
n/d < 1

Estado do Domínio de Replicação

Um alerta crítico será acionado se o Estado do Domínio de Replicação for menor que 1.

Tempo Total das Operações de Tempo de Permanência do WFE

Nome da Métrica: WFEResidentTimeOperationsTotalTime

MQL de Advertência:

WFEResidentTimeOperationsTotalTime[5m].mean() > 60

MQL Crítico:

WFEResidentTimeOperationsTotalTime[5m].mean() > 90
> 60 > 90

Tempo Total das Operações de Tempo de Permanência do WFE

Um alerta de aviso será acionado se o Tempo Total de Operações de Tempo de Residente WFE for maior que 60.

Um alerta crítico será acionado se o Tempo Total de Operações de Tempo Residente de WFE for maior que 90.

Backlog Atual da Fila de Trabalho

Nome da Métrica: WorkQueueCurrentBacklog

MQL de Advertência:

WorkQueueCurrentBacklog[5m].mean() > 15

MQL Crítico:

WorkQueueCurrentBacklog[5m].mean() > 30
> 15 > 30

Backlog Atual da Fila de Trabalho

Um alerta de aviso será acionado se o Backlog Atual da Fila de Trabalho for maior que 15.

Um alerta crítico será acionado se o Backlog Atual da Fila de Trabalho for maior que 30.

Extensão LDAP – Conexões

Nome da Métrica: ExtensionLDAPConnections

MQL de Advertência:

ExtensionLDAPConnections[5m].mean() > 30

MQL Crítico:

ExtensionLDAPConnections[5m].mean() > 50
> 30 > 50

Extensão LDAP - Conexões

Um alerta de aviso será acionado se as Conexões LDAP de Extensão forem maiores que 30.

Um alerta crítico será acionado se as Conexões LDAP de Extensão forem maiores que 50.

Extensão LDAP – Tempo Total de Resposta das Operações

Nome da Métrica: ExtensionLDAPOperationsTotalResponseTime

MQL de Advertência:

ExtensionLDAPOperationsTotalResponseTime[5m].mean() > 60

MQL Crítico:

ExtensionLDAPOperationsTotalResponseTime[5m].mean() > 90
> 60 > 90

Extensão LDAP - Tempo Total de Resposta das Operações

Um alerta de aviso será acionado se o Tempo Total de Resposta das Operações LDAP de Extensão for maior que 60.

Um alerta crítico será acionado se o Tempo Total de Resposta das Operações LDAP de Extensão for maior que 90.

Oracle GoldenGate

Regra de Alarme de Amostra: Goldengate

  • Tipo de Recurso: Oracle Goldengate

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: oracle_goldengate

Período de Avaliação (minutos) Regra de Alarme Advertência Crítico Descrição
1

Goldengate Down

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer Goldengate em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1 minuto.

Regra de alarme de amostra: Goldengate AdminServer

  • Tipo de Recurso: Goldengate Admin Server

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: oracle_goldengate_admin_server

Período de Avaliação (minutos) Regra de Alarme Advertência Crítico Descrição
1

Servidor de Administração do Goldengate Inativo

Nome da métrica: MonitoringStatusCritical

MQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer Goldengate AdminServer em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1 minuto.
5

Alta Utilização da CPU

Nome da métrica:CpuTimeUtilizationPercentage

MQL de Advertência:

CpuTimeUtilizationPercentage[5m].mean() > 80

MQL Crítico:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 Alarme de advertência para qualquer Servidor Admin Goldengate em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos. Alarme crítico para qualquer Servidor Admin Goldengate em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos.
5

Memória privada

Nome da métrica: PrivateMemory

MQL de Advertência:

PrivateMemory[5m].mean() > 30

MQL Crítico:

PrivateMemory[5m].mean() > 40
30 40 Um alerta de advertência será acionado se a média de memória Privada for superior a 30 GB nos últimos 5 minutos. Um alerta crítico será acionado se a média de memória Privada for superior a 40 GB nos últimos 5 minutos.
5

Taxa de leitura de Entrada/Saída

Nome da métrica: IOReadRate

MQL de Advertência:

IOReadRate[5m].mean() > 10

MQL Crítico:

IOReadRate[5m].mean() > 20
10 20 Um alerta de aviso será acionado se a média da taxa de leitura de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de leitura de E/S for maior que 20 MB/s nos últimos 5 minutos.
5

Taxa de gravação de Entrada/Saída

Nome da métrica: IOWriteRate

MQL de Advertência:

IOWriteRate[5m].mean() > 10

MQL Crítico:

IOWriteRate[5m].mean() > 20
10 20 Um alerta de aviso será acionado se a média da taxa de gravação de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de gravação de E/S for superior a 20 MB/s nos últimos 5 minutos.
5

Taxa de pacotes eliminados

Nome da métrica: DroppedPacketRate

MQL de Advertência:

DroppedPacketRate[5m].mean() > 30

MQL Crítico:

DroppedPacketRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de pacote entregue for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacotes eliminados for superior a 40 Msgs/min nos últimos 5 minutos.
5

Taxa de pacotes perdidos

Nome da métrica: MissingPacketRate

MQL de Advertência:

MissingPacketRate[5m].mean() > 30

MQL Crítico:

MissingPacketRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de pacote Ausente for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacote Ausente for superior a 40 Mensagens/min nos últimos 5 minutos.
5

Taxa de erros do pacote

Nome da métrica: PacketErrorRate

MQL de Advertência:

PacketErrorRate[5m].mean() > 30

MQL Crítico:

PacketErrorRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de erro do Pacote for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de erro do Pacote for superior a 40 Mensagens/min nos últimos 5 minutos.
5

Taxa de recebimento de pacotes

Nome da métrica: PacketReceiveRate

MQL de Advertência:

PacketReceiveRate[5m].mean() > 30

MQL Crítico:

PacketReceiveRate[5m].mean() > 40
30 40

Um alerta de aviso será acionado se a média da taxa de recebimento do Pacote for superior a 30 Msgs/min nos últimos 5 minutos.

Um alerta crítico será acionado se a média da taxa de recebimento do Pacote for superior a 40 Msgs/min nos últimos 5 minutos.

Regra de Alarme de Amostra: Serviço de Distribuição Goldengate

  • Tipo de Recurso: Serviço de Distribuição Goldengate

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: oracle_goldengate_distribution_server

Período de Avaliação (minutos) Regra de Alarme Aviso Crítico Descrição
1

Serviço de Distribuição Goldengate

Nome da métrica: MonitoringStatus

MQL Crítico:MonitoringStatus

[1m].mean() == 0 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer Serviço de Distribuição Goldengate em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1min.
5

Alta Utilização da CPU

Nome da métrica: CpuTimeUtilizationPercentage

MQL de Advertência:

CpuTimeUtilizationPercentage[5m].mean() > 80

MQL Crítico:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 Alarme de aviso para qualquer Serviço de Distribuição Goldengate em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos. Alarme crítico para qualquer Serviço de Distribuição Goldengate em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos.
5

Memória privada

Nome da métrica: PrivateMemory

MQL de Advertência:

PrivateMemory[5m].mean() > 30

MQL Crítico:

PrivateMemory[5m].mean() > 40
30 40 Um alerta de advertência será acionado se a média de memória Privada for superior a 30 GB nos últimos 5 minutos. Um alerta crítico será acionado se a média de memória Privada for superior a 40 GB nos últimos 5 minutos.
5

Taxa de leitura de Entrada/Saída

Nome da métrica: IOReadRate

MQL de Advertência:

IOReadRate[5m].mean() > 10

MQL Crítico:

IOReadRate[5m].mean() > 20
10 20 Um alerta de aviso será acionado se a média da taxa de leitura de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de leitura de E/S for maior que 20 MB/s nos últimos 5 minutos.
5

Taxa de gravação de Entrada/Saída

Nome da métrica: IOWriteRate

MQL de Advertência:

IOWriteRate[5m].mean() > 10

MQL Crítico:

IOWriteRate[5m].mean() > 20
10 20 Um alerta de aviso será acionado se a média da taxa de gravação de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de gravação de E/S for superior a 20 MB/s nos últimos 5 minutos.
5

Taxa de pacotes eliminados

Nome da métrica: DroppedPacketRate

MQL de Advertência:

DroppedPacketRate[5m].mean() > 30

MQL Crítico:

DroppedPacketRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de pacote entregue for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacotes eliminados for superior a 40 Msgs/min nos últimos 5 minutos.
5

Taxa de pacotes perdidos

Nome da métrica: MissingPacketRate

MQL de Advertência:

MissingPacketRate[5m].mean() > 30

MQL Crítico:

MissingPacketRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de pacote Ausente for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacote Ausente for superior a 40 Mensagens/min nos últimos 5 minutos.
5

Taxa de erros do pacote

Nome da métrica: PacketErrorRate

MQL de Advertência:

PacketErrorRate[5m].mean() > 30

MQL Crítico:

PacketErrorRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de erro do Pacote for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de erro do Pacote for superior a 40 Mensagens/min nos últimos 5 minutos.
5

Taxa de recebimento de pacotes

Nome da métrica: PacketReceiveRate

MQL de Advertência:

PacketReceiveRate[5m].mean() > 30

MQL Crítico:

PacketReceiveRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de recebimento do Pacote for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de recebimento do Pacote for superior a 40 Msgs/min nos últimos 5 minutos.

Regra de Alarme de Amostra: Serviço do Receptor Goldengate

  • Tipo de Recurso: Goldengate Receiver Service

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: oracle_goldengate_receiver_server

Período de Avaliação (minutos) Regra de alarme Aviso Crítico Descrição
1

Serviço Recebedor de Goldengate

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer Serviço de Receptor Goldengate em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1min.
5

Alta Utilização da CPU

Nome da métrica: CpuTimeUtilizationPercentage

MQL de Advertência:

CpuTimeUtilizationPercentage[5m].mean() > 80

MQL Crítico:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 Alarme de aviso para qualquer Serviço Receptor Goldengate em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos. Alarme crítico para qualquer Serviço Receptor Goldengate em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos.
5

Memória privada

Nome da métrica: PrivateMemory

MQL de Advertência:

PrivateMemory[5m].mean() > 30

MQL Crítico:

PrivateMemory[5m].mean() > 40
30 40 Um alerta de advertência será acionado se a média de memória Privada for superior a 30 GB nos últimos 5 minutos. Um alerta crítico será acionado se a média de memória Privada for superior a 40 GB nos últimos 5 minutos.
5

Taxa de leitura de Entrada/Saída

Nome da métrica: IOReadRate

MQL de Advertência:

IOReadRate[5m].mean() > 10

MQL Crítico:

IOReadRate[5m].mean() > 20
10 20 Um alerta de aviso será acionado se a média da taxa de leitura de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de leitura de E/S for maior que 20 MB/s nos últimos 5 minutos.
5

Taxa de gravação de Entrada/Saída

Nome da métrica: IOWriteRate

MQL de Advertência:

IOWriteRate[5m].mean() > 10

MQL Crítico:

IOWriteRate[5m].mean() > 20
10 20 Um alerta de aviso será acionado se a média da taxa de gravação de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de gravação de E/S for superior a 20 MB/s nos últimos 5 minutos.
5

Taxa de pacotes eliminados

Nome da métrica: DroppedPacketRate p

MQL de Advertência:

DroppedPacketRate[5m].mean() > 30

MQL Crítico:

DroppedPacketRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de pacote entregue for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacotes eliminados for superior a 40 Msgs/min nos últimos 5 minutos.
5

Taxa de pacotes perdidos

Nome da métrica: MissingPacketRate

MQL de Advertência:

MissingPacketRate[5m].mean() > 30

MQL Crítico:

MissingPacketRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de pacote Ausente for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacote Ausente for superior a 40 Mensagens/min nos últimos 5 minutos.
5

Taxa de erros do pacote

Nome da métrica: PacketErrorRate

MQL de Advertência:

PacketErrorRate[5m].mean() > 30

MQL Crítico:

PacketErrorRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de erro do Pacote for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de erro do Pacote for superior a 40 Mensagens/min nos últimos 5 minutos.
5

Taxa de recebimento de pacotes

Nome da métrica: PacketReceiveRate

MQL de Advertência:

PacketReceiveRate[5m].mean() > 30

MQL Crítico:

PacketReceiveRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de recebimento do Pacote for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de recebimento do Pacote for superior a 40 Msgs/min nos últimos 5 minutos.

Regra de Alarme de Amostra: Gerenciador de Serviços Goldengate

  • Tipo de Recurso: Goldengate Service Manager

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: oracle_goldengate_service_manager

Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
1

Gerenciador de Serviço do Goldengate

Nome da métrica: MonitoringStatus

StatusCritical MQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer Goldengate Service Manager em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1min.

Regra de Alarme de Amostra: Serviço de Métrica de Desempenho Goldengate

  • Tipo de Recurso: Goldengate Performance Metric Service

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: oracle_goldengate_pm_server

Período de Avaliação (minutos) Regra de Alarme Advertência Crítico Descrição
1

Serviço de Métricas de Desempenho Goldengate

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer Serviço de Métrica de Desempenho Goldengate em um determinado compartimento que esteja inativo ou não reporte o status por mais de 1 minuto.
5

Alta Utilização da CPU

Nome da métrica: CpuTimeUtilizationPercentage

MQL de Advertência:

CpuTimeUtilizationPercentage[5m].mean() > 80

MQL Crítico:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 Alarme de advertência para qualquer Serviço de Métrica de Desempenho Goldengate em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos. Alarme crítico para qualquer Serviço de Métrica de Desempenho Goldengate em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos.
5

Memória privada

Nome da métrica: PrivateMemory

MQL de Advertência:

PrivateMemory[5m].mean() > 30

MQL Crítico:

PrivateMemory[5m].mean() > 40
30 40 Um alerta de advertência será acionado se a média de memória Privada for superior a 30 GB nos últimos 5 minutos. Um alerta crítico será acionado se a média de memória Privada for superior a 40 GB nos últimos 5 minutos.
5

Taxa de leitura de Entrada/Saída

Nome da métrica: IOReadRate

MQL de Advertência:

IOReadRate[5m].mean() > 10

MQL Crítico:

IOReadRate[5m].mean() > 20
10 20 Um alerta de aviso será acionado se a média da taxa de leitura de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de leitura de E/S for maior que 20 MB/s nos últimos 5 minutos.
5

Taxa de gravação de Entrada/Saída

Nome da métrica: IOWriteRate

MQL de Advertência:

IOWriteRate[5m].mean() > 10

MQL Crítico:

IOWriteRate[5m].mean() > 20
10 20 Um alerta de aviso será acionado se a média da taxa de gravação de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de gravação de E/S for superior a 20 MB/s nos últimos 5 minutos.

Regra de Alarme de Amostra: Extrato de Goldengate

  • Tipo de Recurso: Extrato de Goldengate

  • Tipo de Recurso: goldengate_extract

  • Grupo de Recursos: oracle_goldengate_extract

Período de Avaliação (minutos) Regra de alarme Aviso Crítico Descrição
1

Extrato de Goldengate

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer Extração Goldengate em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1 minuto.
5

Alta Utilização da CPU

Nome da métrica: CpuTimeUtilizationPercentage

MQL de Advertência:

CpuTimeUtilizationPercentage[5m].mean() > 80

MQL Crítico:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 Alarme de advertência para qualquer Extração Goldengate em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos. Alarme crítico para qualquer Extração Goldengate em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos.
5

Memória privada

Nome da métrica: PrivateMemory

MQL de Advertência:

PrivateMemory[5m].mean() > 30

MQL Crítico:

PrivateMemory[5m].mean() > 40
30 40 Um alerta de advertência será acionado se a média de memória Privada for superior a 30 GB nos últimos 5 minutos. Um alerta crítico será acionado se a média de memória Privada for superior a 40 GB nos últimos 5 minutos.
5

Taxa de leitura de Entrada/Saída

Nome da métrica: IOReadRate

MQL de Advertência:

IOReadRate[5m].mean() > 10

MQL Crítico:

IOReadRate[5m].mean() > 20
10 20 Um alerta de aviso será acionado se a média da taxa de leitura de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de leitura de E/S for maior que 20 MB/s nos últimos 5 minutos.
5

Taxa de gravação de Entrada/Saída

Nome da métrica: IOWriteRate

MQL de Advertência:

IOWriteRate[5m].mean() > 10

MQL Crítico:

IOWriteRate[5m].mean() > 20
10 20 Um alerta de aviso será acionado se a média da taxa de gravação de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de gravação de E/S for superior a 20 MB/s nos últimos 5 minutos.
5

Taxa de pacotes eliminados

Nome da métrica: DroppedPacketRate

MQL de Advertência:

DroppedPacketRate[5m].mean() > 30

MQL Crítico:

DroppedPacketRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de pacote entregue for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacotes eliminados for superior a 40 Msgs/min nos últimos 5 minutos.
5

Taxa de pacotes perdidos

Nome da métrica: MissingPacketRate

MQL de Advertência:

MissingPacketRate[5m].mean() > 30

MQL Crítico:

MissingPacketRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de pacote Ausente for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacote Ausente for superior a 40 Mensagens/min nos últimos 5 minutos.
5

Taxa de erros do pacote

Nome da métrica: PacketErrorRate

MQL de Advertência:

PacketErrorRate[5m].mean() > 30

MQL Crítico:

PacketErrorRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de erro do Pacote for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de erro do Pacote for superior a 40 Mensagens/min nos últimos 5 minutos.
5

Taxa de recebimento de pacotes

Nome da métrica: PacketReceiveRate

MQL de Advertência:

PacketReceiveRate[5m].mean() > 30

MQL Crítico:

PacketReceiveRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de recebimento do Pacote for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de recebimento do Pacote for superior a 40 Msgs/min nos últimos 5 minutos.
5

Taxa de instruções DELETE mapeadas

Nome da métrica: MappedDeleteRate

MQL de Advertência:

MappedDeleteRate[5m].mean() > 30

MQL Crítico:

MappedDeleteRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de exclusão Mapeada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de exclusão Mapeada for superior a 40 MB/s nos últimos 5 minutos.
5

Taxa de inserção mapeada

Nome da métrica: MappedInsertRate

MQL de Advertência:

MappedInsertRate[5m].mean() > 30

MQL Crítico:

MappedInsertRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de inserção Mapeada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de inserção Mapeada for superior a 40 MB/s nos últimos 5 minutos.
5

Taxa de truncamento mapeada

Nome da métrica: MappedTruncateRate

MQL de Advertência:

MappedTruncateRate[5m].mean() > 30

MQL Crítico:

MappedTruncateRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de truncamento Mapeado for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de truncamento Mapeado for superior a 40 MB/s nos últimos 5 minutos.
5

Taxa de atualização mapeada

Nome da métrica: MappedUpdateRate

MQL de Advertência:

MappedUpdateRate[5m].mean() > 30

MQL Crítico:

MappedUpdateRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de atualização Mapeada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de atualização mapeada for superior a 40 MB/s nos últimos 5 minutos.
5

Taxa de descarte

Nome da métrica: DiscardRate

MQL de Advertência:

DiscardRate[5m].mean() > 30

MQL Crítico:

DiscardRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de descarte for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de descarte for maior que 40 MB/s nos últimos 5 minutos.
5

Ignorar taxa

Nome da métrica: IgnoreRate

MQL de Advertência:

IgnoreRate[5m].mean() > 30

MQL Crítico:

IgnoreRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa Ignorar for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa Ignorar for maior que 40 MB/s nos últimos 5 minutos.
5

Lag

Nome da métrica: Lag

MQL de Advertência:

Lag[5m].mean() > 10

MQL Crítico:

Lag[5m].mean() > 20
10 20 Um alerta de aviso será acionado se a média de Lag for maior que 10 segundos nos últimos 5 minutos. Um alerta crítico será acionado se a média de Lag for maior que 20 Sseg nos últimos 5 minutos.
5

Taxa de operações

Nome da métrica: OperationsPerSec

MQL de Advertência:

OperationsPerSec[5m].mean() > 30

MQL Crítico:

OperationsPerSec[5m].mean() > 40
20 30 Um alerta de aviso será acionado se a média da taxa de Operações for superior a 20 Ops/seg nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de operações for superior a 30 Ops/seg nos últimos 5 minutos.

Regra de Alarme de Amostra: Goldengate Replicat

  • Tipo de Recurso: Goldengate Replicat

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: oracle_goldengate_replicat

Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
1

Processo de Replicação do Goldengate

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer Goldengate Replicat em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1 minuto.
5

Alta Utilização da CPU

Nome da métrica: CpuTimeUtilizationPercentage

MQL de Advertência:

CpuTimeUtilizationPercentage[5m].mean() > 80

MQL Crítico:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 Alarme de advertência para qualquer Goldengate Replicat em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos. Alarme crítico para qualquer Goldengate Replicat em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos.
5

Memória privada

Nome da métrica: PrivateMemory

MQL de Advertência:

PrivateMemory[5m].mean() > 30

MQL Crítico:

PrivateMemory[5m].mean() > 40
30 40 Um alerta de advertência será acionado se a média de memória Privada for superior a 30 GB nos últimos 5 minutos. Um alerta crítico será acionado se a média de memória Privada for superior a 40 GB nos últimos 5 minutos.
5

Taxa de leitura de Entrada/Saída

Nome da métrica: IOReadRate

MQL de Advertência:

IOReadRate[5m].mean() > 10

MQL Crítico:

IOReadRate[5m].mean() > 20
10 20 Um alerta de aviso será acionado se a média da taxa de leitura de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de leitura de E/S for maior que 20 MB/s nos últimos 5 minutos.
5

Taxa de gravação de Entrada/Saída

Nome da métrica: IOWriteRate

MQL de Advertência:

IOWriteRate[5m].mean() > 10

MQL Crítico:

IOWriteRate[5m].mean() > 20
10 20 Um alerta de aviso será acionado se a média da taxa de gravação de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de gravação de E/S for superior a 20 MB/s nos últimos 5 minutos.
5

Taxa de pacotes eliminados

Nome da métrica: DroppedPacketRate

MQL de Advertência:

DroppedPacketRate[5m].mean() > 30

MQL Crítico:

DroppedPacketRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de pacote entregue for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacotes eliminados for superior a 40 Msgs/min nos últimos 5 minutos.
5

Taxa de pacotes perdidos

Nome da métrica: MissingPacketRate

MQL de Advertência:

MissingPacketRate[5m].mean() > 30

MQL Crítico:

MissingPacketRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de pacote Ausente for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacote Ausente for superior a 40 Mensagens/min nos últimos 5 minutos.
5

Taxa de erros do pacote

Nome da métrica:

PacketErrorRate

MQL de Advertência:

PacketErrorRate[5m].mean() > 30

MQL Crítico:

PacketErrorRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de erro do Pacote for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de erro do Pacote for superior a 40 Mensagens/min nos últimos 5 minutos.
5

Taxa de recebimento de pacotes

Nome da métrica: PacketReceiveRate

MQL de Advertência:

PacketReceiveRate[5m].mean() > 30

MQL Crítico:

PacketReceiveRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de recebimento do Pacote for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de recebimento do Pacote for superior a 40 Msgs/min nos últimos 5 minutos.
5

Taxa de instruções DELETE mapeadas

Nome da métrica: MappedDeleteRate

MQL de Advertência:

MappedDeleteRate[5m].mean() > 30

MQL Crítico:

MappedDeleteRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de exclusão Mapeada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de exclusão Mapeada for superior a 40 MB/s nos últimos 5 minutos.
5

Taxa de inserção mapeada

Nome da métrica: MappedInsertRate

MQL de Advertência:

MappedInsertRate[5m].mean() > 30

MQL Crítico:

MappedInsertRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de inserção Mapeada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de inserção Mapeada for superior a 40 MB/s nos últimos 5 minutos.
5

Taxa de truncamento mapeada

Nome da métrica: MappedTruncateRate

MQL de Advertência:

MappedTruncateRate[5m].mean() > 30

MQL Crítico:

MappedTruncateRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de truncamento Mapeado for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de truncamento Mapeado for superior a 40 MB/s nos últimos 5 minutos.
5

Taxa de atualização mapeada

Nome da métrica: MappedUpdateRate

MQL de Advertência:

MappedUpdateRate[5m].mean() > 30

MQL Crítico:

MappedUpdateRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de atualização Mapeada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de atualização mapeada for superior a 40 MB/s nos últimos 5 minutos.
5

Taxa de descarte

Nome da métrica: DiscardRate

MQL de Advertência:

DiscardRate[5m].mean() > 30

MQL Crítico:

DiscardRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de descarte for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de descarte for maior que 40 MB/s nos últimos 5 minutos.
5

Ignorar taxa

Nome da métrica: IgnoreRate

MQL de Advertência:

IgnoreRate[5m].mean() > 30

MQL Crítico:

IgnoreRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa Ignorar for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa Ignorar for maior que 40 MB/s nos últimos 5 minutos.
5

Lag

Nome da métrica: Lag

MQL de Advertência:

Lag[5m].mean() > 30

MQL Crítico:

Lag[5m].mean() > 40
10 20 Um alerta de aviso será acionado se a média de Lag for maior que 10 segundos nos últimos 5 minutos. Um alerta crítico será acionado se a média de Lag for maior que 20 Sseg nos últimos 5 minutos.
5

Taxa de operações

Nome da métrica: OperationsPerSec

MQL de Advertência:

OperationsPerSec[5m].mean() > 30

MQL Crítico:

OperationsPerSec[5m].mean() > 40
20 30 Um alerta de aviso será acionado se a média da taxa de Operações for superior a 20 Ops/seg nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de operações for superior a 30 Ops/seg nos últimos 5 minutos.

Regra de Alarme de Amostra: Caminho de Distribuição do Goldengate

  • Tipo de Recurso: Caminho de Distribuição do Goldengate

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: oracle_goldengate_distribution_path

Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
1

Caminho de Distribuição Goldengate

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer Caminho de Distribuição Goldengate em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1min.
5

Lag

Nome da métrica: Lag

MQL de Advertência:

Lag[5m].mean() > 30

MQL Crítico:

Lag[5m].mean() > 40
10 20 Um alerta de aviso será acionado se a média de Lag for maior que 10 segundos nos últimos 5 minutos. Um alerta crítico será acionado se a média de Lag for maior que 20 Sseg nos últimos 5 minutos.
5

Taxa de envio de rede

Nome da métrica: NetworkSentRate

MQL de Advertência:

NetworkSentRate[5m].mean() > 30

MQL Crítico:

NetworkSentRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de envio da Rede for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de envio da Rede for superior a 40 MB/s nos últimos 5 minutos.
5

Taxa de recebimento de rede

Nome da métrica: NetworkReceiveRate

MQL de Advertência:

NetworkReceiveRate[5m].mean() > 30

MQL Crítico:

NetworkReceiveRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média de recebimento da Rede enviada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de recebimento da Rede for superior a 40 MB/s nos últimos 5 minutos.

Regra de Alarme de Amostra: Caminho do Receptor Goldengate

  • Tipo de Recurso: Caminho do Destinatário do Goldengate

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: oracle_goldengate_receiver_path

Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
1

Caminho do Destinatário de Goldengate

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer Caminho do Receptor Goldengate em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1min.
5

Lag

Nome da métrica: Lag

MQL de Advertência:

Lag[5m].mean() > 30

MQL Crítico:

Lag[5m].mean() > 40
10 20 Um alerta de aviso será acionado se a média de Lag for maior que 10 segundos nos últimos 5 minutos. Um alerta crítico será acionado se a média de Lag for maior que 20 Sseg nos últimos 5 minutos.
5

Taxa de envio de rede

Nome da métrica: NetworkSentRate

MQL de Advertência:

NetworkSentRate[5m].mean() > 30

MQL Crítico:

NetworkSentRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média da taxa de envio da Rede for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de envio da Rede for superior a 40 MB/s nos últimos 5 minutos.
5

Taxa de recebimento de rede

Nome da métrica: NetworkReceiveRate

MQL de Advertência:

NetworkReceiveRate[5m].mean() > 30

MQL Crítico:

NetworkReceiveRate[5m].mean() > 40
30 40 Um alerta de aviso será acionado se a média de recebimento da Rede enviada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de recebimento da Rede for superior a 40 MB/s nos últimos 5 minutos.

Regras de Alarme de Amostra de Recurso Personalizado com Base em Processo

  • Tipo de Recurso: Recurso Personalizado

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: custom_resource

Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
1

Recurso Personalizado Inativo

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer recurso personalizado em um determinado compartimento que esteja inativo ou que não esteja reportando o status por mais de 1 minuto.
5

Alta Utilização da CPU

Nome da métrica: CpuUtilization

MQL de Advertência:

CpuUtilization[1m].mean() > 80

MQL Crítico:

CpuUtilization[1m].mean() > 90
>80 >90

Alarme de advertência para qualquer recurso personalizado em um determinado compartimento que reporte mais de 80% de utilização de CPU em 5 minutos.

Alarme crítico para qualquer recurso personalizado em um determinado compartimento que reporte mais de 90% de utilização de CPU em 5 minutos.

15

Alta Utilização da Memória

Nome da Métrica: MemoryUtilization

MQL de Advertência:

MemoryUtilization[1m].mean() > 80

MQL Crítico:

MemoryUtilization[1m].mean() > 90
>80 >90

Alarme de advertência para qualquer recurso personalizado em um determinado compartimento que reporte mais de 80% de utilização de memória em 15 minutos.

Alarme crítico para qualquer recurso personalizado em um determinado compartimento que reporte mais de 90% de utilização de memória em 15 minutos.

OSS (Oracle Service Bus)

  • Tipo de Recurso: Oracle Service Bus

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: oracle_servicebus

Período de Avaliação (minutos) Regra de alarme Advertência Crítico Descrição
1

Status de Monitoramento

Nome da métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico para qualquer Service Bus em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1 minuto.
5

Erros do Service Bus

Nome da métrica: ServiceBusErrors

MQL Crítico:

ServiceBusErrors[1m].mean() > 0
n/d >0 Alarme crítico para qualquer Service Bus em um determinado compartimento que reporta quando há erros em qualquer um dos serviços OSB por mais de 5 minutos.

IIS da Microsoft

  • Tipo de Recurso: IIS

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: microsoft_iis

Período de Avaliação Regra de alarme Advertência Crítico Descrição:
1

IIS Inativo

Nome da Métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()

n/d n/d Alarme Crítico por não ser mais capaz de se conectar ao IIS
5

ASP.Net Reinicialização do Processo de Colaborador

Nome da Métrica: ASPDotNetWorkerProcessRestarts

MQL Crítico:

ASPDotNetWorkerProcessRestarts[1m].mean() > 1
>1 n/d Alarme crítico para saber se tivemos Reinicializações do Processo do Colaborador. Isso pode ser causado por várias coisas e causar problemas, incluindo impacto no desempenho e perda de informações.
5

ASP.Net Solicitações Enfileiradas

Nome da Métrica: ASPDotNetRequests.Type.Queued

MQL de Advertência:

ASPDotNetRequests.Type.Queued[1m].mean() > 5

MQL Crítico:

ASPDotNetRequests.Type.Queued[1m].mean() > 10
>5 >10 Limite Crítico/Aviso para informar se as solicitações HTTP de entrada estão sendo colocadas em uma fila devido ao carregamento.
5

ASP.Net Taxa de Erros

Nome da Métrica: ErrorRate

MQL de Advertência:

ErrorRate[1m].mean() > 1%*

MQL Crítico:

ErrorRate[1m].mean() > 2%*
> 1%* > 2%* Limite Crítico/de Advertência para alertar o usuário de que a taxa de erro de um Aplicativo ASP.Net está acima de um determinado limite. Esta métrica retorna em erros/segundo; portanto, o limite precisará ser definido com base na média total de solicitações que eles recebem. Por exemplo, se eles geralmente recebem 100 solicitações/seg, sugerimos 1 erro para um aviso e 2 para um crítico.
  • Tipo de Recurso: Site do IIS

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: microsoft_iis

Período de Avaliação (em minutos) Regra de alarme Advertência Crítico Descrição:
1

Site do IIS Desativado

Nome da Métrica: MonitoringStatus

MQL Crítico:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
n/d n/d Alarme crítico por não poder mais se conectar ao site do IIS
5

WWW - Conexões Atuais

Nome da Métrica: CurrentConnections.Service.WWW

MQL de Advertência:

CurrentConnections.Service.WWW[1m].mean() > 90%*

MQL Crítico:

CurrentConnections.Service.WWW[1m].mean() > 95%*
> 90%* > 95%* Limite crítico/de advertência para alertar o usuário de que o número de conexões está se aproximando do máximo. Observe que o cliente precisará definir o número como 90 / 95% de suas conexões máximas. A métrica é um número; portanto, esse alerta que está sendo definido será exclusivo para cada cliente. Por exemplo, se o usuário tiver 200 conexões totais permitidas, sugerimos 180 para aviso e 190 para crítico.

O nas

  • Tipo de Recurso: NGINX

  • Namespace da Métrica: oracle_appmgmt

  • Grupo de Recursos: nginx

Período de Avaliação Regra de alarme Advertência Crítico Descrição:
3

Nginx inativo

Nome para Exibição: MonitoringStatus

MQL:

MonitoringStatus[3m].mean() != 1 ||MonitoringStatus[1m].absent()

n/d 0

Alarme para não ser possível estabelecer conexão com o ponto final da API NGINX.

5

Taxa de Processos Reapresentados

Nome da Métrica: RespawnedProcessesRate

MQL de Advertência:

RespawnedProcessesRate[5m].mean() > 1

MQL Crítico:

RespawnedProcessesRate[5m].mean() > 2

>1 >2

O número de processos que foram ressurgidos durante o intervalo.

5

Taxa de Verificações de Integridade de Upstreams Http Não Íntegras

Nome da Métrica: HttpUpstreamsHealthChecksRate

Nome da dimensão: Type

Valor da dimensão: Unhealthy

MQL de Advertência:

HttpUpstreamsHealthChecksRate[5m]{Type = "Unhealthy"}.mean() > 1

>1 n/d

Estado insalubre detectado pelo NGINX que pode afetar negativamente o desempenho ou a disponibilidade.

5

Taxa de Verificações de Integridade do Stream Upstreams Insalubre >1 Estado Insalubre detectado pelo desempenho ou disponibilidade do NGINX

Nome da Métrica:

StreamUpstreamsHealthChecksRate

Nome da dimensão: Type

Valor da dimensão: Unhealthy

MQL de Advertência:

StreamUpstreamsHealthChecksRate[5m] {Type = "Unhealthy"}.mean() > 1

>1 n/d

Estado não íntegro detectado pelo NGINX que pode afetar negativamente o desempenho ou a disponibilidade

Extensões de Métrica

Você pode criar regras de alarme para acionar alarmes quando os valores de métrica das Extensões de Métrica ultrapassarem os limites. Use o mesmo workflow geral que você seguiria para criar uma regra de alarme para métricas incorporadas para seus recursos. A principal diferença está na seção de descrição Métrica.

  • Compartimento: escolha o compartimento do recurso no qual a Extensão Métrica foi ativada
  • Namespace de métrica: selecione oracle_metric_extensions_appmgmt
  • Grupo de recursos: o tipo de recurso no qual a extensão da métrica foi implantada.

A criação de uma regra de Alarme para uma Extensão Métrica de um host é mostrada na imagem abaixo:


criando regras de alarme para extensões de métrica