Definindo Alarmes
Você pode usar o serviço Oracle Cloud Infrastructure Monitoring para gerar alarmes quando métricas ultrapassam limites.
Primeiro, familiarize-se com os conceitos e recursos do serviço Monitoring revisando a Visão Geral do Serviço Monitoring. Para obter mais informações sobre como configurar alarmes, consulte Gerenciando Alarmes. Consulte Referência de MQL (Monitoring Query Language) para construir consultas avançadas para monitoramento e alarmes.
Certifique-se também de definir as políticas apropriadas para usar regras de alarme. Consulte Conceitos Básicos.
Antes de continuar, você deve ter criado um destino de alarme, por exemplo, serviço de Notificação, bem como tópico(s) que definem quem receberá esses alarmes.
A tabela a seguir lista os detalhes da métrica necessários para criar regras de alarme para métricas usadas no Stack Monitoring.
Tipo de Recurso | Namespace da Métrica | Grupo de Recursos da Regra de Alerta | Regras de alarme | Referência de Métricas |
---|---|---|---|---|
Host
|
oracle_appmgmt |
host |
||
Oracle Databases não contêiner, contêiner e plugável | oracle_oci_database |
não aplicável | Oracle Database | Oracle Database |
Sistema, ASM, Cluster e Listener do Oracle Database | oracle_oci_database_cluster |
oracle_asm , oracle_cluster , oracle_db_node , oracle_lsnr |
Oracle Database | Cluster do Oracle Database |
Domínio do Oracle WebLogic Oracle WebLogic Cluster |
oracle_appmgmt |
|
Oracle Weblogic Server | WebLogic Métrica |
Oracle WebLogic Server | oracle_appmgmt |
weblogic_j2eeserver |
Oracle Weblogic Server | WebLogic Métrica |
Oracle HTTP Server (OHS) | oracle_appmgmt |
oracle_http_server |
Oracle HTTP Server (OHS) | Métricas do Oracle HTTP Server (OHS) |
OIM (Oracle Identity Manager) | oracle_appmgmt |
oracle_oim / oracle_oim_cluster |
OIM (Oracle Identity Manager) | OIM (Oracle Identity Manager) |
OAM (Oracle Access Manager) | oracle_appmgmt |
oracle_oam / oracle_oam_cluster |
OAM (Oracle Access Manager) | OAM (Oracle Access Manager) |
Runtime do Oracle JVM | oracle_appmgmt |
oracle_jvm |
Oracle JVM | Métricas do Oracle JVM |
Oracle E-Business Suite | oracle_appmgmt |
ebs_instance |
Oracle E-Business Suite | Métricas do E-Business Suite |
Listener do Aplicativo EBS | oracle_appmgmt |
oracle_ebs_app_lsnr |
Oracle E-Business Suite | Métricas do E-Business Suite |
EBS Concurrent Processing | oracle_appmgmt |
oracle_ebs_conc_mgmt_service |
Processamento Simultâneo | Métricas do E-Business Suite |
EBS Concurrent Processing - Especializado | oracle_appmgmt |
oracle_ebs_conc_mgmt_service_specialized |
Processamento Simultâneo | Métricas do E-Business Suite |
Nó de Processamento Simultâneo EBS | oracle_appmgmt |
oracle_ebs_cp_node |
Oracle E-Business Suite | Métricas do E-Business Suite |
EBS Forms System | oracle_appmgmt |
oracle_ebs_forms_system |
Oracle E-Business Suite | Métricas do E-Business Suite |
EBS Workflow Agent Listener | oracle_appmgmt |
oracle_ebs_wf_agent_lsnr |
Oracle E-Business Suite | Métricas do E-Business Suite |
EBS Workflow Background Engine | oracle_appmgmt |
oracle_ebs_wf_bkgd_engine |
Oracle E-Business Suite | Métricas do E-Business Suite |
EBS Workflow Group | oracle_appmgmt |
oracle_ebs_wf_group |
Oracle E-Business Suite | Métricas do E-Business Suite |
EBS Workflow Notification Mailer | oracle_appmgmt |
oracle_ebs_wf_notification_mailer |
Workflow Notification Mailer | Métricas do E-Business Suite |
Apache Tomcat | oracle_appmgmt |
apache_tomcat |
Apache Tomcat | Métricas do Apache Tomcat |
Microsoft SQL Server | oracle_appmgmt |
sql_server |
Microsoft SQL Server | Métricas do Microsoft SQL Server |
PeopleSoft Domínio do Servidor de Aplicativos | oracle_appmgmt |
oracle_psft_appserv |
PeopleSoft | PeopleSoft Métricas |
Domínio do PeopleSoft Process Scheduler | oracle_appmgmt |
oracle_psft_prcs |
PeopleSoft | PeopleSoft Métricas |
PeopleSoft PIA | oracle_appmgmt |
oracle_psft_pia |
PeopleSoft | PeopleSoft Métricas |
PeopleSoft Mecanismo de Pesquisa
(OpenSearch / Elasticsearch) |
oracle_appmgmt |
elastic_search, open_search |
PeopleSoft | PeopleSoft Métricas |
PeopleSoft Monitor de Processos | oracle_appmgmt |
oracle_psft_prcm |
PeopleSoft | PeopleSoft Métricas |
Apache HTTP Server | oracle_appmgmt |
apache_http_server |
Apache HTTP Server | Métricas do Apache HTTP Server |
Servidor de Diretórios do OUD | oracle_appmgmt |
oud_directory |
Oracle Unified Directory | Métricas do Oracle Unified Directory |
Servidor Proxy do OUD | oracle_appmgmt |
oud_proxy |
Oracle Unified Directory | Métricas do Oracle Unified Directory |
Gateway de Replicação do OUD | oracle_appmgmt |
oud_gateway |
Oracle Unified Directory | Métricas do Oracle Unified Directory |
GoldenGate | oracle_appmgmt |
oracle_goldengate |
Oracle GoldenGate | Métricas do Oracle GoldenGate |
GoldenGate ServiceManager | oracle_appmgmt |
oracle_goldengate_service_manager |
Oracle GoldenGate | Métricas do Oracle GoldenGate |
GoldenGate AdminServer | oracle_appmgmt |
oracle_goldengate_admin_server |
Oracle GoldenGate | Métricas do Oracle GoldenGate |
Servidor de Métricas de Desempenho do GoldenGate | oracle_appmgmt |
oracle_goldengate_pm_server |
Oracle GoldenGate | Métricas do Oracle GoldenGate |
GoldenGate Extrair | oracle_appmgmt |
oracle_goldengate_extract |
Oracle GoldenGate | Métricas do Oracle GoldenGate |
GoldenGate Processo Replicat | oracle_appmgmt |
oracle_goldengate_replicat |
Oracle GoldenGate | Métricas do Oracle GoldenGate |
GoldenGate DistributionServer | oracle_appmgmt |
oracle_goldengate_distribution_server |
Oracle GoldenGate | Métricas do Oracle GoldenGate |
GoldenGate Caminho de Distribuição | oracle_appmgmt |
oracle_goldengate_distribution_path |
Oracle GoldenGate | Métricas do Oracle GoldenGate |
GoldenGate Servidor de Recebimento |
oracle_appmgmt |
oracle_goldengate_receiver_server |
Oracle GoldenGate | Métricas do Oracle GoldenGate |
GoldenGate Caminho do Destinatário | oracle_appmgmt |
oracle_goldengate_receiver_path |
Oracle GoldenGate | Métricas do Oracle GoldenGate |
Recurso Personalizado | oracle_appmgmt |
custom_resource |
Regras de Alarme de Amostra de Recurso Personalizado com Base em Processo | Métricas de Recursos Personalizados Baseadas em Processo |
do Oracle Service Bus | oracle_appmgmt |
oracle_servicebus |
OSS (Oracle Service Bus) | OSS (Oracle Service Bus) |
IIS da Microsoft | oracle_appmgmt |
microsoft_iis |
IIS da Microsoft | Métricas do Microsoft IIS |
Site do Microsoft IIS | oracle_appmgmt |
microsoft_iis_website |
IIS da Microsoft | Métricas do Microsoft IIS |
O nas | oracle_appmgmt |
nginx |
O nas | Métricas NGINX |
Melhores práticas para cenários de alarme comuns
- Crie suas regras de alarme no mesmo compartimento no qual você descobriu seus recursos.
- Para configurar uma regra de alarme para gerar um alarme quando um recurso estiver inativo, especifique o namespace de métricas e o grupo de recursos apropriados e use a seguinte regra de métrica e acionamento:
Nome da Métrica:
MonitoringStatus
Regra do acionador:
-
Operador:
equal to
-
Valor:
0
-
Minutos de atraso do trigger:
1
-
- Para configurar uma regra de alarme a ser acionada para instâncias de recursos individuais, além de escolher a métrica, você também precisará adicionar dimensões de métrica para identificar exclusivamente o recurso.
Para identificar exclusivamente uma instância de recurso:
- Você pode usar
resourceName
eresourceType
OU - Você pode usar
resourceId
A maioria das métricas define dimensões adicionais que podem ser usadas para definir alarmes avançados.
- Você pode usar
- Sempre consulte a descrição da métrica encontrada na Referência da Métrica e verifique o período de avaliação (com que frequência cada métrica é coletada). Ao configurar alarmes, certifique-se de fornecer o mesmo valor do Intervalo do alarme. Isso pode ser feito por meio de Alternar para o Modo Avançado no canto superior direito da página de criação de alarme. Você pode fornecer MQL avançado na seção Query code editor da página de modo avançado.
Hosts
Regra de Alarme de Amostra: Monitoramento do Host
- Tipo de Recurso: Host
- Namespace da Métrica:
oracle_appmgmt
- Grupo de Recursos:
host
Período de Avaliação (minutos) | Regra de Alarme | Aviso | Crítico | Descrição |
---|---|---|---|---|
4 |
Host Desativado Nome da métrica: MQL Crítico: MonitoringStatus[4m].mean() != 1 || MonitoringStatus[4m].absent() |
não aplicável | não aplicável | Alarme crítico para qualquer host em um determinado compartimento relatando estar inativo ou não relatando status por mais de 1 minuto. |
4 |
Alta Utilização da CPU Nome da métrica: MQL de Advertência: CpuUtilization[4m]{type="Total"}.mean() > 80 MQL Crítico: CpuUtilization[4m]{type="Total"}.mean() > 90 |
> 80 | > 90 | Alarme de advertência para qualquer host em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 3 minutos.
Alarme crítico para qualquer host em um determinado compartimento que reporta mais de 90% de utilização de CPU nos últimos 3 minutos. |
4 |
Alta Utilização da Memória Nome da métrica: MQL de Advertência: MemoryUtilization[4m]{type="Logical"}.mean() > 80 MQL Crítico: MemoryUtilization[4m]{type="Logical"}.mean() > 90 |
> 80 | > 90 | Alarme de advertência para qualquer host em um determinado compartimento que reporte mais de 80% de utilização de memória nos últimos 3 minutos.
Alarme de advertência para qualquer host em um determinado compartimento que reporte mais de 90% de utilização de memória nos últimos 3 minutos. |
4 |
Utilização do Sistema de Arquivos Nome da métrica: MQL de Advertência: FilesystemUtilization[4m].mean() > 80 MQL Crítico: FilesystemUtilization[4m].mean() > 90 |
> 80 | > 90 | Alarme de advertência para qualquer sistema de arquivos em qualquer host de um determinado compartimento que reporte mais de 80% de utilização de memória.
Alarme crítico para qualquer sistema de arquivos em qualquer host em um determinado compartimento que reporte mais de 90% de utilização de memória. Observação
Para monitorar sistemas de arquivos selecionados, você pode especificar ainda mais a dimensão fileSystemName e personalizar seus alarmes de acordo com suas necessidades específicas. Por exemplo, o MQL FilesystemUtilization[1m]{fileSystemName = "/", osType = "Linux"}.mean() > 80 a seguir só se aplicará a qualquer sistema de arquivos raiz em qualquer host Linux em determinado compartimento.
|
GPU
Regra de Alarme de Amostra: GPU
1 |
Temperatura da GPU Nome da métrica: MQL de Advertência: GPUTemperature[4m]{Type="GPU"}.mean() > 98 MQL Crítico: GPUTemperature[4m]{Type="GPU"}.mean() > 101 |
> 98 | > 101 |
Alarme de aviso quando qualquer GPU excede a temperatura de desaceleração. Alarme crítico quando qualquer GPU excede a temperatura de desligamento. As temperaturas de desaceleração e desligamento podem variar de acordo com o modelo de GPU; os valores corretos para uma GPU descoberta podem ser revisados na home page da GPU do Stack Monitoring.
|
Oracle Database
Opcionalmente, para minimizar o risco de alarmes falsos, inclua collectionName="sensor"
.
Exemplo :
MonitoringStatus[4m]{collectionName="sensor"}.groupBy(resourceName).last() < 1 || MonitoringStatus[4m] collectionName="sensor"}.groupBy(resourceName).absent()
Regra de Alarme de Amostra: Banco de Dados Não Contêiner
-
Tipo de Recurso: Banco de Dados Não Contêiner
-
Namespace da Métrica:
oracle_oci_database
-
Grupo de Recursos: n/d
Período de avaliação (minutos) | Regra de Alarme | Advertência | Crítico | Valor Recomendado Usado do DBM? | Descrição |
---|---|---|---|---|---|
30 |
Utilização de Armazenamento Nome da métrica: Dimensão: ou MQL de Advertência: StorageUtilizationByTablespace[30m]{tablespaceContents ="PERMANENT"}.mean()> 75 MQL Crítico: StorageUtilizationByTablespace[30m]{tablespaceContents ="PERMANENT"}.mean() > 85 |
>75 | >85 | Y | Condições de regra de alarme de Advertência e Crítico para tablespaces permanentes cuja utilização é maior que 75% ou 85% nos últimos 30 minutos. |
24 horas | InvalidObjects |
>150 | >200 | não aplicável | |
15 | BlockingSessions |
>1 | >10 | Y | Condições de regra de alarme de Advertência e Crítico para acionar um alarme quando o número de sessões de bloqueio for maior que 1 ou 10 nos últimos 15 minutos. |
15 | UsableFRA |
<20 | <10 | não aplicável | Aviso e condições de regra de alarme Crítico para acionar um alarme quando a porcentagem da área de recuperação rápida utilizável for inferior a 20% ou 10% nos últimos 15 minutos. |
5 | ProcessLimitUtilization |
>70 | >80 | Y | Condições de regra de alarme Advertência e Crítico para acionar um alarme quando a utilização do processo (%) for maior que 70% ou 80% nos últimos 5 minutos. |
5 | SessionLimitUtilization |
>90 | >97 | não aplicável | |
5 | CPUUtilization |
>80 | >85 | Y | |
5 | FRAUtilization |
>70 | >75 | Y | |
5 | StorageUtilization |
>75 | >85 | Y | |
5 |
Status de Monitoramento Nome da métrica: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
não aplicável | n/d | Alarme crítico para qualquer relatório do Oracle Database não contêiner que esteja inativo ou não reporte o status por mais de 1 minuto. |
Regra de Alarme de Amostra: Banco de Dados Contêiner
-
Tipo de Recurso: BD do Contêiner
-
Namespace da Métrica:
oracle_oci_database
-
Grupo de Recursos: n/d
Período de avaliação (minutos) | Regra de Alarme | Advertência | Crítico | Valor Recomendado Usado do DBM? | Descrição |
---|---|---|---|---|---|
1 |
Status de Monitoramento Nome da métrica: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
n/d | n/d | n/d | Alarme crítico para qualquer relatório do Oracle Database não contêiner que esteja inativo ou não reporte o status por mais de 1 minuto. |
30 |
Métrica: Dimensão: ou MQL de Advertência: StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 75 MQL Crítico: StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 85 |
>75 | >85 | Y | Condições de regra de alarme Advertência e Crítico para tablespaces permanentes cuja utilização é maior que 85% ou 90% nos últimos 30 minutos. |
5 | ProcessLimitUtilization |
>70 | >80 | Y | Condições de regra de alarme Advertência e Crítico para acionar um alarme quando a utilização do processo (%) for maior que 90% ou 95% nos últimos 5 minutos. |
5 | SessionLimitUtilization |
>90 | >97 | n/d | |
15 | UsableFRA |
<20 | <10 | n/d | Aviso e condições de regra de alarme Crítico para acionar um alarme quando a porcentagem da área de recuperação rápida utilizável for inferior a 20% ou 10% nos últimos 15 minutos. |
5 | CPUUtilization |
>80 | >85 | Y | |
5 | FRAUtilization |
>70 | >75 | Y | |
5 | StorageUtilization |
>75 | >85 | Y |
Regra de Alarme de Amostra: Banco de Dados Plugável
-
Tipo de Recurso: Banco de Dados Plugável
-
Namespace da Métrica:
oracle_oci_database
-
Grupo de Recursos: n/d
Período de avaliação (minutos) | Regra de alarme | Advertência | Crítico | Valor Recomendado Usado do DBM? | Descrição |
---|---|---|---|---|---|
1 |
Status de Monitoramento Nome da métrica: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
n/d | n/d | n/d | Alarme crítico para qualquer relatório do Oracle Database Não Contêiner que esteja inativo ou que não esteja informando o status por mais de 1 minuto. |
5 | CPUUtilization |
>80 | >85 | Y | |
5 | StorageUtilization |
>75 | >85 | Y | |
15 | BlockingSessions |
>1 | >10 | Y | Condições de regra de alarme de Advertência e Crítico para acionar um alarme quando o número de sessões de bloqueio for maior que 1 ou 5 nos últimos 15 minutos. |
24 horas | InvalidObjects |
>150 | >200 | n/d | |
30 |
Métrica: StorageUtilizationByTablespace Dimensão: ou MQL de Advertência: StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 75 MQL Crítico: StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 85 |
>75 | >85 | Y | Condições de regra de alarme Advertência e Crítico para tablespaces permanentes cuja utilização é maior que 85% ou 90% nos últimos 30 minutos. |
Regra de Alarme de Amostra: Instância ASM/ASM
-
Tipo de Recurso: ASM
-
Namespace da Métrica:
oracle_oci_database_cluster
-
Grupo de Recursos:
oracle_asm
Período de avaliação (minutos) | Regra de Alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Status de Monitoramento Nome da métrica: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer relatório do Oracle Database Não Contêiner que esteja inativo ou que não esteja informando o status por mais de 1 minuto. |
30 | DiskGroupUtilization |
>85 | >95 | |
30 | DiskUtilization |
>85 | >95 |
-
Tipo de Recurso: Cluster
-
Namespace da Métrica:
oracle_oci_database_cluster
-
Grupo de Recursos:
oracle_cluster
Período de avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Status de Monitoramento Nome da métrica: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer relatório do Oracle Database Não Contêiner que esteja inativo ou que não esteja informando o status por mais de 1 minuto. |
Regra de Alarme de Amostra: Listener
-
Tipo de Recurso: Listener
-
Namespace da Métrica:
oracle_oci_database_cluster
-
Grupo de Recursos:
oracle_lsnr
Período de avaliação (minutos) | Regra de Alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Status de Monitoramento Nome da métrica: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer relatório do Oracle Database Não Contêiner que esteja inativo ou que não esteja informando o status por mais de 1 minuto. |
5 | RefusedConnections |
>1 | >5 |
E-Business Suite
Regra de Alarme de Amostra: EBS
- Tipo de Recurso: Oracle E-Business Suite
- Namespace da Métrica:
oracle_appmgmt
- Grupo de Recursos:
ebs_instance
Período de Avaliação (minutos) | Regra de Alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
15 |
Programas Executados por Tempo de Execução (ms) Nome da métrica: MQL: ExecutedProgramsByRunningTime[15m].mean() > 4000
Tip1: Você pode filtrar o alarme para um aplicativo específico adicionando o filtro de dimensão |
> 4,000 | > 40,000 | O tempo de execução das solicitações |
15 |
Solicitações Concluídas por Aplicativo (proporção) Nome da métrica: Nome da dimensão: Valor da dimensão: MQL: CompletedRequestsByApplication[15m]{Category = "Error"}.mean() > 0.001 Tip1: Você pode filtrar o alarme para um aplicativo específico adicionando MQL: CompletedRequestsByApplication[15m]{Category = "Error", ApplicationName = "<YOUR APP NAME>"}.mean() > 0.001 |
> 0.001 | > 0.003 |
A proporção de solicitações concluídas com erro em comparação com todas as solicitações em determinado intervalo de coleta. Isso significa que, se mais de 0,1% solicitado falhar, você receberá um aviso, pois mais de 0,25% você recebe críticas |
15 |
Sessões Ativos do Usuário Nome da métrica: MQL: ActiveUserSessions[15m].mean() > 200 |
> 200 | > 250 | O número de sessões do usuário ativas |
Exemplo de Regra de Alarme: Listener do Aplicativo EBS
Tipo de Recurso: Listener do Aplicativo EBS
Namespace da Métrica: oracle_appmgmt
Grupo de Recursos: oracle_ebs_app_lsnr
Período de Avaliação (minutos) | Regra de Alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Status de Monitoramento Nome da métrica: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
n/d | 0 | Alarme crítico para o Listener do Aplicativo EBS em um determinado compartimento reportando estar inativo ou não relatando status por mais de 1 minuto. |
Regra de Alarme de Amostra: Processamento Concorrente EBS
Tipo de Recurso: Processamento Concorrente EBS
Namespace da Métrica: oracle_appmgmt
Grupo de Recursos: oracle_ebs_conc_mgmt_service
Período de Avaliação (minutos) | Regra de Alarme | Aviso | Crítico | Descrição |
---|---|---|---|---|
1 |
Status de Monitoramento Nome da métrica: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
n/d | 0 | O status de disponibilidade. |
15 |
Taxa de Erros de Solicitações Simultâneas Nome da métrica: Nome da dimensão: Valor da dimensão: MQL: CompletedConcurrentRequests[15m]{State = "Errored"}.mean() > 0.001 |
> 0.001 | > 0.003 | A taxa de solicitações que foram concluídas com erros por hora. Se multiplicado por 100, torna-se um percentual. |
15 |
Taxa de Advertência de Solicitações Concorrentes Nome da métrica: Nome da dimensão: Valor da dimensão: MQL: CompletedConcurrentRequests[15m]{State = "WithWarning"}.mean() > 0.15 |
> 0.002 | > 0.003 | A taxa de solicitações que foram concluídas com aviso por hora. Se multiplicado por 100, torna-se um percentual. |
15 |
Solicitações Concorrentes Concluídas com Êxito (período de avaliação/operações) Nome da métrica: Nome da dimensão: Valor da dimensão: Succ essencial MQL: CompletedConcurrentRequests[15m]{State = "Successful"}.sum() > 2500 |
> 625 | > 2,500 | A taxa de solicitações que foram concluídas com êxito em um período de avaliação (15 minutos por padrão). |
15 |
Solicitações Concorrentes em Execução Nome da métrica: Nome da dimensão: Valor da dimensão: Executado ingestão MQL: ConcurrentRequestsByStatus[15m]{State = "Running"}.mean() > 100 |
> 2,500 | > 10,000 | O número de solicitações em execução por usuário. |
15 |
Solicitações Concorrentes Pendentes - Normal Nome da métrica: Nome da dimensão: Valor da dimensão: MQL: ConcurrentRequestsByStatus[15m]{State = "PendingNormal"}.mean() > 100 |
> 2,500 | > 10,000 | O número de solicitações pendentes por usuário. |
15 |
Solicitações Concorrentes Pendentes - Standby Nome da métrica: Nome da dimensão: Valor da dimensão: MQL: ConcurrentRequestsByStatus[15m]{State = "PendingStandBy"}.mean() > 100 |
> 100 | > 500 | O número de solicitações com status stand-by pendente. |
15 |
Solicitações Concorrentes Inativas - Sem Gerenciador Nome da métrica: Nome da dimensão: Valor da dimensão: MQL: ConcurrentRequestsByStatus[15m]{State = "InactiveNoManager"}.mean() > 100 |
> 100 | > 500 | O número de solicitações com status de não gerente inativo. |
15 |
Solicitações Concorrentes Inativas - Em Retenção Nome da métrica: Nome da dimensão: Valor da dimensão: MQL: ConcurrentRequestsByStatus[15m]{State = "InactiveOnHold"}.mean() > 100 |
> 100 | > 500 | O número de solicitações com status inativo em retenção. |
5 |
Solicitações Concorrentes de Longa Execução Nome da métrica: MQL: LongActiveConcurrentRequests[5m].mean() > 43200000 Tip1: Você pode filtrar o alarme para uma solicitação MQL: LongActiveConcurrentRequests[5m]{Phase = "Running"}.mean() > 43200000 Tip2: Você pode filtrar ainda mais por programa específico adicionando o filtro de dimensão MQL: LongActiveConcurrentRequests[1m]{Phase = "Running", ProgramShortName = "<PROGRAM SHORT NAME>"}.mean() > 43200000 |
> 43,200,000 | > 86,400,000 | O tempo decorrido em ms para uma solicitação pendente ou em execução. Somente as 10 principais solicitações são rastreadas. Neste caso, estamos sugerindo obter Aviso após 12 horas e Crítico após 24 horas. |
EBS Concurrent Processing - Especializado
Tipo de Recurso: Processamento Concorrente EBS - Especializado
Namespace da Métrica: oracle_appmgmt
Grupo de Recursos: oracle_ebs_conc_mgmt_service_specialized
Métrica | Nome para Exibição da Métrica | Unidade | Descrição | Frequência de Coleta | Dimensão | Nome do Recurso |
---|---|---|---|---|---|---|
MonitoringStatus |
Disponibilidade | status |
Status do recurso. Os valores são os seguintes: 1 = Para cima 0 = Para baixo Somente se TODOS os outros gerentes estiverem ativos, o status estará ativo. Se apenas um gerente estiver inativo, o status geral será desativado. |
1 mínimo | n/d | oracle_ebs_conc_mgmt_service_specialized |
ConcurrentProcesingComponentStatus |
Status do Concurrent Manager | status | Disponibilidade do gerenciador concorrente | 1 mínimo | Nome da Fila Simultânea, Descrição, Nome do Host | oracle_ebs_conc_mgmt_service_specialized |
CapacityUtilizationOfConcurrentManagers |
Utilização da Capacidade do Concurrent Manager | percentual | Porcentagem de processos máximos em execução. Se o máximo de processos do gerente for 10 e 5 estiverem em execução, a utilização da capacidade será de 50% | 1 mínimo | Nome do Gerenciador | oracle_ebs_conc_mgmt_service_specialized |
ManagerMaxProcesses |
Máx. de Processos do Concurrent Manager | contagem | Número máximo de processos na fila do gerente. | 1 mínimo | Nome do Gerenciador | oracle_ebs_conc_mgmt_service_specialized |
ManagerRunningProcesses |
Processos em Execução no Concurrent Manager | contagem | Número de processos em execução na fila do gerente | 1 mínimo | Nome do Gerenciador | oracle_ebs_conc_mgmt_service_specialized |
Regra de Alerta de Amostra: Mailer de Notificação do Workflow do EBS
Tipo de Recurso: EBS Mailer de Notificação do Workflow
Namespace da Métrica: oracle_appmgmt
Grupo de Recursos: oracle_ebs_wf_notification_mailer
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Status de Monitoramento Nome da métrica: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
n/d | 0 | Alarme crítico para EBS Concurrent Processing Specialized em um determinado compartimento reportando estar inativo ou não relatando status para mais de 1min. |
1 |
Utilização da Capacidade do Concurrent Manager Nome da métrica: MQL: CapacityUtilizationOfConcurrentManagers[1m].mean() < 100 |
< 50 | < 100 | Porcentagem de utilização da capacidade de todos os gerentes ativados. |
Apache Tomcat
Regra de Alarme de Amostra: Apache Tomcat
Tipo de recurso: Apache Tomcat
Namespace da Métrica: oracle_appmgmt
Grupo de Recursos: apache_tomcat
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
3 |
Apache Tomcat Inativo Nome da métrica: MQL Crítico: MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent() |
n/d | n/d | Alarme crítico para qualquer Apache Tomcat em um determinado compartimento reportando estar inativo ou não relatando status por mais de 3 minutos. |
5 |
Alta Utilização da CPU Nome da métrica: MQL de Advertência: CPUUtilization[5m].mean() > 80 MQL Crítico: CPUUtilization[5m].mean() > 90 |
>80 | >90 |
Alarme de advertência para qualquer Apache Tomcat em um determinado compartimento que reporte mais de 80% de utilização da CPU nos últimos 5 minutos. Alarme crítico para qualquer Apache Tomcat em um determinado compartimento que reporte mais de 90% de utilização da CPU nos últimos 5 minutos. |
5 |
Alta Utilização da Memória Heap da JVM Nome da métrica: MQL de Advertência: JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 80 MQL Crítico: JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 90 |
>80 | >90 |
Alarme de advertência para qualquer Apache Tomcat em um determinado compartimento que reporte mais de 80% de utilização de memória heap JVM nos últimos 5 minutos. Alarme de advertência para qualquer Apache Tomcat em um determinado compartimento que reporte mais de 90% de utilização de memória heap JVM nos últimos 5 minutos. |
5 |
Tempo de Processamento de Solicitação Web Alto Nome da métrica: MQL de Advertência: WebRequestProcessingTime[5m].mean() > 1000 MQL Crítico: WebRequestProcessingTime[5m].mean() > 1500 |
>1,500 | >3,000 |
Alarme de advertência para qualquer Apache Tomcat em um determinado compartimento que reporta mais de 1500 ms significa tempo de processamento de solicitação da Web nos últimos 5 minutos. Alarme de advertência para qualquer Apache Tomcat em um determinado compartimento que reporta mais de 3000 ms significa tempo de processamento de solicitação da Web nos últimos 5 minutos. |
Microsoft SQL Server
Regras de Alarme de Amostra: Microsoft SQL Server
Tipo de Recurso: Microsoft SQL Server
Namespace da Métrica: oracle_appmgmt
Grupo de Recursos: sql_server
Período de Avaliação (minutos) | Regra de Alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
3 |
Status de Disponibilidade do SQL Server Nome da métrica: MQL Crítico: MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent() |
n/d | n/d | Alarme crítico para qualquer SQL Server em um determinado compartimento relatando estar inativo ou não relatando status por mais de 3 minutos. |
10 |
Utilização de CPU do SQL Server (%) Nome da métrica: MQL de Advertência: CpuUtilization[10m].mean() > 80 MQL Crítico: CpuUtilization[10m].mean() > 95 |
>80 | >95 | Alarme de advertência para qualquer SQL Server em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 10 minutos.
Alarme crítico para qualquer SQL Server em um determinado compartimento que reporta mais de 90% de utilização de CPU nos últimos 10 minutos. |
15 |
Utilização do Banco de Dados SQL Server Nome da métrica: MQL de Advertência: StorageDatabaseUtilization[15m].mean() > 80 MQL Crítico: StorageDatabaseUtilization[15m].mean() > 95 |
>80 | >95 | Alarme de advertência para qualquer SQL Server em um determinado compartimento que reporte mais de 80% de utilização do banco de dados nos últimos 15 minutos.
Alarme crítico para qualquer SQL Server em um determinado compartimento que reporta mais de 90% de utilização do banco de dados nos últimos 15 minutos. |
PeopleSoft
PeopleSoft Servidor de Aplicativos
- Tipo de Recurso: PeopleSoft Domínio do Servidor de Aplicativos
- Namespace da Métrica:
oracle_appmgmt
- Grupo de Recursos:
oracle_psft_appserv
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
5 |
Integralidade Nome da métrica: MQL de Advertência: Health[1m]{HealthState = "Warning"}.mean() = 1 MQL Crítico: Health[1m]{HealthState = "Critical"}.mean() = 1 |
1 | 1 |
Integridade geral do domínio do servidor de aplicativos. Um alarme de advertência será acionado se o "aviso" do estado for igual a 1. Um alarme crítico será acionado se o estado "crítico" for igual a 1. |
5 |
Carga Nome da métrica: MQL de Advertência: Load[1m]{LoadState = "Medium"}.mean() = 1 MQL Crítico Load[1m]{LoadState = "Heavy"}.mean() = 1 |
1 | 1 |
Carga geral do domínio do servidor de aplicativos. Um alarme de aviso será acionado se o estado "médio" for igual a 1. Um alarme crítico será disparado se o estado "pesado" for igual a 1. |
5 |
Tempo Médio de Execução da Solicitação de Serviço Nome da métrica: MQL de Advertência: AverageServiceRequestExecutionTime[5m].mean()> 1000 |
> 1,000 | n/d |
Tempo médio, em milissegundos, necessário para executar uma solicitação de serviço. O alarme de aviso é acionado quando, em média, uma solicitação leva mais de um segundo (1000 ms) para ser executada. |
5 |
Processos em Fila do Servidor de Aplicativos Nome da métrica: Nome da dimensão: Valor da dimensão: MQL Crítico: QueuedTuxedoProcesses[5m]{Category = "ApplicationServer"}.mean() > 1 |
n/d | > 1 | Número de processos que estão atualmente na fila para o Servidor de Aplicativos. Mais de 1 processo na fila disparará um alarme crítico. |
5 |
Processos Enfileirados para Handler BRK Nome da métrica: Nome da dimensão: Valor da dimensão: MQL Crítico: QueuedTuxedoProcesses[5m]{Category = "BRKHandler"}.mean() > 1 |
n/d | > 1 | Número de processos que estão atualmente na fila para o Manipulador BRK. Mais de 1 processo na fila disparará um alarme crítico. |
5 |
Processos Enfileirados para o Dispatcher BRK Nome da métrica: Nome da dimensão: Valor da dimensão: MQL Crítico: QueuedTuxedoProcesses[5m]{Category = "BRKDispatcher"}.mean() > 1 |
n/d | > 1 | Número de processos que estão atualmente na fila para o Expedidor BRK. Mais de 1 processo na fila disparará um alarme crítico. |
5 |
Processos Enfileirados para o Dispatcher PUB Nome da métrica: Nome da dimensão: Valor da dimensão: MQL: QueuedTuxedoProcesses[5m]{Category = "PUBDispatcher"}.mean() > 1 |
n/d | > 1 | Número de processos que estão atualmente na fila para o Despachador PUB. Mais de 1 processo na fila disparará um alarme crítico. |
5 |
Processos enfileirados para manipulador PUB Nome da métrica: Nome da dimensão: Valor da dimensão: MQL Crítico: QueuedTuxedoProcesses[5m]{Category = "PUBHandler"}.mean() > 1 |
n/d | > 1 | Número de processos que estão atualmente na fila para o manipulador PUB. Mais de 1 processo na fila disparará um alarme crítico. |
5 |
Processos Enfileirados para Despachador SUB Nome da métrica: Nome da dimensão: Valor da dimensão: MQL Crítico: QueuedTuxedoProcesses[5m]{Category = "SUBDispatcher"}.mean() > 1 |
n/d | > 1 | Número de processos que estão atualmente na fila para o Expedidor SUB. Mais de 1 processo na fila disparará um alarme crítico. |
5 |
Processos Enfileirados para Handler SUB Nome da métrica: Nome da dimensão: Valor da dimensão: MQL Crítico: QueuedTuxedoProcesses[5m]{Category = "SUBHandler"}.mean() > 1 |
n/d | > 1 | Número de processos que estão atualmente na fila para o manipulador SUB. Mais de 1 processo na fila disparará um alarme crítico. |
5 |
Falha nos Processos do Servidor Nome da métrica: MQL Crítico: FailedServerProcesses[5m].mean() > 0 |
n/d | > 0 | Número de processos do servidor que falharam ou estão inativos no domínio. Se qualquer processo do servidor falhar, um alarme crítico será acionado. |
15 |
Arquivos State Nome da métrica: MQL de Advertência: PeopleToolsStateFiles[15m].mean() > 0 |
> 0 | n/d | Número de arquivos de estado PeopleTools gerados no diretório de logs do domínio. Se qualquer arquivo de estado for gerado, um alarme de aviso será acionado. |
PeopleSoft Process Scheduler
- Tipo de Recurso: Domínio do PeopleSoft Process Scheduler
- Namespace da Métrica:
oracle_appmgmt
- Grupo de Recursos:
oracle_psft_prcs
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
5 |
Integralidade Nome da métrica: MQL de Advertência: Health[1m]{HealthState = "Warning"}.mean() = 1 MQL Crítico: Health[1m]{HealthState = "Critical"}.mean() = 1 |
1 | 1 |
Integridade geral do domínio do Process Scheduler. Um alarme de advertência será acionado se o "aviso" do estado for igual a 1. Um alarme crítico será acionado se o estado "crítico" for igual a 1. |
5 |
Carregar Nome da métrica: MQL de Advertência: Load[1m]{LoadState = "Medium"}.mean() = 1 MQL Crítico: Load[1m]{LoadState = "Heavy"}.mean() = 1 |
1 | 1 |
Carga geral do domínio do Process Scheduler. Um alarme de aviso será acionado se o estado "médio" for igual a 1. Um alarme crítico será disparado se o estado "pesado" for igual a 1. |
5 |
Processos Enfileirados para PSPRCSRV Nome da métrica: Nome da dimensão: Valor da dimensão: MQL Crítico: QueuedTuxedoProcesses[5m]{ProcessType = "PSPRCSRV"}.mean() > 1 |
n/d | > 1 | Número de processos que estão atualmente na fila para o Process Scheduler (PSPRCSRV). Mais de 1 processo na fila disparará um alarme crítico. |
5 |
Processos em Fila para PSDSTSRV Nome da métrica: Nome da dimensão: Valor da dimensão: MQL Crítico: QueuedTuxedoProcesses[5m]{ProcessType = "PSDSTSRV"}.mean() > 1 |
n/d | > 1 | Número de processos que estão atualmente em fila para o servidor de distribuição (PSDSTSRV). Mais de 1 processo na fila disparará um alarme crítico. |
5 |
Processos com Falha Nome da métrica: MQL Crítico: FailedProcesses[5m].mean() > 1 |
n/d | > 0 | Número de processos do servidor que falharam ou estão inativos no domínio. Se qualquer processo do servidor falhar, um alarme crítico será acionado. |
PeopleSoft PIA
- Tipo de Recurso: PeopleSoft PIA
- Namespace da Métrica:
oracle_appmgmt
- Grupo de Recursos:
oracle_psft_pia
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
5 |
Saúde Nome da métrica: MQL de Advertência: Health[1m]{HealthState = "Warning"}.mean() = 1 MQL Crítico: Health[1m]{HealthState = "Critical"}.mean() = 1 |
1 | 1 |
A saúde geral da PIA. Um alarme de advertência será acionado se o "aviso" do estado for igual a 1. Um alarme crítico será acionado se o estado "crítico" for igual a 1. |
5 |
Carga Nome da métrica: MQL de Advertência: Load[1m]{LoadState = "Medium"}.mean() = 1 MQL Crítico: Load[1m]{LoadState = "Heavy"}.mean() = 1 |
1 | 1 |
Carga total do PIA. Um alarme de aviso será acionado se o estado "médio" for igual a 1. Um alarme crítico será disparado se o estado "pesado" for igual a 1. |
5 |
Soquetes do Estado de Espera Nome da métrica: MQL de Advertência: WaitStateSockets[5m].mean() > 100 |
> 100 | n/d | Número de soquetes do servidor Web que estão no estado WAIT. Se mais de 100 soquetes de servidor Web estiverem no estado WAIT, um alarme de aviso será acionado. |
5 |
Erros Fatais Nome da métrica: MQL de Advertência: FatalErrors[5m].mean() > 0 |
> 0 | n/d | Número de erros fatais nos logs do servlet JOLTService. Se ocorrer algum erro no servlet JOLTService, um alarme de advertência será acionado. |
PeopleSoft Mecanismo de Pesquisa
- Tipo de Recurso: PeopleSoft Elasticsearch, PeopleSoft OpenSearch
- Namespace da Métrica:
oracle_appmgmt
- Grupo de Recursos:
elastic_search, open_search
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Cluster Integridade Nome da métrica: ClusterHealth MQL: ClusterHealth[1m]{Status = "Red"}.mean() = 1 ClusterHealth[1m]{Status = "Yellow"}.mean() = 1 |
1 | 1 |
Integridade geral do cluster do mecanismo de pesquisa. Um alerta de aviso será acionado se o status 'amarelo' for igual a 1. Um alerta crítico será acionado se o status 'vermelho' for igual a 1. |
10 |
Utilização da Memória Nome da métrica: MQL: MemoryUsage[10m].mean() |
> 80 | > 90 |
Heap máximo configurado do nó do mecanismo de pesquisa. Um alerta de advertência será acionado se a utilização da memória for superior a 80%. Um alerta crítico será acionado se a utilização da memória for superior a 90%. |
PeopleSoft Monitor de Processos
- Tipo de Recurso: PeopleSoft Process Monitor
- Namespace da Métrica:
oracle_appmgmt
- Grupo de Recursos:
oracle_psft_prcm
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
5 |
Estado de Distribuição Ativo Nome da Métrica: ActiveDistributionState MQL: ActiveDistributionState[5m]{State = "NotPosted"}.mean() > 1 |
n/d | > 1 |
Um alerta crítico será acionado se muitos processos no estado de distribuição não forem lançados. |
5 |
Status da Execução Nome da Métrica: MQL: ActiveRunState[5m]{State = "NoSuccess"}.mean() > 1 |
n/d | > 1 |
Um alerta crítico será acionado se muitos processos em execução não tiverem sucesso. |
5 |
Status da Execução Nome da Métrica: MQL: RunStatus[5m]{Status = "Error"}.mean() > 0 |
n/d | > 0 |
Um alerta crítico será acionado se muitos processos estiverem no estado de erro de execução. |
Oracle Weblogic Server
Regra de Alarme de Amostra: Oracle Weblogic Server
- Tipo de recurso: Servidor OracleWeblogic
- Namespace da Métrica:
oracle_appmgmt
- Grupo de Recursos:
weblogic_j2eeserver
Período de Avaliação (minutos) | Regra de Alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
3 |
WebLogic Servidor Inativo Nome da métrica: MQL Crítico:
|
n/d | n/d | Alarme crítico para qualquer Servidor WebLogic em um determinado compartimento reportando estar inativo ou não relatando status por mais de 3 minutos. |
5 |
Alta Utilização da CPU Nome da métrica: MQL de Advertência:
MQL Crítico:
|
> 80 | > 90 |
Alarme de advertência para qualquer Servidor WebLogic em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos. Alarme crítico para qualquer Servidor WebLogic em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos. |
5 |
Alta Utilização de Heap Nome da métrica: MQL de Advertência: JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 80 MQL Crítico: JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 90 |
> 80 | > 90 |
Alarme de advertência para qualquer Servidor WebLogic em um determinado compartimento que reporte mais de 80% de utilização de Heap nos últimos 5 minutos. Alarme crítico para qualquer Servidor WebLogic em um determinado compartimento que reporte mais de 90% de utilização de Heap nos últimos 5 minutos. |
5 |
Threads Mantidos do Gerenciador de Trabalho Nome da métrica: Advertência: WorkManagerStuckThreads[5m].mean() > 10 Crítico: WorkManagerStuckThreads[5m].mean() > 15 |
> 10 | > 15 |
Alarme de advertência para qualquer Servidor WebLogic em um determinado compartimento que reporte mais de 10 threads paralisados do gerenciador de trabalho nos últimos 5 minutos. Alarme crítico para qualquer Servidor WebLogic em um determinado compartimento que reporte mais de 15 threads paralisados do gerenciador de trabalho nos últimos 5 minutos. |
5 |
Solicitações de Conexão em Espera Nome da métrica:
MQL de Advertência: ServerConnectionPoolConnections[5m].mean() > 1 MQL Crítico:
|
>1 | >2 | |
5 |
Tempo de Processamento de Solicitação Web Nome da métrica: Advertência: WebRequestProcessingTime[5m].mean() > 10000 Crítico: WebRequestProcessingTime[5m].mean() > 15000 |
>10,000 | >15,000 | |
5 |
Threads do Pool de Threads Ativos Nome da métrica: Advertência: ThreadPoolThreads[5m]{Status = "Active"}.mean() > 1000 Crítico: ThreadPoolThreads[5m]{Status = "Active"}.mean() > 1250 |
>1,000 | >1,250 |
Regra de Alarme de Amostra: Cluster do Oracle Weblogic Server
-
Tipo de Recurso: Cluster do Oracle Weblogic Server
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
weblogic_cluster
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
WebLogic Cluster Desativado Nome da métrica: MQL Crítico: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer Cluster WebLogic em um determinado compartimento relatando estar inativo ou não relatando status por mais de 1 minuto. |
Regras de Alarme de Amostra: Oracle HTTP Server (OHS)
-
Tipo de Recurso: Oracle HTTP Server
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
oracle_http_server
Período de Avaliação (minutos) | Regra de Alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
3 |
Oracle HTTP Server Inativo Nome da métrica: MQL Crítico:
|
n/d | n/d | Alarme crítico para qualquer Oracle HTTP Server em um determinado compartimento reportando estar inativo ou não relatando status por mais de 3 minutos. |
5 |
Alta Utilização da CPU Nome da métrica: MQL de Advertência:
MQL Crítico: CPUUtilization[5m].mean() > 90 |
>80 | >90 |
Alarme de advertência para qualquer Oracle HTTP Server em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos. Alarme crítico para qualquer Oracle HTTP Server em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos. |
5 |
Alta Utilização da Memória Nome da métrica: MQL de Advertência:
MQL Crítico:
|
>80 | >90 |
Alarme de advertência para qualquer Oracle HTTP Server em um determinado compartimento que reporte mais de 80% de utilização de memória nos últimos 5 minutos. Alarme crítico para qualquer Oracle HTTP Server em um determinado compartimento que reporte mais de 90% de utilização de memória nos últimos 5 minutos. |
5 |
Tempo de Processamento de Solicitação Web Alto Nome da métrica: MQL de Advertência:
MQL Crítico:
|
>1,500 | >3,000 |
Alarme de advertência para qualquer Oracle HTTP Server em um determinado compartimento que reporta mais de 1500 ms significa tempo de processamento de solicitação da Web nos últimos 5 minutos. Alarme crítico para qualquer Oracle HTTP Server em um determinado compartimento que reporta mais de 3000 ms significa tempo de processamento de solicitação da Web nos últimos 5 minutos. |
OIM (Oracle Identity Manager)
Regra de Alarme de Amostra: OIM (Oracle Identity Manager)
-
Tipo de Recurso: Cluster do Oracle Identity Manager/Oracle Identity Manager
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
oracle_oim
/oracle_oim_cluster
Período de Avaliação (minutos) | alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Status de Monitoramento Nome da métrica: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
n/d | < 1 |
Status de disponibilidade do cluster/servidor do OIM. Um alerta crítico será acionado se o valor da resposta for diferente de 1. |
15 |
Orquestração - Tempo Médio de Execução Nome da Métrica: MQL: Orchestration-AverageExecutionTime[15m].mean() > 300 Orchestration-AverageExecutionTime[15m].mean() > 500 |
> 300 | > 500 |
Tempo médio de execução da orquestração Um alerta de advertência será acionado se o tempo médio de execução da orquestração for superior a 300 ms Um alerta crítico será acionado se o tempo médio de execução da orquestração for superior a 500 ms |
OAM (Oracle Access Manager)
Regra de Alarme de Amostra: OAM (Oracle Access Manager)
-
Tipo de Recurso: Oracle Access Manager/Cluster do Oracle Access Manager
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
oracle_oam
/oracle_oam_cluster
Período de Avaliação (minutos) | Regra de Alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Status de Monitoramento Nome da métrica: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
n/d | < 1 |
Status de disponibilidade do cluster/servidor do OAM. Um alerta crítico será acionado se o valor da resposta for diferente de 1. |
5 |
Latência de Autorização Nome da Métrica: MQL: authorizationLatency[5m].mean() > 300 authorizationLatency[5m].mean() > 500 |
> 500 | > 800 |
Latência de Autorização Um alerta de aviso será acionado se a latência da autorização for superior a 500 ms Um alerta crítico será acionado se a latência da autorização for superior a 800 ms |
Oracle JVM
Tipo de Recurso: Runtime do Oracle JVM
ServerMetric Namespace: oracle_appmgmt
Grupo de Recursos: oracle_jvm
Período de Avaliação (minutos) | Regra de Alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Runtime do Oracle JVM Inativo Nome da Métrica: MQL Crítico: MonitoringStatus[1m].mean()!=1||MonitoringStatus[1m].absent() |
n/d | n/d | Alarme Crítico para não ser mais possível estabelecer conexão com o Oracle JVM Runtime |
5 |
Utilização do Pool de Memória Nome da Métrica: Nome da dimensão: Valor da dimensão: MQL de Advertência: MemoryPoolUtilization[5m]{Type="Used"}.mean()>80% MQL Crítico: MemoryPoolUtilization[5m]{Type=Used"}.mean()>90% |
>80% | >90% | A porcentagem de memória usada nos pools de memória relativa ao máximo disponível |
5 |
Utilização da Memória Heap Usada Nome da Métrica:
Nome da dimensão: Valor da dimensão: MQL de Advertência:
MQL Crítico: HeapMemoryUtilization[5m]{Type = "Used"}.mean() >90% |
>80% | >90% | A porcentagem de memória usada na memória heap em relação ao máximo disponível. |
5 |
Utilização de Memória Não Heap Usada Nome da Métrica:
Nome da dimensão: Valor da dimensão: MQL de Advertência: NonHeapMemoryUtilization[5m]{Type="Used"}.mean()>80% MQL Crítico: NonHeapMemoryUtilization[5m]{Type = "Used"}.mean() >90% |
>80% | >90% | A porcentagem de memória usada na memória não heap em relação ao máximo disponível. |
5 |
Utilização da CPU Nome da Métrica:
MQL de Advertência: CPUUtilization[5m]. mean() > 80% MQL Crítico: CPUUtilization[5m]. mean() > 90% |
>80% | >90% | A porcentagem de recursos de CPU consumidos pelo processo JVM |
Apache HTTP Server
Tipo de Recurso: Apache HTTP
ServerMetric Namespace: oracle_appmgmt
Grupo de Recursos: apache_http_server
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
3 |
Apache HTTP Server Inativo Nome da métrica: MQL Crítico:
|
n/d | n/d | Alarme crítico para qualquer Apache HTTP Server em um determinado compartimento reportando estar inativo ou não relatando status por mais de 3 minutos. |
5 |
Alta Utilização da CPU Nome da métrica: MQL de Advertência:
MQL Crítico:
|
>80 | >90 |
Alarme de advertência para qualquer Apache HTTP Server em um determinado compartimento que reporte mais de 80% de utilização da CPU nos últimos 5 minutos. Alarme crítico para qualquer Apache HTTP Server em um determinado compartimento que reporta mais de 90% de utilização da CPU nos últimos 5 minutos. |
5 |
Alta Utilização da Memória Nome da métrica: MQL de Advertência:
MQL Crítico:
|
>80 | >90 |
Alarme de advertência para qualquer Apache HTTP Server em um determinado compartimento que reporte mais de 80% de utilização de memória nos últimos 5 minutos. Alarme crítico para qualquer Apache HTTP Server em um determinado compartimento que reporta mais de 90% de utilização de memória nos últimos 5 minutos. |
5 |
Tempo de Processamento de Solicitação Web Alto Nome da métrica: MQL de Advertência:
MQL Crítico:
|
>1,500 | >3,000 |
Alarme de advertência para qualquer Apache HTTP Server em um determinado compartimento que reporta mais de 1500 ms significa tempo de processamento de solicitações da Web nos últimos 5 minutos. Alarme crítico para qualquer Apache HTTP Server em um determinado compartimento que reporta mais de 3000 ms significa tempo de processamento de solicitações da Web nos últimos 5 minutos. |
Oracle Unified Directory
Regra de Alarme de Amostra: Oracle Unified Directory (OUD)
-
Tipo de Recurso: Oracle Unified Directory
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
oud_directory
,oud_proxy
,oud_gateway
alarme | Advertência | Crítico | Descrição |
---|---|---|---|
Status de Monitoramento Nome da métrica: MQL: oud_base_status[1m].mean() != 1 || oud_base_status[1m].absent() |
n/d | < 1 |
Status de disponibilidade do servidor OUD. Um alerta crítico será acionado se o valor da resposta for menor que 1. |
Handler de Conexões - Estado Nome da Métrica: MQL: ConnectionHandlerState[1m].mean() < 1 |
n/d | <1 |
Handler de Conexões Um alerta crítico será acionado se o Estado do Handler de Conexão for menor que 1.
|
Backend - Entradas Nome da Métrica: BackendEntries MQL de Advertência: BackendEntries[5m].mean() > 30 MQL Crítico: BackendEntries[5m].mean() > 50 |
> 30 | >50 |
Backend - Entradas Um alerta de aviso será acionado se a Hora das Entradas de Backend for maior que 30. Um alerta crítico será acionado se as Entradas de Backend forem maiores que 50. |
Tempo Total de Permanência do Handler de Conexões Nome da Métrica: ConnectionHandlerAllResidentTime MQL de Advertência: ConnectionHandlerAllResidentTime[5m].mean() > 300 MQL Crítico: ConnectionHandlerAllResidentTime[5m].mean() > 500 |
> 300 | > 500 |
Tempo Total de Permanência do Handler de Conexões Um alerta de aviso será acionado se todo o tempo residente do manipulador de conexão for maior que 60. Um alerta crítico será acionado se todo o tempo residente do manipulador de conexão for maior que 90.
|
Handler de Conexões - Conexões Nome da Métrica: MQL de Advertência: ConnectionHandlerConnections[5m].mean() > 30 MQL Crítico: ConnectionHandlerConnections[5m].mean() > 50 |
> 30 | >50 |
Handler de Conexões - Conexões Um alerta de aviso será acionado se as Conexões do Handler de Conexão forem maiores que 30. Um alerta crítico será acionado se as Conexões do Handler de Conexão forem maiores que 50.
|
JVM - Memória Usada Nome da Métrica: MQL de Advertência: JVMUsedMemory[5m].mean() > 1.5 MQL Crítico: JVMUsedMemory[5m].mean() > 3 |
> 1.5 | > 3 |
JVM - Memória Usada Um alerta de advertência será acionado se a Memória Usada da JVM for maior que 1,5 mb. Um alerta crítico será acionado se a Memória Usada da JVM for maior que 3 mb.
|
Memória Usada do Sistema Operacional Nome da Métrica: MQL de Advertência: OSUsedMemory[5m].mean() > 1.5 MQL Crítico: OSUsedMemory[5m].mean() > 3 |
> 1.5 | > 3 |
Memória Usada do Sistema Operacional Um alerta de advertência será acionado se a Memória Usada do SO for maior que 1,5 mb. Um alerta crítico será acionado se a Memória Usada do SO for maior que 3 mb.
|
Estado do Domínio de Replicação Nome da Métrica: MQL: ReplicationDomainState[5m].mean() < 1 |
n/d | < 1 |
Estado do Domínio de Replicação Um alerta crítico será acionado se o Estado do Domínio de Replicação for menor que 1.
|
Tempo Total das Operações de Tempo de Permanência do WFE Nome da Métrica: MQL de Advertência: WFEResidentTimeOperationsTotalTime[5m].mean() > 60 MQL Crítico: WFEResidentTimeOperationsTotalTime[5m].mean() > 90 |
> 60 | > 90 |
Tempo Total das Operações de Tempo de Permanência do WFE Um alerta de aviso será acionado se o Tempo Total de Operações de Tempo de Residente WFE for maior que 60. Um alerta crítico será acionado se o Tempo Total de Operações de Tempo Residente de WFE for maior que 90.
|
Backlog Atual da Fila de Trabalho Nome da Métrica: MQL de Advertência: WorkQueueCurrentBacklog[5m].mean() > 15 MQL Crítico: WorkQueueCurrentBacklog[5m].mean() > 30 |
> 15 | > 30 |
Backlog Atual da Fila de Trabalho Um alerta de aviso será acionado se o Backlog Atual da Fila de Trabalho for maior que 15. Um alerta crítico será acionado se o Backlog Atual da Fila de Trabalho for maior que 30.
|
Extensão LDAP – Conexões Nome da Métrica: MQL de Advertência: ExtensionLDAPConnections[5m].mean() > 30 MQL Crítico: ExtensionLDAPConnections[5m].mean() > 50 |
> 30 | > 50 |
Extensão LDAP - Conexões Um alerta de aviso será acionado se as Conexões LDAP de Extensão forem maiores que 30. Um alerta crítico será acionado se as Conexões LDAP de Extensão forem maiores que 50.
|
Extensão LDAP – Tempo Total de Resposta das Operações Nome da Métrica: MQL de Advertência: ExtensionLDAPOperationsTotalResponseTime[5m].mean() > 60 MQL Crítico: ExtensionLDAPOperationsTotalResponseTime[5m].mean() > 90 |
> 60 | > 90 |
Extensão LDAP - Tempo Total de Resposta das Operações Um alerta de aviso será acionado se o Tempo Total de Resposta das Operações LDAP de Extensão for maior que 60. Um alerta crítico será acionado se o Tempo Total de Resposta das Operações LDAP de Extensão for maior que 90. |
Oracle GoldenGate
Regra de Alarme de Amostra: Goldengate
-
Tipo de Recurso: Oracle Goldengate
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
oracle_goldengate
Período de Avaliação (minutos) | Regra de Alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Goldengate Down Nome da métrica: MQL Crítico: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer Goldengate em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1 minuto. |
Regra de alarme de amostra: Goldengate AdminServer
-
Tipo de Recurso: Goldengate Admin Server
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
oracle_goldengate_admin_server
Período de Avaliação (minutos) | Regra de Alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Servidor de Administração do Goldengate Inativo Nome da métrica: MQL: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer Goldengate AdminServer em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1 minuto. |
5 |
Alta Utilização da CPU Nome da métrica: MQL de Advertência: CpuTimeUtilizationPercentage[5m].mean() > 80 MQL Crítico: CpuTimeUtilizationPercentage[5m].mean() > 90 |
80 | 90 | Alarme de advertência para qualquer Servidor Admin Goldengate em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos. Alarme crítico para qualquer Servidor Admin Goldengate em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos. |
5 |
Memória privada Nome da métrica: MQL de Advertência: PrivateMemory[5m].mean() > 30 MQL Crítico: PrivateMemory[5m].mean() > 40 |
30 | 40 | Um alerta de advertência será acionado se a média de memória Privada for superior a 30 GB nos últimos 5 minutos. Um alerta crítico será acionado se a média de memória Privada for superior a 40 GB nos últimos 5 minutos. |
5 |
Taxa de leitura de Entrada/Saída Nome da métrica: MQL de Advertência: IOReadRate[5m].mean() > 10 MQL Crítico: IOReadRate[5m].mean() > 20 |
10 | 20 | Um alerta de aviso será acionado se a média da taxa de leitura de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de leitura de E/S for maior que 20 MB/s nos últimos 5 minutos. |
5 |
Taxa de gravação de Entrada/Saída Nome da métrica: MQL de Advertência: IOWriteRate[5m].mean() > 10 MQL Crítico: IOWriteRate[5m].mean() > 20 |
10 | 20 | Um alerta de aviso será acionado se a média da taxa de gravação de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de gravação de E/S for superior a 20 MB/s nos últimos 5 minutos. |
5 |
Taxa de pacotes eliminados Nome da métrica: MQL de Advertência: DroppedPacketRate[5m].mean() > 30 MQL Crítico: DroppedPacketRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de pacote entregue for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacotes eliminados for superior a 40 Msgs/min nos últimos 5 minutos. |
5 |
Taxa de pacotes perdidos Nome da métrica: MQL de Advertência: MissingPacketRate[5m].mean() > 30 MQL Crítico: MissingPacketRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de pacote Ausente for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacote Ausente for superior a 40 Mensagens/min nos últimos 5 minutos. |
5 |
Taxa de erros do pacote Nome da métrica: MQL de Advertência: PacketErrorRate[5m].mean() > 30 MQL Crítico: PacketErrorRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de erro do Pacote for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de erro do Pacote for superior a 40 Mensagens/min nos últimos 5 minutos. |
5 |
Taxa de recebimento de pacotes Nome da métrica: MQL de Advertência: PacketReceiveRate[5m].mean() > 30 MQL Crítico: PacketReceiveRate[5m].mean() > 40 |
30 | 40 |
Um alerta de aviso será acionado se a média da taxa de recebimento do Pacote for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de recebimento do Pacote for superior a 40 Msgs/min nos últimos 5 minutos. |
Regra de Alarme de Amostra: Serviço de Distribuição Goldengate
-
Tipo de Recurso: Serviço de Distribuição Goldengate
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
oracle_goldengate_distribution_server
Período de Avaliação (minutos) | Regra de Alarme | Aviso | Crítico | Descrição |
---|---|---|---|---|
1 |
Serviço de Distribuição Goldengate Nome da métrica: MQL Crítico:MonitoringStatus [1m].mean() == 0 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer Serviço de Distribuição Goldengate em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1min. |
5 |
Alta Utilização da CPU Nome da métrica: MQL de Advertência: CpuTimeUtilizationPercentage[5m].mean() > 80 MQL Crítico: CpuTimeUtilizationPercentage[5m].mean() > 90 |
80 | 90 | Alarme de aviso para qualquer Serviço de Distribuição Goldengate em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos. Alarme crítico para qualquer Serviço de Distribuição Goldengate em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos. |
5 |
Memória privada Nome da métrica: MQL de Advertência: PrivateMemory[5m].mean() > 30 MQL Crítico: PrivateMemory[5m].mean() > 40 |
30 | 40 | Um alerta de advertência será acionado se a média de memória Privada for superior a 30 GB nos últimos 5 minutos. Um alerta crítico será acionado se a média de memória Privada for superior a 40 GB nos últimos 5 minutos. |
5 |
Taxa de leitura de Entrada/Saída Nome da métrica: MQL de Advertência: IOReadRate[5m].mean() > 10 MQL Crítico: IOReadRate[5m].mean() > 20 |
10 | 20 | Um alerta de aviso será acionado se a média da taxa de leitura de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de leitura de E/S for maior que 20 MB/s nos últimos 5 minutos. |
5 |
Taxa de gravação de Entrada/Saída Nome da métrica: MQL de Advertência: IOWriteRate[5m].mean() > 10 MQL Crítico: IOWriteRate[5m].mean() > 20 |
10 | 20 | Um alerta de aviso será acionado se a média da taxa de gravação de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de gravação de E/S for superior a 20 MB/s nos últimos 5 minutos. |
5 |
Taxa de pacotes eliminados Nome da métrica: MQL de Advertência: DroppedPacketRate[5m].mean() > 30 MQL Crítico: DroppedPacketRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de pacote entregue for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacotes eliminados for superior a 40 Msgs/min nos últimos 5 minutos. |
5 |
Taxa de pacotes perdidos Nome da métrica: MQL de Advertência: MissingPacketRate[5m].mean() > 30 MQL Crítico: MissingPacketRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de pacote Ausente for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacote Ausente for superior a 40 Mensagens/min nos últimos 5 minutos. |
5 |
Taxa de erros do pacote Nome da métrica: MQL de Advertência: PacketErrorRate[5m].mean() > 30 MQL Crítico: PacketErrorRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de erro do Pacote for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de erro do Pacote for superior a 40 Mensagens/min nos últimos 5 minutos. |
5 |
Taxa de recebimento de pacotes Nome da métrica: MQL de Advertência: PacketReceiveRate[5m].mean() > 30 MQL Crítico: PacketReceiveRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de recebimento do Pacote for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de recebimento do Pacote for superior a 40 Msgs/min nos últimos 5 minutos. |
Regra de Alarme de Amostra: Serviço do Receptor Goldengate
-
Tipo de Recurso: Goldengate Receiver Service
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
oracle_goldengate_receiver_server
Período de Avaliação (minutos) | Regra de alarme | Aviso | Crítico | Descrição |
---|---|---|---|---|
1 |
Serviço Recebedor de Goldengate Nome da métrica: MQL Crítico: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer Serviço de Receptor Goldengate em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1min. |
5 |
Alta Utilização da CPU Nome da métrica: MQL de Advertência: CpuTimeUtilizationPercentage[5m].mean() > 80 MQL Crítico: CpuTimeUtilizationPercentage[5m].mean() > 90 |
80 | 90 | Alarme de aviso para qualquer Serviço Receptor Goldengate em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos. Alarme crítico para qualquer Serviço Receptor Goldengate em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos. |
5 |
Memória privada Nome da métrica: MQL de Advertência: PrivateMemory[5m].mean() > 30 MQL Crítico: PrivateMemory[5m].mean() > 40 |
30 | 40 | Um alerta de advertência será acionado se a média de memória Privada for superior a 30 GB nos últimos 5 minutos. Um alerta crítico será acionado se a média de memória Privada for superior a 40 GB nos últimos 5 minutos. |
5 |
Taxa de leitura de Entrada/Saída Nome da métrica: MQL de Advertência: IOReadRate[5m].mean() > 10 MQL Crítico: IOReadRate[5m].mean() > 20 |
10 | 20 | Um alerta de aviso será acionado se a média da taxa de leitura de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de leitura de E/S for maior que 20 MB/s nos últimos 5 minutos. |
5 |
Taxa de gravação de Entrada/Saída Nome da métrica: MQL de Advertência: IOWriteRate[5m].mean() > 10 MQL Crítico: IOWriteRate[5m].mean() > 20 |
10 | 20 | Um alerta de aviso será acionado se a média da taxa de gravação de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de gravação de E/S for superior a 20 MB/s nos últimos 5 minutos. |
5 |
Taxa de pacotes eliminados Nome da métrica: MQL de Advertência: DroppedPacketRate[5m].mean() > 30 MQL Crítico: DroppedPacketRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de pacote entregue for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacotes eliminados for superior a 40 Msgs/min nos últimos 5 minutos. |
5 |
Taxa de pacotes perdidos Nome da métrica: MQL de Advertência: MissingPacketRate[5m].mean() > 30 MQL Crítico: MissingPacketRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de pacote Ausente for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacote Ausente for superior a 40 Mensagens/min nos últimos 5 minutos. |
5 |
Taxa de erros do pacote Nome da métrica: MQL de Advertência: PacketErrorRate[5m].mean() > 30 MQL Crítico: PacketErrorRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de erro do Pacote for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de erro do Pacote for superior a 40 Mensagens/min nos últimos 5 minutos. |
5 |
Taxa de recebimento de pacotes Nome da métrica: MQL de Advertência: PacketReceiveRate[5m].mean() > 30 MQL Crítico: PacketReceiveRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de recebimento do Pacote for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de recebimento do Pacote for superior a 40 Msgs/min nos últimos 5 minutos. |
Regra de Alarme de Amostra: Gerenciador de Serviços Goldengate
-
Tipo de Recurso: Goldengate Service Manager
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
oracle_goldengate_service_manager
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Gerenciador de Serviço do Goldengate Nome da métrica: StatusCritical MQL: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer Goldengate Service Manager em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1min. |
Regra de Alarme de Amostra: Serviço de Métrica de Desempenho Goldengate
-
Tipo de Recurso: Goldengate Performance Metric Service
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
oracle_goldengate_pm_server
Período de Avaliação (minutos) | Regra de Alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Serviço de Métricas de Desempenho Goldengate Nome da métrica: MQL Crítico: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer Serviço de Métrica de Desempenho Goldengate em um determinado compartimento que esteja inativo ou não reporte o status por mais de 1 minuto. |
5 |
Alta Utilização da CPU Nome da métrica: MQL de Advertência: CpuTimeUtilizationPercentage[5m].mean() > 80 MQL Crítico: CpuTimeUtilizationPercentage[5m].mean() > 90 |
80 | 90 | Alarme de advertência para qualquer Serviço de Métrica de Desempenho Goldengate em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos. Alarme crítico para qualquer Serviço de Métrica de Desempenho Goldengate em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos. |
5 |
Memória privada Nome da métrica: MQL de Advertência: PrivateMemory[5m].mean() > 30 MQL Crítico: PrivateMemory[5m].mean() > 40 |
30 | 40 | Um alerta de advertência será acionado se a média de memória Privada for superior a 30 GB nos últimos 5 minutos. Um alerta crítico será acionado se a média de memória Privada for superior a 40 GB nos últimos 5 minutos. |
5 |
Taxa de leitura de Entrada/Saída Nome da métrica: MQL de Advertência: IOReadRate[5m].mean() > 10 MQL Crítico: IOReadRate[5m].mean() > 20 |
10 | 20 | Um alerta de aviso será acionado se a média da taxa de leitura de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de leitura de E/S for maior que 20 MB/s nos últimos 5 minutos. |
5 |
Taxa de gravação de Entrada/Saída Nome da métrica: MQL de Advertência: IOWriteRate[5m].mean() > 10 MQL Crítico: IOWriteRate[5m].mean() > 20 |
10 | 20 | Um alerta de aviso será acionado se a média da taxa de gravação de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de gravação de E/S for superior a 20 MB/s nos últimos 5 minutos. |
Regra de Alarme de Amostra: Extrato de Goldengate
-
Tipo de Recurso: Extrato de Goldengate
-
Tipo de Recurso:
goldengate_extract
-
Grupo de Recursos:
oracle_goldengate_extract
Período de Avaliação (minutos) | Regra de alarme | Aviso | Crítico | Descrição |
---|---|---|---|---|
1 |
Extrato de Goldengate Nome da métrica: MQL Crítico: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer Extração Goldengate em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1 minuto. |
5 |
Alta Utilização da CPU Nome da métrica: MQL de Advertência: CpuTimeUtilizationPercentage[5m].mean() > 80 MQL Crítico: CpuTimeUtilizationPercentage[5m].mean() > 90 |
80 | 90 | Alarme de advertência para qualquer Extração Goldengate em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos. Alarme crítico para qualquer Extração Goldengate em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos. |
5 |
Memória privada Nome da métrica: MQL de Advertência: PrivateMemory[5m].mean() > 30 MQL Crítico: PrivateMemory[5m].mean() > 40 |
30 | 40 | Um alerta de advertência será acionado se a média de memória Privada for superior a 30 GB nos últimos 5 minutos. Um alerta crítico será acionado se a média de memória Privada for superior a 40 GB nos últimos 5 minutos. |
5 |
Taxa de leitura de Entrada/Saída Nome da métrica: MQL de Advertência: IOReadRate[5m].mean() > 10 MQL Crítico: IOReadRate[5m].mean() > 20 |
10 | 20 | Um alerta de aviso será acionado se a média da taxa de leitura de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de leitura de E/S for maior que 20 MB/s nos últimos 5 minutos. |
5 |
Taxa de gravação de Entrada/Saída Nome da métrica: MQL de Advertência: IOWriteRate[5m].mean() > 10 MQL Crítico: IOWriteRate[5m].mean() > 20 |
10 | 20 | Um alerta de aviso será acionado se a média da taxa de gravação de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de gravação de E/S for superior a 20 MB/s nos últimos 5 minutos. |
5 |
Taxa de pacotes eliminados Nome da métrica: MQL de Advertência: DroppedPacketRate[5m].mean() > 30 MQL Crítico: DroppedPacketRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de pacote entregue for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacotes eliminados for superior a 40 Msgs/min nos últimos 5 minutos. |
5 |
Taxa de pacotes perdidos Nome da métrica: MQL de Advertência: MissingPacketRate[5m].mean() > 30 MQL Crítico: MissingPacketRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de pacote Ausente for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacote Ausente for superior a 40 Mensagens/min nos últimos 5 minutos. |
5 |
Taxa de erros do pacote Nome da métrica: MQL de Advertência: PacketErrorRate[5m].mean() > 30 MQL Crítico: PacketErrorRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de erro do Pacote for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de erro do Pacote for superior a 40 Mensagens/min nos últimos 5 minutos. |
5 |
Taxa de recebimento de pacotes Nome da métrica: MQL de Advertência: PacketReceiveRate[5m].mean() > 30 MQL Crítico: PacketReceiveRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de recebimento do Pacote for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de recebimento do Pacote for superior a 40 Msgs/min nos últimos 5 minutos. |
5 |
Taxa de instruções DELETE mapeadas Nome da métrica: MQL de Advertência: MappedDeleteRate[5m].mean() > 30 MQL Crítico: MappedDeleteRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de exclusão Mapeada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de exclusão Mapeada for superior a 40 MB/s nos últimos 5 minutos. |
5 |
Taxa de inserção mapeada Nome da métrica: MQL de Advertência: MappedInsertRate[5m].mean() > 30 MQL Crítico: MappedInsertRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de inserção Mapeada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de inserção Mapeada for superior a 40 MB/s nos últimos 5 minutos. |
5 |
Taxa de truncamento mapeada Nome da métrica: MQL de Advertência: MappedTruncateRate[5m].mean() > 30 MQL Crítico: MappedTruncateRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de truncamento Mapeado for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de truncamento Mapeado for superior a 40 MB/s nos últimos 5 minutos. |
5 |
Taxa de atualização mapeada Nome da métrica: MQL de Advertência: MappedUpdateRate[5m].mean() > 30 MQL Crítico: MappedUpdateRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de atualização Mapeada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de atualização mapeada for superior a 40 MB/s nos últimos 5 minutos. |
5 |
Taxa de descarte Nome da métrica: MQL de Advertência: DiscardRate[5m].mean() > 30 MQL Crítico: DiscardRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de descarte for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de descarte for maior que 40 MB/s nos últimos 5 minutos. |
5 |
Ignorar taxa Nome da métrica: MQL de Advertência: IgnoreRate[5m].mean() > 30 MQL Crítico: IgnoreRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa Ignorar for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa Ignorar for maior que 40 MB/s nos últimos 5 minutos. |
5 |
Lag Nome da métrica: MQL de Advertência: Lag[5m].mean() > 10 MQL Crítico: Lag[5m].mean() > 20 |
10 | 20 | Um alerta de aviso será acionado se a média de Lag for maior que 10 segundos nos últimos 5 minutos. Um alerta crítico será acionado se a média de Lag for maior que 20 Sseg nos últimos 5 minutos. |
5 |
Taxa de operações Nome da métrica: MQL de Advertência: OperationsPerSec[5m].mean() > 30 MQL Crítico: OperationsPerSec[5m].mean() > 40 |
20 | 30 | Um alerta de aviso será acionado se a média da taxa de Operações for superior a 20 Ops/seg nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de operações for superior a 30 Ops/seg nos últimos 5 minutos. |
Regra de Alarme de Amostra: Goldengate Replicat
-
Tipo de Recurso: Goldengate Replicat
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
oracle_goldengate_replicat
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Processo de Replicação do Goldengate Nome da métrica: MQL Crítico: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer Goldengate Replicat em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1 minuto. |
5 |
Alta Utilização da CPU Nome da métrica: MQL de Advertência: CpuTimeUtilizationPercentage[5m].mean() > 80 MQL Crítico: CpuTimeUtilizationPercentage[5m].mean() > 90 |
80 | 90 | Alarme de advertência para qualquer Goldengate Replicat em um determinado compartimento que reporte mais de 80% de utilização de CPU nos últimos 5 minutos. Alarme crítico para qualquer Goldengate Replicat em um determinado compartimento que reporte mais de 90% de utilização de CPU nos últimos 5 minutos. |
5 |
Memória privada Nome da métrica: MQL de Advertência: PrivateMemory[5m].mean() > 30 MQL Crítico: PrivateMemory[5m].mean() > 40 |
30 | 40 | Um alerta de advertência será acionado se a média de memória Privada for superior a 30 GB nos últimos 5 minutos. Um alerta crítico será acionado se a média de memória Privada for superior a 40 GB nos últimos 5 minutos. |
5 |
Taxa de leitura de Entrada/Saída Nome da métrica: MQL de Advertência: IOReadRate[5m].mean() > 10 MQL Crítico: IOReadRate[5m].mean() > 20 |
10 | 20 | Um alerta de aviso será acionado se a média da taxa de leitura de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de leitura de E/S for maior que 20 MB/s nos últimos 5 minutos. |
5 |
Taxa de gravação de Entrada/Saída Nome da métrica: MQL de Advertência: IOWriteRate[5m].mean() > 10 MQL Crítico: IOWriteRate[5m].mean() > 20 |
10 | 20 | Um alerta de aviso será acionado se a média da taxa de gravação de E/S for superior a 10 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de gravação de E/S for superior a 20 MB/s nos últimos 5 minutos. |
5 |
Taxa de pacotes eliminados Nome da métrica: MQL de Advertência: DroppedPacketRate[5m].mean() > 30 MQL Crítico: DroppedPacketRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de pacote entregue for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacotes eliminados for superior a 40 Msgs/min nos últimos 5 minutos. |
5 |
Taxa de pacotes perdidos Nome da métrica: MQL de Advertência: MissingPacketRate[5m].mean() > 30 MQL Crítico: MissingPacketRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de pacote Ausente for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de pacote Ausente for superior a 40 Mensagens/min nos últimos 5 minutos. |
5 |
Taxa de erros do pacote Nome da métrica: PacketErrorRate MQL de Advertência: PacketErrorRate[5m].mean() > 30 MQL Crítico: PacketErrorRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de erro do Pacote for superior a 30 Mensagens/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de erro do Pacote for superior a 40 Mensagens/min nos últimos 5 minutos. |
5 |
Taxa de recebimento de pacotes Nome da métrica: MQL de Advertência: PacketReceiveRate[5m].mean() > 30 MQL Crítico: PacketReceiveRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de recebimento do Pacote for superior a 30 Msgs/min nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de recebimento do Pacote for superior a 40 Msgs/min nos últimos 5 minutos. |
5 |
Taxa de instruções DELETE mapeadas Nome da métrica: MQL de Advertência: MappedDeleteRate[5m].mean() > 30 MQL Crítico: MappedDeleteRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de exclusão Mapeada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de exclusão Mapeada for superior a 40 MB/s nos últimos 5 minutos. |
5 |
Taxa de inserção mapeada Nome da métrica: MQL de Advertência: MappedInsertRate[5m].mean() > 30 MQL Crítico: MappedInsertRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de inserção Mapeada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de inserção Mapeada for superior a 40 MB/s nos últimos 5 minutos. |
5 |
Taxa de truncamento mapeada Nome da métrica: MQL de Advertência: MappedTruncateRate[5m].mean() > 30 MQL Crítico: MappedTruncateRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de truncamento Mapeado for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de truncamento Mapeado for superior a 40 MB/s nos últimos 5 minutos. |
5 |
Taxa de atualização mapeada Nome da métrica: MQL de Advertência: MappedUpdateRate[5m].mean() > 30 MQL Crítico: MappedUpdateRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de atualização Mapeada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de atualização mapeada for superior a 40 MB/s nos últimos 5 minutos. |
5 |
Taxa de descarte Nome da métrica: MQL de Advertência: DiscardRate[5m].mean() > 30 MQL Crítico: DiscardRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de descarte for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de descarte for maior que 40 MB/s nos últimos 5 minutos. |
5 |
Ignorar taxa Nome da métrica: MQL de Advertência: IgnoreRate[5m].mean() > 30 MQL Crítico: IgnoreRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa Ignorar for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa Ignorar for maior que 40 MB/s nos últimos 5 minutos. |
5 |
Lag Nome da métrica: MQL de Advertência: Lag[5m].mean() > 30 MQL Crítico: Lag[5m].mean() > 40 |
10 | 20 | Um alerta de aviso será acionado se a média de Lag for maior que 10 segundos nos últimos 5 minutos. Um alerta crítico será acionado se a média de Lag for maior que 20 Sseg nos últimos 5 minutos. |
5 |
Taxa de operações Nome da métrica: MQL de Advertência: OperationsPerSec[5m].mean() > 30 MQL Crítico: OperationsPerSec[5m].mean() > 40 |
20 | 30 | Um alerta de aviso será acionado se a média da taxa de Operações for superior a 20 Ops/seg nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de operações for superior a 30 Ops/seg nos últimos 5 minutos. |
Regra de Alarme de Amostra: Caminho de Distribuição do Goldengate
-
Tipo de Recurso: Caminho de Distribuição do Goldengate
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
oracle_goldengate_distribution_path
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Caminho de Distribuição Goldengate Nome da métrica: MQL Crítico: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer Caminho de Distribuição Goldengate em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1min. |
5 |
Lag Nome da métrica: MQL de Advertência: Lag[5m].mean() > 30 MQL Crítico: Lag[5m].mean() > 40 |
10 | 20 | Um alerta de aviso será acionado se a média de Lag for maior que 10 segundos nos últimos 5 minutos. Um alerta crítico será acionado se a média de Lag for maior que 20 Sseg nos últimos 5 minutos. |
5 |
Taxa de envio de rede Nome da métrica: MQL de Advertência: NetworkSentRate[5m].mean() > 30 MQL Crítico: NetworkSentRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de envio da Rede for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de envio da Rede for superior a 40 MB/s nos últimos 5 minutos. |
5 |
Taxa de recebimento de rede Nome da métrica: MQL de Advertência: NetworkReceiveRate[5m].mean() > 30 MQL Crítico: NetworkReceiveRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média de recebimento da Rede enviada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de recebimento da Rede for superior a 40 MB/s nos últimos 5 minutos. |
Regra de Alarme de Amostra: Caminho do Receptor Goldengate
-
Tipo de Recurso: Caminho do Destinatário do Goldengate
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
oracle_goldengate_receiver_path
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Caminho do Destinatário de Goldengate Nome da métrica: MQL Crítico: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer Caminho do Receptor Goldengate em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1min. |
5 |
Lag Nome da métrica: MQL de Advertência: Lag[5m].mean() > 30 MQL Crítico: Lag[5m].mean() > 40 |
10 | 20 | Um alerta de aviso será acionado se a média de Lag for maior que 10 segundos nos últimos 5 minutos. Um alerta crítico será acionado se a média de Lag for maior que 20 Sseg nos últimos 5 minutos. |
5 |
Taxa de envio de rede Nome da métrica: MQL de Advertência: NetworkSentRate[5m].mean() > 30 MQL Crítico: NetworkSentRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média da taxa de envio da Rede for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de envio da Rede for superior a 40 MB/s nos últimos 5 minutos. |
5 |
Taxa de recebimento de rede Nome da métrica: MQL de Advertência: NetworkReceiveRate[5m].mean() > 30 MQL Crítico: NetworkReceiveRate[5m].mean() > 40 |
30 | 40 | Um alerta de aviso será acionado se a média de recebimento da Rede enviada for superior a 30 MB/s nos últimos 5 minutos. Um alerta crítico será acionado se a média da taxa de recebimento da Rede for superior a 40 MB/s nos últimos 5 minutos. |
Regras de Alarme de Amostra de Recurso Personalizado com Base em Processo
-
Tipo de Recurso: Recurso Personalizado
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
custom_resource
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Recurso Personalizado Inativo Nome da métrica: MQL Crítico: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer recurso personalizado em um determinado compartimento que esteja inativo ou que não esteja reportando o status por mais de 1 minuto. |
5 |
Alta Utilização da CPU Nome da métrica: MQL de Advertência: CpuUtilization[1m].mean() > 80 MQL Crítico: CpuUtilization[1m].mean() > 90 |
>80 | >90 |
Alarme de advertência para qualquer recurso personalizado em um determinado compartimento que reporte mais de 80% de utilização de CPU em 5 minutos. Alarme crítico para qualquer recurso personalizado em um determinado compartimento que reporte mais de 90% de utilização de CPU em 5 minutos. |
15 |
Alta Utilização da Memória Nome da Métrica: MQL de Advertência: MemoryUtilization[1m].mean() > 80 MQL Crítico: MemoryUtilization[1m].mean() > 90 |
>80 | >90 |
Alarme de advertência para qualquer recurso personalizado em um determinado compartimento que reporte mais de 80% de utilização de memória em 15 minutos. Alarme crítico para qualquer recurso personalizado em um determinado compartimento que reporte mais de 90% de utilização de memória em 15 minutos. |
OSS (Oracle Service Bus)
-
Tipo de Recurso: Oracle Service Bus
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
oracle_servicebus
Período de Avaliação (minutos) | Regra de alarme | Advertência | Crítico | Descrição |
---|---|---|---|---|
1 |
Status de Monitoramento Nome da métrica: MQL Crítico: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico para qualquer Service Bus em um determinado compartimento que reporte estar inativo ou não reportar o status por mais de 1 minuto. |
5 |
Erros do Service Bus Nome da métrica: MQL Crítico: ServiceBusErrors[1m].mean() > 0 |
n/d | >0 | Alarme crítico para qualquer Service Bus em um determinado compartimento que reporta quando há erros em qualquer um dos serviços OSB por mais de 5 minutos. |
IIS da Microsoft
-
Tipo de Recurso: IIS
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
microsoft_iis
Período de Avaliação | Regra de alarme | Advertência | Crítico | Descrição: |
---|---|---|---|---|
1 |
IIS Inativo Nome da Métrica: MQL Crítico:
|
n/d | n/d | Alarme Crítico por não ser mais capaz de se conectar ao IIS |
5 |
ASP.Net Reinicialização do Processo de Colaborador Nome da Métrica: MQL Crítico: ASPDotNetWorkerProcessRestarts[1m].mean() > 1 |
>1 | n/d | Alarme crítico para saber se tivemos Reinicializações do Processo do Colaborador. Isso pode ser causado por várias coisas e causar problemas, incluindo impacto no desempenho e perda de informações. |
5 |
ASP.Net Solicitações Enfileiradas Nome da Métrica: MQL de Advertência: ASPDotNetRequests.Type.Queued[1m].mean() > 5 MQL Crítico: ASPDotNetRequests.Type.Queued[1m].mean() > 10 |
>5 | >10 | Limite Crítico/Aviso para informar se as solicitações HTTP de entrada estão sendo colocadas em uma fila devido ao carregamento. |
5 |
ASP.Net Taxa de Erros Nome da Métrica: MQL de Advertência: ErrorRate[1m].mean() > 1%* MQL Crítico: ErrorRate[1m].mean() > 2%* |
> 1%* | > 2%* | Limite Crítico/de Advertência para alertar o usuário de que a taxa de erro de um Aplicativo ASP.Net está acima de um determinado limite. Esta métrica retorna em erros/segundo; portanto, o limite precisará ser definido com base na média total de solicitações que eles recebem. Por exemplo, se eles geralmente recebem 100 solicitações/seg, sugerimos 1 erro para um aviso e 2 para um crítico. |
-
Tipo de Recurso: Site do IIS
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
microsoft_iis
Período de Avaliação (em minutos) | Regra de alarme | Advertência | Crítico | Descrição: |
---|---|---|---|---|
1 |
Site do IIS Desativado Nome da Métrica: MQL Crítico: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
n/d | n/d | Alarme crítico por não poder mais se conectar ao site do IIS |
5 |
WWW - Conexões Atuais Nome da Métrica: MQL de Advertência: CurrentConnections.Service.WWW[1m].mean() > 90%* MQL Crítico: CurrentConnections.Service.WWW[1m].mean() > 95%* |
> 90%* | > 95%* | Limite crítico/de advertência para alertar o usuário de que o número de conexões está se aproximando do máximo. Observe que o cliente precisará definir o número como 90 / 95% de suas conexões máximas. A métrica é um número; portanto, esse alerta que está sendo definido será exclusivo para cada cliente. Por exemplo, se o usuário tiver 200 conexões totais permitidas, sugerimos 180 para aviso e 190 para crítico. |
O nas
-
Tipo de Recurso: NGINX
-
Namespace da Métrica:
oracle_appmgmt
-
Grupo de Recursos:
nginx
Período de Avaliação | Regra de alarme | Advertência | Crítico | Descrição: |
---|---|---|---|---|
3 |
Nginx inativo Nome para Exibição: MQL:
|
n/d | 0 |
Alarme para não ser possível estabelecer conexão com o ponto final da API NGINX. |
5 |
Taxa de Processos Reapresentados Nome da Métrica: MQL de Advertência: RespawnedProcessesRate[5m].mean() > 1 MQL Crítico:
|
>1 | >2 |
O número de processos que foram ressurgidos durante o intervalo. |
5 |
Taxa de Verificações de Integridade de Upstreams Http Não Íntegras Nome da Métrica: Nome da dimensão: Valor da dimensão: MQL de Advertência:
|
>1 | n/d |
Estado insalubre detectado pelo NGINX que pode afetar negativamente o desempenho ou a disponibilidade. |
5 |
Taxa de Verificações de Integridade do Stream Upstreams Insalubre >1 Estado Insalubre detectado pelo desempenho ou disponibilidade do NGINX Nome da Métrica:
Nome da dimensão: Valor da dimensão: MQL de Advertência:
|
>1 | n/d |
Estado não íntegro detectado pelo NGINX que pode afetar negativamente o desempenho ou a disponibilidade |
Extensões de Métrica
Você pode criar regras de alarme para acionar alarmes quando os valores de métrica das Extensões de Métrica ultrapassarem os limites. Use o mesmo workflow geral que você seguiria para criar uma regra de alarme para métricas incorporadas para seus recursos. A principal diferença está na seção de descrição Métrica.
- Compartimento: escolha o compartimento do recurso no qual a Extensão Métrica foi ativada
- Namespace de métrica: selecione
oracle_metric_extensions_appmgmt
- Grupo de recursos: o tipo de recurso no qual a extensão da métrica foi implantada.
A criação de uma regra de Alarme para uma Extensão Métrica de um host é mostrada na imagem abaixo:
