Alarme einrichten
Mit dem Oracle Cloud Infrastructure Monitoring-Service können Sie Alarme generieren, wenn Metriken Schwellenwerte überschreiten.
Machen Sie sich zunächst mit den Konzepten und Features des Monitoring-Service vertraut, indem Sie den Überblick über Monitoring lesen. Weitere Informationen zum Einrichten von Alarmen finden Sie unter Alarme verwalten. In der Monitoring Query Language-(MQL-)Referenz wird beschrieben, wie Sie erweiterte Abfragen für Monitoring und Alarme erstellen.
Stellen Sie außerdem sicher, dass Sie die entsprechenden Policys für die Verwendung von Alarmregeln festgelegt haben. Weitere Informationen finden Sie unter Erste Schritte.
Bevor Sie fortfahren, sollten Sie ein Alarmziel erstellt haben, z.B. einen Benachrichtigungsservice sowie Themen, die definieren, wer diese Alarme erhält.
In der folgenden Tabelle sind Metrikdetails aufgeführt, die Sie zum Erstellen von Alarmregeln für Metriken benötigen, die in Stackmonitoring verwendet werden.
Resource Type | Metrik-Namespace | Ressourcengruppe für Alarmregel | Alarmregeln | Metrikreferenz |
---|---|---|---|---|
Host
|
oracle_appmgmt |
host |
||
Nicht-Container-, Container- und integrierbare Oracle-Datenbanken | oracle_oci_database |
N/V | Oracle Database | Oracle Database |
Oracle Database-System, ASM, Cluster und Listener | oracle_oci_database_cluster |
oracle_asm , oracle_cluster , oracle_db_node , oracle_lsnr |
Oracle Database | Oracle Database-Cluster |
Oracle WebLogic Domain Oracle WebLogic Cluster |
oracle_appmgmt |
|
Oracle Weblogic-Server | WebLogic-Metriken |
Oracle WebLogic Server | oracle_appmgmt |
weblogic_j2eeserver |
Oracle Weblogic-Server | WebLogic-Metriken |
Oracle HTTP Server (OHS) | oracle_appmgmt |
oracle_http_server |
Oracle HTTP Server (OHS) | Oracle HTTP Server-(OHS-)Metriken |
Oracle Identity Manager (OIM) | oracle_appmgmt |
oracle_oim / oracle_oim_cluster |
Oracle Identity Manager (OIM) | Oracle Identity Manager (OIM) |
Oracle Access Manager (OAM) | oracle_appmgmt |
oracle_oam / oracle_oam_cluster |
Oracle Access Manager (OAM) | Oracle Access Manager (OAM) |
Oracle JVM Runtime | oracle_appmgmt |
oracle_jvm |
Oracle JVM | Oracle JVM-Metriken |
Oracle E-Business Suite | oracle_appmgmt |
ebs_instance |
Oracle E-Business Suite | E-Business Suite-Kennzahlen |
EBS-Anwendungs-Listener | oracle_appmgmt |
oracle_ebs_app_lsnr |
Oracle E-Business Suite | E-Business Suite-Kennzahlen |
EBS - Nebenläufige Verarbeitung | oracle_appmgmt |
oracle_ebs_conc_mgmt_service |
Gleichzeitige Verarbeitung | E-Business Suite-Kennzahlen |
EBS-Hintergrundverarbeitung - Spezialisiert | oracle_appmgmt |
oracle_ebs_conc_mgmt_service_specialized |
Nebenläufige Verarbeitung | E-Business Suite-Kennzahlen |
Knoten für EBS-Hintergrundverarbeitung | oracle_appmgmt |
oracle_ebs_cp_node |
Oracle E-Business Suite | E-Business Suite-Kennzahlen |
EBS - Formularsystem | oracle_appmgmt |
oracle_ebs_forms_system |
Oracle E-Business Suite | E-Business Suite-Kennzahlen |
EBS - Workflow-Agent-Listener | oracle_appmgmt |
oracle_ebs_wf_agent_lsnr |
Oracle E-Business Suite | E-Business Suite-Kennzahlen |
EBS - Workflow - Hintergrund-Engine | oracle_appmgmt |
oracle_ebs_wf_bkgd_engine |
Oracle E-Business Suite | E-Business Suite-Kennzahlen |
EBS-Workflowgruppe | oracle_appmgmt |
oracle_ebs_wf_group |
Oracle E-Business Suite | E-Business Suite-Metriken |
EBS-Workflowbenachrichtigungs-Mailer | oracle_appmgmt |
oracle_ebs_wf_notification_mailer |
Mailer für Workflowbenachrichtigung | E-Business Suite-Metriken |
Apache Tomcat | oracle_appmgmt |
apache_tomcat |
Apache Tomcat | Apache Tomcat-Metriken |
Microsoft SQL Server | oracle_appmgmt |
sql_server |
Microsoft SQL Server | Microsoft SQL Server-Metriken |
PeopleSoft Anwendungsserverdomain | oracle_appmgmt |
oracle_psft_appserv |
PeopleSoft | PeopleSoft-Metriken |
Domain für PeopleSoft Process Scheduler | oracle_appmgmt |
oracle_psft_prcs |
PeopleSoft | PeopleSoft-Metriken |
PeopleSoft (PIA) | oracle_appmgmt |
oracle_psft_pia |
PeopleSoft | PeopleSoft-Metriken |
PeopleSoft Suchmaschine
(OpenSearch / Elasticsearch) |
oracle_appmgmt |
elastic_search, open_search |
PeopleSoft | PeopleSoft-Metriken |
PeopleSoft Prozessüberwachung | oracle_appmgmt |
oracle_psft_prcm |
PeopleSoft | PeopleSoft-Metriken |
Apache HTTP Server | oracle_appmgmt |
apache_http_server |
Apache HTTP Server | Apache HTTP Server-Metriken |
OUD Directory-Server | oracle_appmgmt |
oud_directory |
Oracle Unified Directory | Oracle Unified Directory - Metriken |
OUD- Proxy-Server | oracle_appmgmt |
oud_proxy |
Oracle Unified Directory | Oracle Unified Directory - Metriken |
OUD-Replication Gateway | oracle_appmgmt |
oud_gateway |
Oracle Unified Directory | Oracle Unified Directory - Metriken |
GoldenGate | oracle_appmgmt |
oracle_goldengate |
Oracle GoldenGate | Oracle GoldenGate-Metriken |
GoldenGate ServiceManager | oracle_appmgmt |
oracle_goldengate_service_manager |
Oracle GoldenGate | Oracle GoldenGate-Metriken |
GoldenGate AdminServer | oracle_appmgmt |
oracle_goldengate_admin_server |
Oracle GoldenGate | Oracle GoldenGate-Metriken |
GoldenGate-Performancemetrikserver | oracle_appmgmt |
oracle_goldengate_pm_server |
Oracle GoldenGate | Oracle GoldenGate-Metriken |
GoldenGate Extract | oracle_appmgmt |
oracle_goldengate_extract |
Oracle GoldenGate | Oracle GoldenGate-Metriken |
GoldenGate Replicat | oracle_appmgmt |
oracle_goldengate_replicat |
Oracle GoldenGate | Oracle GoldenGate-Metriken |
GoldenGate DistributionServer | oracle_appmgmt |
oracle_goldengate_distribution_server |
Oracle GoldenGate | Oracle GoldenGate-Metriken |
GoldenGate Verteilungspfad | oracle_appmgmt |
oracle_goldengate_distribution_path |
Oracle GoldenGate | Oracle GoldenGate-Metriken |
GoldenGate Empfängerserver |
oracle_appmgmt |
oracle_goldengate_receiver_server |
Oracle GoldenGate | Oracle GoldenGate-Metriken |
GoldenGate Empfangspfad | oracle_appmgmt |
oracle_goldengate_receiver_path |
Oracle GoldenGate | Oracle GoldenGate-Metriken |
Benutzerdefinierte Ressource | oracle_appmgmt |
custom_resource |
Prozessbasierte Beispielalarmregeln für benutzerdefinierte Ressourcen | Prozessbasierte benutzerdefinierte Ressourcenmetriken |
Oracle Service Bus | oracle_appmgmt |
oracle_servicebus |
Oracle Service Bus (OSB) | Oracle Service Bus (OSB) |
Microsoft-IIS | oracle_appmgmt |
microsoft_iis |
Microsoft-IIS | Microsoft IIS-Metriken |
Microsoft IIS-Website | oracle_appmgmt |
microsoft_iis_website |
Microsoft-IIS | Microsoft IIS-Metriken |
NGINX | oracle_appmgmt |
nginx |
NGINX | NGINX-Metriken |
Best Practices für gängige Alarmszenarien
- Erstellen Sie die Alarmregeln in demselben Compartment, in dem Sie Ihre Ressourcen erkannt haben.
- Um eine Alarmregel einzurichten, die einen Alarm generiert, wenn eine Ressource heruntergefahren ist, geben Sie den entsprechenden Metrik-Namespace und die entsprechende Ressourcengruppe an, und verwenden Sie die folgende Metrik und Triggerregel:
Metrikname:
MonitoringStatus
Triggerregel:
-
Operator:
equal to
-
Wert:
0
-
Triggerverzögerung in Minuten:
1
-
- Um eine Alarmregel einzurichten, die für einzelne Ressourceninstanzen ausgelöst werden soll, müssen Sie zusätzlich zur Auswahl der Metrik auch Metrikdimensionen hinzufügen, um die Ressource eindeutig zu identifizieren.
So identifizieren Sie eine Ressourceninstanz eindeutig:
- Sie können
resourceName
undresourceType
ODER verwenden. - Sie können
resourceId
verwenden.Die meisten Metriken definieren zusätzliche Dimensionen, mit denen erweiterte Alarme festgelegt werden können.
- Sie können
- Verweisen Sie immer auf die Metrikbeschreibung in der Metrikreferenz, und prüfen Sie den Auswertungszeitraum (wie oft jede Metrik erfasst wird). Stellen Sie beim Einrichten von Alarmen sicher, dass Sie denselben Wert wie der Alarmwert Intervall angeben. Dies kann über In den erweiterten Modus wechseln in der oberen rechten Ecke der Alarmerstellungsseite erfolgen. Sie können erweiterte MQL im Abschnitt Abfragecodeeditor der Seite "Erweiterter Modus" angeben.
Hosts
Beispielalarmregel: Hostüberwachung
- Ressourcentyp: Host
- Metrik-Namespace:
oracle_appmgmt
- Ressourcengruppe:
host
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
4 |
Host heruntergefahren Metrikname: Kritische MQL: MonitoringStatus[4m].mean() != 1 || MonitoringStatus[4m].absent() |
n/v | n/v | Kritischer Alarm für jeden Host in einem bestimmten Compartment, der über einen Zeitraum von mehr als 1 Minuten als heruntergefahren oder nicht gemeldet wird. |
4 |
Hohe CPU-Auslastung Metrikname: Warnung: MQL: CpuUtilization[4m]{type="Total"}.mean() > 80 Kritische MQL: CpuUtilization[4m]{type="Total"}.mean() > 90 |
> 80 | > 90 | Warnungsalarm für jeden Host in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 3 Minuten.
Kritischer Alarm für jeden Host in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 3 Minuten. |
4 |
Hohe Speicherauslastung Metrikname: Warnung: MQL: MemoryUtilization[4m]{type="Logical"}.mean() > 80 Kritische MQL: MemoryUtilization[4m]{type="Logical"}.mean() > 90 |
> 80 | > 90 | Warnungsalarm für jeden Host in einem bestimmten Compartment, der eine Speicherauslastung von über 80% für die letzten 3 Minuten meldet.
Warnungsalarm für jeden Host in einem bestimmten Compartment, der eine Speicherauslastung von über 90% für die letzten 3 Minuten meldet. |
4 |
Dateisystemauslastung Metrikname: Warnung: MQL: FilesystemUtilization[4m].mean() > 80 Kritische MQL: FilesystemUtilization[4m].mean() > 90 |
> 80 | > 90 | Warnalarm für jedes Dateisystem auf einem Host in einem bestimmten Compartment, das über 80% Speicherauslastung meldet.
Kritischer Alarm für jedes Dateisystem auf einem Host in einem bestimmten Compartment, der über 90% Speicherauslastung meldet. Hinweis
Um ausgewählte Dateisysteme zu überwachen, können Sie die Dimension fileSystemName weiter angeben und Ihre Alarme an Ihre spezifischen Anforderungen anpassen. Beispiel: Die folgende MQL FilesystemUtilization[1m]{fileSystemName = "/", osType = "Linux"}.mean() > 80 gilt nur für Root-Dateisysteme auf Linux-Hosts in einem bestimmten Compartment.
|
GPU
Beispielalarmregel: GPU
1 |
GPU-Temperatur Metrikname: Warnung: MQL: GPUTemperature[4m]{Type="GPU"}.mean() > 98 Kritische MQL: GPUTemperature[4m]{Type="GPU"}.mean() > 101 |
> 98 | > 101 |
Warnung, wenn eine GPU die Verlangsamungstemperatur überschreitet. Kritischer Alarm, wenn eine GPU die Abschalttemperatur überschreitet. Die Temperaturen für Verlangsamung und Herunterfahren können je nach GPU-Modell variieren. Die richtigen Werte für eine erkannte GPU können auf der Stack Monitoring GPU-Homepage geprüft werden.
|
Oracle Database
Um das Risiko von Fehlalarmen zu minimieren, schließen Sie optional collectionName="sensor"
ein.
Beispiel:
MonitoringStatus[4m]{collectionName="sensor"}.groupBy(resourceName).last() < 1 || MonitoringStatus[4m] collectionName="sensor"}.groupBy(resourceName).absent()
Beispielalarmregel: Nicht-Containerdatenbank
-
Ressourcentyp: Nicht-Container-DB
-
Metrik-Namespace:
oracle_oci_database
-
Ressourcengruppe: n/v
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Verwendeter empfohlener DBM-Wert? | Beschreibung |
---|---|---|---|---|---|
30 |
Speicherplatzauslastung Metrikname: Dimension: Oder Warnung: MQL: StorageUtilizationByTablespace[30m]{tablespaceContents ="PERMANENT"}.mean()> 75 Kritische MQL: StorageUtilizationByTablespace[30m]{tablespaceContents ="PERMANENT"}.mean() > 85 |
>75 | >85 | Y | Warnungs- und kritische Alarmregelbedingungen für permanente Tablespaces, deren Auslastung in den letzten 30 Minuten mehr als 75% oder 85% beträgt. |
24 Stunden | InvalidObjects |
>150 | >200 | N/V | |
15 | BlockingSessions |
>1 | >10 | Y | Warnungs- und kritische Alarmregelbedingungen, um einen Alarm auszulösen, wenn die Anzahl der blockierenden Sessions in den letzten 15 Minuten mehr als 1 oder 10 beträgt. |
15 | UsableFRA |
< 20 | <10 | N/V | Bedingungen für Warnungs- und kritische Alarmregeln zum Auslösen eines Alarms, wenn der Prozentsatz des nutzbaren Fast Recovery-Bereichs in den letzten 15 Minuten weniger als 20% oder 10% beträgt. |
5 | ProcessLimitUtilization |
>70 | >80 | Y | Warnungs- und kritische Alarmregelbedingungen, um einen Alarm auszulösen, wenn die Prozessauslastung (%) in den letzten 5 Minuten mehr als 70% oder 80% beträgt. |
5 | SessionLimitUtilization |
>90 | >97 | N/V | |
5 | CPUUtilization |
>80 | >85 | Y | |
5 | FRAUtilization |
>70 | >75 | Y | |
5 | StorageUtilization |
>75 | >85 | Y | |
5 |
Monitoringstatus Metrikname: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
N/V | nicht zutreffend | Kritischer Alarm für alle Nicht-Container-Oracle Database-Berichte, die den Status über 1min heruntergefahren haben oder nicht melden. |
Beispielalarmregel: Containerdatenbank
-
Ressourcentyp: Container-DB
-
Metrik-Namespace:
oracle_oci_database
-
Ressourcengruppe: n/v
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Verwendeter empfohlener DBM-Wert? | Beschreibung |
---|---|---|---|---|---|
1 |
Monitoringstatus Metrikname: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | nicht zutreffend | Kritischer Alarm für alle Nicht-Container-Oracle Database-Berichte, die den Status über 1min heruntergefahren haben oder nicht melden. |
30 |
Metrik: Dimension: Oder Warnung: MQL: StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 75 Kritische MQL: StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 85 |
>75 | >85 | Y | Warnungs- und kritische Alarmregelbedingungen für permanente Tablespaces, deren Auslastung in den letzten 30 Minuten mehr als 85% oder 90% beträgt. |
5 | ProcessLimitUtilization |
>70 | >80 | Y | Warnungs- und kritische Alarmregelbedingungen, um einen Alarm auszulösen, wenn die Prozessauslastung (%) in den letzten 5 Minuten mehr als 90% oder 95% beträgt. |
5 | SessionLimitUtilization |
>90 | >97 | nicht zutreffend | |
15 | UsableFRA |
< 20 | <10 | nicht zutreffend | Bedingungen für Warnungs- und kritische Alarmregeln zum Auslösen eines Alarms, wenn der Prozentsatz des nutzbaren Fast Recovery-Bereichs in den letzten 15 Minuten weniger als 20% oder 10% beträgt. |
5 | CPUUtilization |
>80 | >85 | Y | |
5 | FRAUtilization |
>70 | >75 | Y | |
5 | StorageUtilization |
>75 | >85 | Y |
Beispielalarmregel: Integrierbare Datenbank
-
Ressourcentyp: Integrierbare DB
-
Metrik-Namespace:
oracle_oci_database
-
Ressourcengruppe: n/v
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Verwendeter empfohlener DBM-Wert? | Beschreibung |
---|---|---|---|---|---|
1 |
Monitoringstatus Metrikname: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | nicht zutreffend | Kritischer Alarm für alle Nicht-Container-Oracle Database-Berichte, die länger als 1 Minute ausfallen oder den Status nicht melden. |
5 | CPUUtilization |
>80 | >85 | Y | |
5 | StorageUtilization |
>75 | >85 | Y | |
15 | BlockingSessions |
>1 | >10 | Y | Bedingungen für Warnungs- und kritische Alarmregeln, um einen Alarm auszulösen, wenn die Anzahl der blockierenden Sessions in den letzten 15 Minuten größer als 1 oder 5 ist. |
24 Stunden | InvalidObjects |
>150 | >200 | nicht zutreffend | |
30 |
Metrik: StorageUtilizationByTablespace Dimension: Oder Warnung: MQL: StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 75 Kritische MQL: StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 85 |
>75 | >85 | Y | Warnungs- und kritische Alarmregelbedingungen für permanente Tablespaces, deren Auslastung in den letzten 30 Minuten mehr als 85% oder 90% beträgt. |
Beispielalarmregel: ASM/ASM-Instanz
-
Ressourcentyp: ASM
-
Metrik-Namespace:
oracle_oci_database_cluster
-
Ressourcengruppe:
oracle_asm
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Monitoringstatus Metrikname: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für alle Nicht-Container-Oracle Database-Berichte, die länger als 1 Minute ausfallen oder den Status nicht melden. |
30 | DiskGroupUtilization |
>85 | >95 | |
30 | DiskUtilization |
>85 | >95 |
-
Ressourcentyp: Cluster
-
Metrik-Namespace:
oracle_oci_database_cluster
-
Ressourcengruppe:
oracle_cluster
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Monitoringstatus Metrikname: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für alle Nicht-Container-Oracle Database-Berichte, die länger als 1 Minute ausfallen oder den Status nicht melden. |
Beispielalarmregel: Listener
-
Ressourcentyp: Listener
-
Metrik-Namespace:
oracle_oci_database_cluster
-
Ressourcengruppe:
oracle_lsnr
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Monitoringstatus Metrikname: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für alle Nicht-Container-Oracle Database-Berichte, die länger als 1 Minute ausfallen oder den Status nicht melden. |
5 | RefusedConnections |
>1 | >5 |
E-Business Suite
Beispielalarmregel: EBS
- Ressourcenart: Oracle E-Business Suite
- Metrik-Namespace:
oracle_appmgmt
- Ressourcengruppe:
ebs_instance
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
15 |
Ausgeführte Programme nach Ausführungszeit (ms) Metrikname: MQL: ExecutedProgramsByRunningTime[15m].mean() > 4000
Tip1: Sie können den Alarm in eine bestimmte Anwendung filtern, indem Sie den Dimensionsfilter |
> 4.000 | > 40.000 | Die Laufzeit der Anforderungen |
15 |
Abgeschlossene Anforderungen nach Anwendung (Verhältnis) Metrikname: Dimensionsname: Dimensionswert: MQL: CompletedRequestsByApplication[15m]{Category = "Error"}.mean() > 0.001 Tip1: Sie können den Alarm in eine bestimmte Anwendung filtern, indem Sie den Dimensionsfilter MQL: CompletedRequestsByApplication[15m]{Category = "Error", ApplicationName = "<YOUR APP NAME>"}.mean() > 0.001 |
> 0,001 | > 0,003 |
Das Verhältnis der Anforderungen, die mit Fehlern abgeschlossen wurden, zu allen Anforderungen im angegebenen Erfassungsintervall. Das bedeutet, wenn mehr als 0,1% angefordert fehlgeschlagen sind, erhalten Sie eine Warnung. Für mehr als 0,25% erhalten Sie eine kritische |
15 |
Aktive Benutzersessions Metrikname: MQL: ActiveUserSessions[15m].mean() > 200 |
> 200 | > 250 | Die Anzahl der aktiven Benutzersessions |
Beispielalarmregel: EBS-Anwendungs-Listener
Ressourcentyp: EBS-Anwendungs-Listener
Metrik-Namespace: oracle_appmgmt
Ressourcengruppe: oracle_ebs_app_lsnr
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Monitoringstatus Metrikname: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
nicht zutreffend | 0 | Kritischer Alarm für EBS-Anwendungs-Listener in einem bestimmten Compartment, bei dem über einen Zeitraum von mehr als 1 Minute gemeldet wird, dass der Status heruntergefahren ist oder nicht. |
Beispielalarmregel: EBS-Hintergrundverarbeitung
Ressourcenart: EBS - Hintergrundverarbeitung
Metrik-Namespace: oracle_appmgmt
Ressourcengruppe: oracle_ebs_conc_mgmt_service
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Monitoringstatus Metrikname: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
nicht zutreffend | 0 | Der Verfügbarkeitsstatus. |
15 |
Fehlerrate bei gleichzeitigen Anforderungen Metrikname: Dimensionsname: Dimensionswert: MQL: CompletedConcurrentRequests[15m]{State = "Errored"}.mean() > 0.001 |
> 0,001 | > 0,003 | Die Rate der Anforderungen, die auf Stundenbasis mit Fehlern abgeschlossen wurden. Wird der Wert mit 100 multipliziert, wird er zu einem Prozentsatz. |
15 |
Nebenläufige Anforderungen - Warnrate Metrikname: Dimensionsname: Dimensionswert: MQL: CompletedConcurrentRequests[15m]{State = "WithWarning"}.mean() > 0.15 |
> 0,002 | > 0,003 | Die Rate der Anforderungen, die auf Stundenbasis mit Warnung abgeschlossen wurden. Wird der Wert mit 100 multipliziert, wird er zu einem Prozentsatz. |
15 |
Hintergrundprozesse erfolgreich abgeschlossen (OPS/Evaluierungszeitraum) Metrikname: Dimensionsname: Dimensionswert: Erfolgreich Essentiell MQL: CompletedConcurrentRequests[15m]{State = "Successful"}.sum() > 2500 |
> 625 | > 2.500 | Die Rate der Anforderungen, die in einem Bewertungszeitraum erfolgreich abgeschlossen wurden (standardmäßig 15 Minuten). |
15 |
Gleichzeitige Anforderungen werden ausgeführt Metrikname: Dimensionsname: Dimensionswert: Runn Gramm MQL: ConcurrentRequestsByStatus[15m]{State = "Running"}.mean() > 100 |
> 2.500 | > 10.000 | Die Anzahl der ausgeführten Anforderungen nach Benutzer. |
15 |
Ausstehende nebenläufige Anforderungen - Normal Metrikname: Dimensionsname: Dimensionswert: MQL: ConcurrentRequestsByStatus[15m]{State = "PendingNormal"}.mean() > 100 |
> 2.500 | > 10.000 | Die Anzahl der ausstehenden Anforderungen nach Benutzer. |
15 |
Ausstehende nebenläufige Anforderungen - Standby Metrikname: Dimensionsname: Dimensionswert: MQL: ConcurrentRequestsByStatus[15m]{State = "PendingStandBy"}.mean() > 100 |
> 100 | > 500 | Die Anzahl von Anforderungen mit dem Status "Standby ausstehend". |
15 |
Inaktive Hintergrundprozesse - Kein Manager Metrikname: Dimensionsname: Dimensionswert: MQL: ConcurrentRequestsByStatus[15m]{State = "InactiveNoManager"}.mean() > 100 |
> 100 | > 500 | Die Anzahl der Anforderungen mit dem Status "Inaktiv, kein Manager". |
15 |
Inaktive Hintergrundprozesse - Gesperrt Metrikname: Dimensionsname: Dimensionswert: MQL: ConcurrentRequestsByStatus[15m]{State = "InactiveOnHold"}.mean() > 100 |
> 100 | > 500 | Die Anzahl der Anforderungen mit dem Status "Inaktiv gesperrt". |
5 |
Langfristige Hintergrundprozesse Metrikname: MQL: LongActiveConcurrentRequests[5m].mean() > 43200000 Tip1: Sie können den Alarm in eine MQL: LongActiveConcurrentRequests[5m]{Phase = "Running"}.mean() > 43200000 Tip2: Sie können nach einem bestimmten Programm weiter filtern, indem Sie den Dimensionsfilter MQL: LongActiveConcurrentRequests[1m]{Phase = "Running", ProgramShortName = "<PROGRAM SHORT NAME>"}.mean() > 43200000 |
> 43.200.000 | > 86.400.000 | Die abgelaufene Zeit in ms für eine ausstehende oder laufende Anforderung. Nur die Top 10 Anforderungen werden verfolgt. In diesem Fall empfehlen wir, Warnung nach 12 Stunden und Kritisch nach 24 Stunden zu erhalten. |
EBS-Hintergrundverarbeitung - Spezialisiert
Ressourcenart: EBS Hintergrundverarbeitung - Spezialisiert
Metrik-Namespace: oracle_appmgmt
Ressourcengruppe: oracle_ebs_conc_mgmt_service_specialized
Metrik | Metrikanzeigename | Maßeinheit | Beschreibung | Collection-Häufigkeit | Dimension | Ressourcenname |
---|---|---|---|---|---|---|
MonitoringStatus |
Verfügbarkeit | Status |
Status der Ressource. Werte: 1 = Oben 0 = Heruntergefahren Nur wenn ALLE anderen Manager hochgefahren sind, ist der Status hochgefahren. Wenn nur ein Manager heruntergefahren ist, ist der Gesamtstatus heruntergefahren. |
1 Minuten | nicht zutreffend | oracle_ebs_conc_mgmt_service_specialized |
ConcurrentProcesingComponentStatus |
Concurrent Manager-Status | Status | Verfügbarkeit des Hintergrundmanagers | 1 Minuten | Nebenläufige Queue - Name, Beschreibung, Hostname | oracle_ebs_conc_mgmt_service_specialized |
CapacityUtilizationOfConcurrentManagers |
Kapazitätsauslastung von Concurrent Manager | Prozentsatz | Prozentsatz der maximal ausgeführten Prozesse. Wenn die maximalen Prozesse des Managers 10 und 5 ausgeführt werden, beträgt die Kapazitätsauslastung 50% | 1 Minuten | Name von Manager | oracle_ebs_conc_mgmt_service_specialized |
ManagerMaxProcesses |
Max. Prozesse von Concurrent Manager | Anzahl | Maximale Anzahl Prozesse, die sich in der Warteschlange des Managers befinden. | 1 Minuten | Name von Manager | oracle_ebs_conc_mgmt_service_specialized |
ManagerRunningProcesses |
Aktive Prozesse von Concurrent Manager | Anzahl | Anzahl der laufenden Prozesse in der Managerqueue | 1 Minuten | Name von Manager | oracle_ebs_conc_mgmt_service_specialized |
Beispielalertregel: EBS-Workflowbenachrichtigungs-Mailer
Ressourcentyp: EBS-Workflowbenachrichtigungs-Mailer
Metrik-Namespace: oracle_appmgmt
Ressourcengruppe: oracle_ebs_wf_notification_mailer
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Monitoringstatus Metrikname: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
nicht zutreffend | 0 | Kritischer Alarm für nebenläufige EBS-Verarbeitung, der in einem bestimmten Compartment darauf spezialisiert ist, dass der Status für über 1min heruntergefahren oder nicht gemeldet wird. |
1 |
Kapazitätsauslastung von Concurrent Manager Metrikname: MQL: CapacityUtilizationOfConcurrentManagers[1m].mean() < 100 |
< 50 | < 100 | Prozentsatz der Kapazitätsauslastung aller aktivierten Manager. |
Apache Tomcat
Beispielalarmregel: Apache Tomcat
Ressourcentyp: Apache Tomcat
Metrik-Namespace: oracle_appmgmt
Ressourcengruppe: apache_tomcat
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
3 |
Apache Tomcat heruntergefahren Metrikname: Kritische MQL: MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für Apache Tomcat in einem bestimmten Compartment, bei dem über einen Zeitraum von mehr als 3 Minuten gemeldet wird, dass der Status heruntergefahren oder nicht gemeldet wurde. |
5 |
Hohe CPU-Auslastung Metrikname: Warnung: MQL: CPUUtilization[5m].mean() > 80 Kritische MQL: CPUUtilization[5m].mean() > 90 |
>80 | >90 |
Warnungsalarm für Apache Tomcat in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für Apache Tomcat in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten. |
5 |
Hohe JVM-Heap-Speicherauslastung Metrikname: Warnung: MQL: JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 80 Kritische MQL: JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 90 |
>80 | >90 |
Warnungsalarm für jeden Apache Tomcat in einem bestimmten Compartment mit einer Speicherauslastung von über 80% JVM-Heap für die letzten 5 Minuten. Warnungsalarm für Apache Tomcat in einem bestimmten Compartment mit einer Speicherauslastung von über 90% JVM-Heap für die letzten 5 Minuten. |
5 |
Hohe Verarbeitungszeit von Webanforderungen Metrikname: Warnung: MQL: WebRequestProcessingTime[5m].mean() > 1000 Kritische MQL: WebRequestProcessingTime[5m].mean() > 1500 |
>1.500 | >3.000 |
Warnungsalarm für jeden Apache Tomcat in einem bestimmten Compartment, der über 1500 ms berichtet, bedeutet die Verarbeitungszeit von Webanforderungen für die letzten 5 Minuten. Warnungsalarm für jeden Apache Tomcat in einem bestimmten Compartment, der über 3000 ms berichtet, bedeutet die Verarbeitungszeit von Webanforderungen für die letzten 5 Minuten. |
Microsoft SQL Server
Beispielalarmregeln: Microsoft SQL Server
Ressourcentyp: Microsoft SQL Server
Metrik-Namespace: oracle_appmgmt
Ressourcengruppe: sql_server
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
3 |
SQL Server-Verfügbarkeitsstatus Metrikname: Kritische MQL: MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für einen SQL-Server in einem bestimmten Compartment, der über einen Zeitraum von mehr als 3 Minuten als heruntergefahren oder nicht gemeldet wird. |
10 |
SQL Server-CPU-Auslastung (%) Metrikname: Warnung: MQL: CpuUtilization[10m].mean() > 80 Kritische MQL: CpuUtilization[10m].mean() > 95 |
>80 | >95 | Warnungsalarm für jeden SQL-Server in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 10 Minuten.
Kritischer Alarm für jeden SQL-Server in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 10 Minuten. |
15 |
SQL Server-Datenbankauslastung Metrikname: Warnung: MQL: StorageDatabaseUtilization[15m].mean() > 80 Kritische MQL: StorageDatabaseUtilization[15m].mean() > 95 |
>80 | >95 | Warnungsalarm für jeden SQL-Server in einem bestimmten Compartment, der über 80% der Datenbankauslastung für die letzten 15 Minuten berichtet.
Kritischer Alarm für jeden SQL-Server in einem bestimmten Compartment, der über 90% der Datenbankauslastung für die letzten 15 Minuten berichtet. |
PeopleSoft
PeopleSoft Anwendungsserver
- Ressourcentyp: PeopleSoft Application Server-Domain
- Metrik-Namespace:
oracle_appmgmt
- Ressourcengruppe:
oracle_psft_appserv
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
5 |
Zustand Metrikname: Warnung: MQL: Health[1m]{HealthState = "Warning"}.mean() = 1 Kritische MQL: Health[1m]{HealthState = "Critical"}.mean() = 1 |
1 | 1 |
Gesamtzustand der Application Server-Domain. Ein Warnalarm wird ausgelöst, wenn der Status "Warnung" gleich 1 ist. Ein kritischer Alarm wird ausgelöst, wenn der Status "kritisch" gleich 1 ist. |
5 |
Belastung Metrikname: Warnung: MQL: Load[1m]{LoadState = "Medium"}.mean() = 1 Kritischer MQL Load[1m]{LoadState = "Heavy"}.mean() = 1 |
1 | 1 |
Gesamtlast der Application Server-Domain. Ein Warnalarm wird ausgelöst, wenn der Status "mittel" gleich 1 ist. Ein kritischer Alarm wird ausgelöst, wenn der Zustand "schwer" gleich 1 ist. |
5 |
Durchschnittliche Ausführungszeit für Serviceanfragen Metrikname: Warnung: MQL: AverageServiceRequestExecutionTime[5m].mean()> 1000 |
> 1.000 | nicht zutreffend |
Durchschnittliche Zeit in Millisekunden für die Ausführung einer Serviceanfrage. Warnalarm wird ausgelöst, wenn eine Anforderung im Durchschnitt mehr als eine Sekunde (1000 ms) benötigt. |
5 |
Prozesse in der Queue für Anwendungsserver Metrikname: Dimensionsname: Dimensionswert: Kritische MQL: QueuedTuxedoProcesses[5m]{Category = "ApplicationServer"}.mean() > 1 |
nicht zutreffend | > 1 | Anzahl der Prozesse, die sich derzeit in der Queue für den Application Server befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus. |
5 |
In Queue gestellte Prozesse für BRK-Handler Metrikname: Dimensionsname: Dimensionswert: Kritische MQL: QueuedTuxedoProcesses[5m]{Category = "BRKHandler"}.mean() > 1 |
nicht zutreffend | > 1 | Anzahl der Prozesse, die sich derzeit in der Queue für den BRK-Handler befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus. |
5 |
In Queue gestellte Prozesse für BRK Dispatcher Metrikname: Dimensionsname: Dimensionswert: Kritische MQL: QueuedTuxedoProcesses[5m]{Category = "BRKDispatcher"}.mean() > 1 |
nicht zutreffend | > 1 | Anzahl der Prozesse, die sich derzeit in der Queue für den BRK-Dispatcher befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus. |
5 |
In Queue gestellte Prozesse für PUB Dispatcher Metrikname: Dimensionsname: Dimensionswert: MQL: QueuedTuxedoProcesses[5m]{Category = "PUBDispatcher"}.mean() > 1 |
nicht zutreffend | > 1 | Anzahl der Prozesse, die sich derzeit in der Warteschlange für den PUB-Dispatcher befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus. |
5 |
In Queue gestellte Prozesse für PUB-Handler Metrikname: Dimensionsname: Dimensionswert: Kritische MQL: QueuedTuxedoProcesses[5m]{Category = "PUBHandler"}.mean() > 1 |
nicht zutreffend | > 1 | Anzahl der Prozesse, die sich derzeit in der Queue für den PUB-Handler befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus. |
5 |
In Queue gestellte Prozesse für SUB Dispatcher Metrikname: Dimensionsname: Dimensionswert: Kritische MQL: QueuedTuxedoProcesses[5m]{Category = "SUBDispatcher"}.mean() > 1 |
nicht zutreffend | > 1 | Anzahl der Prozesse, die sich derzeit in der Warteschlange für den SUB-Dispatcher befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus. |
5 |
Prozesse in Queue für SUB-Handler Metrikname: Dimensionsname: Dimensionswert: Kritische MQL: QueuedTuxedoProcesses[5m]{Category = "SUBHandler"}.mean() > 1 |
nicht zutreffend | > 1 | Anzahl der Prozesse, die sich derzeit in der Queue für den SUB-Handler befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus. |
5 |
Nicht erfolgreiche Serverprozesse Metrikname: Kritische MQL: FailedServerProcesses[5m].mean() > 0 |
nicht zutreffend | > 0 | Anzahl der Serverprozesse, die in der Domain nicht erfolgreich waren oder heruntergefahren sind. Wenn ein Serverprozess ausfällt, wird ein kritischer Alarm ausgelöst. |
15 |
Statusdateien Metrikname: Warnung: MQL: PeopleToolsStateFiles[15m].mean() > 0 |
> 0 | nicht zutreffend | Anzahl der im Domainlogverzeichnis generierten PeopleTools-Statusdateien. Wenn eine Statusdatei generiert wird, wird ein Warnalarm ausgelöst. |
PeopleSoft Process Scheduler
- Ressourcentyp: Domain des PeopleSoft Process Scheduler
- Metrik-Namespace:
oracle_appmgmt
- Ressourcengruppe:
oracle_psft_prcs
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
5 |
Zustand Metrikname: Warnung: MQL: Health[1m]{HealthState = "Warning"}.mean() = 1 Kritische MQL: Health[1m]{HealthState = "Critical"}.mean() = 1 |
1 | 1 |
Gesamtzustand der Prozess-Scheduler-Domain. Ein Warnalarm wird ausgelöst, wenn der Status "Warnung" gleich 1 ist. Ein kritischer Alarm wird ausgelöst, wenn der Status "kritisch" gleich 1 ist. |
5 |
Laden Metrikname: Warnung: MQL: Load[1m]{LoadState = "Medium"}.mean() = 1 Kritische MQL: Load[1m]{LoadState = "Heavy"}.mean() = 1 |
1 | 1 |
Gesamtlast der Prozess-Scheduler-Domain. Ein Warnalarm wird ausgelöst, wenn der Status "mittel" gleich 1 ist. Ein kritischer Alarm wird ausgelöst, wenn der Zustand "schwer" gleich 1 ist. |
5 |
In Queue gestellte Prozesse für PSPRCSRV Metrikname: Dimensionsname: Dimensionswert: Kritische MQL: QueuedTuxedoProcesses[5m]{ProcessType = "PSPRCSRV"}.mean() > 1 |
nicht zutreffend | > 1 | Anzahl der Prozesse, die sich derzeit in der Queue für den Process Scheduler (PSPRCSRV) befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus. |
5 |
In Queue gestellte Prozesse für PSDSTSRV Metrikname: Dimensionsname: Dimensionswert: Kritische MQL: QueuedTuxedoProcesses[5m]{ProcessType = "PSDSTSRV"}.mean() > 1 |
nicht zutreffend | > 1 | Anzahl der Prozesse, die sich derzeit in der Warteschlange für den Distributionsserver (PSDSTSRV) befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus. |
5 |
Nicht erfolgreiche Prozesse Metrikname: Kritische MQL: FailedProcesses[5m].mean() > 1 |
nicht zutreffend | > 0 | Anzahl der Serverprozesse, die in der Domain nicht erfolgreich waren oder heruntergefahren sind. Wenn ein Serverprozess ausfällt, wird ein kritischer Alarm ausgelöst. |
PeopleSoft (PIA)
- Ressourcentyp: PeopleSoft PIA
- Metrik-Namespace:
oracle_appmgmt
- Ressourcengruppe:
oracle_psft_pia
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
5 |
Zustand Metrikname: Warnung: MQL: Health[1m]{HealthState = "Warning"}.mean() = 1 Kritische MQL: Health[1m]{HealthState = "Critical"}.mean() = 1 |
1 | 1 |
Gesamtzustand der PIA. Ein Warnalarm wird ausgelöst, wenn der Status "Warnung" gleich 1 ist. Ein kritischer Alarm wird ausgelöst, wenn der Status "kritisch" gleich 1 ist. |
5 |
Belastung Metrikname: Warnung: MQL: Load[1m]{LoadState = "Medium"}.mean() = 1 Kritische MQL: Load[1m]{LoadState = "Heavy"}.mean() = 1 |
1 | 1 |
Gesamtlast der PIA. Ein Warnalarm wird ausgelöst, wenn der Status "mittel" gleich 1 ist. Ein kritischer Alarm wird ausgelöst, wenn der Zustand "schwer" gleich 1 ist. |
5 |
Sockets im Wait-Status Metrikname: Warnung: MQL: WaitStateSockets[5m].mean() > 100 |
> 100 | nicht zutreffend | Anzahl Webserver-Sockets, die sich im WAIT-Status befinden. Wenn sich mehr als 100 Webserver-Sockets im WAIT-Status befinden, wird ein Warnalarm ausgelöst. |
5 |
Schwerwiegende Fehler Metrikname: Warnung: MQL: FatalErrors[5m].mean() > 0 |
> 0 | nicht zutreffend | Anzahl schwerwiegender Fehler in den JOLTService-Servletlogs. Wenn im Servlet JOLTService ein Fehler auftritt, wird ein Warnalarm ausgelöst. |
PeopleSoft Suchmaschine
- Ressourcentyp: PeopleSoft Elasticsearch, PeopleSoft OpenSearch
- Metrik-Namespace:
oracle_appmgmt
- Ressourcengruppe:
elastic_search, open_search
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Cluster Zustand Metrikname: ClusterHealth MQL: ClusterHealth[1m]{Status = "Red"}.mean() = 1 ClusterHealth[1m]{Status = "Yellow"}.mean() = 1 |
1 | 1 |
Gesamtzustand des Suchmaschinenclusters. Eine Warnmeldung wird ausgelöst, wenn der Status "gelb" 1 ist. Ein kritischer Alert wird ausgelöst, wenn der Status 'rot' gleich 1 ist. |
10 |
Speichernutzung Metrikname: MQL: MemoryUsage[10m].mean() |
> 80 | > 90 |
Maximal konfigurierter Heap des Suchmaschinenknotens. Eine Warnmeldung wird ausgelöst, wenn die Speicherauslastung größer als 80% ist. Ein kritischer Alert wird ausgelöst, wenn die Speicherauslastung größer als 90% ist. |
PeopleSoft Prozessüberwachung
- Ressourcentyp: PeopleSoft Process Monitor
- Metrik-Namespace:
oracle_appmgmt
- Ressourcengruppe:
oracle_psft_prcm
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
5 |
Aktiver Verteilungsstatus Metrikname: ActiveDistributionState MQL: ActiveDistributionState[5m]{State = "NotPosted"}.mean() > 1 |
nicht zutreffend | > 1 |
Ein kritischer Alert wird ausgelöst, wenn zu viele Verteilungsprozesse den Status "Nicht veröffentlicht" aufweisen. |
5 |
Run-Status Metrikname: MQL: ActiveRunState[5m]{State = "NoSuccess"}.mean() > 1 |
nicht zutreffend | > 1 |
Ein kritischer Alert wird ausgelöst, wenn zu viele ausgeführte Prozesse keinen Erfolgsstatus aufweisen. |
5 |
Run-Status Metrikname: MQL: RunStatus[5m]{Status = "Error"}.mean() > 0 |
nicht zutreffend | > 0 |
Ein kritischer Alert wird ausgelöst, wenn zu viele Prozesse im Ausführungsfehlerstatus sind. |
Oracle Weblogic-Server
Beispielalarmregel: Oracle Weblogic-Server
- Ressourcentyp: OracleWeblogic-Server
- Metrik-Namespace:
oracle_appmgmt
- Ressourcengruppe:
weblogic_j2eeserver
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
3 |
WebLogic Server heruntergefahren Metrikname: Kritische MQL:
|
nicht zutreffend | nicht zutreffend | Kritischer Alarm für WebLogic Server in einem bestimmten Compartment, bei dem über einen Zeitraum von mehr als 3 Minuten gemeldet wird, dass der Status heruntergefahren oder nicht gemeldet wurde. |
5 |
Hohe CPU-Auslastung Metrikname: Warnung: MQL:
Kritische MQL:
|
> 80 | > 90 |
Warnungsalarm für WebLogic Server in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für WebLogic Server in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten. |
5 |
Hohe Heap-Auslastung Metrikname: Warnung: MQL: JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 80 Kritische MQL: JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 90 |
> 80 | > 90 |
Warnungsalarm für WebLogic Server in einem bestimmten Compartment mit einer Heap-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für WebLogic Server in einem bestimmten Compartment mit einer Heap-Auslastung von über 90% für die letzten 5 Minuten. |
5 |
Hängende Work Manager-Threads Metrikname: Warnung: WorkManagerStuckThreads[5m].mean() > 10 Kritisch WorkManagerStuckThreads[5m].mean() > 15 |
> 10 | > 15 |
Warnungsalarm für WebLogic Server in einem bestimmten Compartment, der mehr als 10 hängende Work Manager-Threads für die letzten 5 Minuten meldet. Kritischer Alarm für WebLogic Server in einem bestimmten Compartment, der mehr als 15 Work Manager-Threads für die letzten 5 Minuten protokolliert. |
5 |
Wartende Verbindungsanforderungen Metrikname:
Warnung: MQL: ServerConnectionPoolConnections[5m].mean() > 1 Kritische MQL:
|
>1 | >2 | |
5 |
Verarbeitungszeit von Webanforderungen Metrikname: Warnung: WebRequestProcessingTime[5m].mean() > 10000 Kritisch WebRequestProcessingTime[5m].mean() > 15000 |
>10.000 | >15.000 | |
5 |
Aktive Threadpoolthreads Metrikname: Warnung: ThreadPoolThreads[5m]{Status = "Active"}.mean() > 1000 Kritisch ThreadPoolThreads[5m]{Status = "Active"}.mean() > 1250 |
>1.000 | >1.250 |
Beispielalarmregel: Oracle Weblogic-Servercluster
-
Ressourcentyp: Oracle Weblogic-Servercluster
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
weblogic_cluster
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
WebLogic Cluster heruntergefahren Metrikname: Kritische MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für ein WebLogic-Cluster in einem bestimmten Compartment, bei dem über einen Zeitraum von mehr als 1 Minute gemeldet wird, dass der Status heruntergefahren ist oder nicht. |
Beispielalarmregeln: Oracle HTTP Server (OHS)
-
Ressourcentyp: Oracle HTTP Server
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
oracle_http_server
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
3 |
Oracle HTTP Server heruntergefahren Metrikname: Kritische MQL:
|
nicht zutreffend | nicht zutreffend | Kritischer Alarm für Oracle HTTP Server in einem bestimmten Compartment, bei dem über einen Zeitraum von mehr als 3 Minuten gemeldet wird, dass der Status heruntergefahren oder nicht gemeldet wurde. |
5 |
Hohe CPU-Auslastung Metrikname: Warnung: MQL:
Kritische MQL: CPUUtilization[5m].mean() > 90 |
>80 | >90 |
Warnalarm für jeden Oracle HTTP Server in einem bestimmten Compartment, der über 80% CPU-Auslastung für die letzten 5 Minuten meldet. Kritischer Alarm für jeden Oracle HTTP Server in einem bestimmten Compartment, der über 90% CPU-Auslastung für die letzten 5 Minuten meldet. |
5 |
Hohe Speicherauslastung Metrikname: Warnung: MQL:
Kritische MQL:
|
>80 | >90 |
Warnalarm für jeden Oracle HTTP Server in einem bestimmten Compartment, der über 80% Speicherauslastung für die letzten 5 Minuten meldet. Kritischer Alarm für jeden Oracle HTTP Server in einem bestimmten Compartment, der über 90% Speicherauslastung für die letzten 5 Minuten meldet. |
5 |
Hohe Verarbeitungszeit von Webanforderungen Metrikname: Warnung: MQL:
Kritische MQL:
|
>1.500 | >3.000 |
Warnungsalarm für jeden Oracle HTTP Server in einem bestimmten Compartment, der über 1500 ms berichtet, bedeutet die Verarbeitungszeit von Webanforderungen für die letzten 5 Minuten. Kritischer Alarm für jeden Oracle HTTP Server in einem bestimmten Compartment, der über 3000 ms berichtet, bedeutet die Verarbeitungszeit von Webanforderungen für die letzten 5 Minuten. |
Oracle Identity Manager (OIM)
Beispielalarmregel: Oracle Identity Manager (OIM)
-
Ressourcentyp: Oracle Identity Manager/Oracle Identity Manager-Cluster
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
oracle_oim
/oracle_oim_cluster
Beurteilungszeitraum (Minuten) | Alarm | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Monitoringstatus Metrikname: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
nicht zutreffend | < 1 |
Verfügbarkeitsstatus des OIM-Clusters/-Servers. Ein kritischer Alert wird ausgelöst, wenn der Antwortwert nicht 1 ist. |
15 |
Orchestrierung - Durchschnittliche Ausführungszeit Metrikname: MQL: Orchestration-AverageExecutionTime[15m].mean() > 300 Orchestration-AverageExecutionTime[15m].mean() > 500 |
> 300 | > 500 |
Durchschnittliche Orchestrierungsausführung Ein Warnungsalert wird ausgelöst, wenn die durchschnittliche Ausführungszeit der Orchestrierung größer als 300 ms ist Ein kritischer Alert wird ausgelöst, wenn die durchschnittliche Ausführungszeit der Orchestrierung größer als 500 ms ist |
Oracle Access Manager (OAM)
Beispielalarmregel: Oracle Access Manager (OAM)
-
Ressourcentyp: Oracle Access Manager/Oracle Access Manager-Cluster
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
oracle_oam
/oracle_oam_cluster
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Monitoringstatus Metrikname: MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
nicht zutreffend | < 1 |
Verfügbarkeitsstatus des OAM-Clusters/-Servers. Ein kritischer Alert wird ausgelöst, wenn der Antwortwert nicht 1 ist. |
5 |
Autorisierungslatenz Metrikname: MQL: authorizationLatency[5m].mean() > 300 authorizationLatency[5m].mean() > 500 |
> 500 | > 800 |
Autorisierungslatenzzeit Eine Warnmeldung wird ausgelöst, wenn die Autorisierungslatenz größer als 500 ms ist Ein kritischer Alert wird ausgelöst, wenn die Autorisierungslatenz größer als 800 ms ist |
Oracle JVM
Ressourcentyp: Oracle JVM Runtime
ServerMetric-Namespace: oracle_appmgmt
Ressourcengruppe: oracle_jvm
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Oracle JVM-Laufzeit heruntergefahren Metrikname: Kritische MQL: MonitoringStatus[1m].mean()!=1||MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm, da keine Verbindung mehr zu Oracle JVM Runtime hergestellt werden kann |
5 |
Speicherpoolauslastung Metrikname: Dimensionsname: Dimensionswert: Warnung: MQL: MemoryPoolUtilization[5m]{Type="Used"}.mean()>80% Kritische MQL: MemoryPoolUtilization[5m]{Type=Used"}.mean()>90% |
>80% | >90% | Prozentsatz des in Speicherpools belegten Speichers im Verhältnis zum maximal verfügbaren Speicher |
5 |
Auslastung des belegten Heap-Speichers Metrikname:
Dimensionsname: Dimensionswert: Warnung: MQL:
Kritische MQL: HeapMemoryUtilization[5m]{Type = "Used"}.mean() >90% |
>80% | >90% | Der Prozentsatz des im Heap-Speicher belegten Speichers im Verhältnis zum maximal verfügbaren Speicher. |
5 |
Belegte Auslastung des nicht belegten Heap-Speichers Metrikname:
Dimensionsname: Dimensionswert: Warnung: MQL: NonHeapMemoryUtilization[5m]{Type="Used"}.mean()>80% Kritische MQL: NonHeapMemoryUtilization[5m]{Type = "Used"}.mean() >90% |
>80% | >90% | Der Prozentsatz des im Nicht-Heap-Speicher belegten Speichers im Verhältnis zum maximal verfügbaren Speicher. |
5 |
CPU-Auslastung Metrikname:
Warnung: MQL: CPUUtilization[5m]. mean() > 80% Kritische MQL: CPUUtilization[5m]. mean() > 90% |
>80% | >90% | Prozentsatz der vom JVM-Prozess verbrauchten CPU-Ressourcen |
Apache HTTP Server
Ressourcentyp: Apache HTTP
ServerMetric-Namespace: oracle_appmgmt
Ressourcengruppe: apache_http_server
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
3 |
Apache HTTP Server heruntergefahren Metrikname: Kritische MQL:
|
nicht zutreffend | nicht zutreffend | Kritischer Alarm für einen Apache HTTP Server in einem bestimmten Compartment, bei dem über einen Zeitraum von mehr als 3 Minuten gemeldet wird, dass der Status heruntergefahren oder nicht gemeldet wurde. |
5 |
Hohe CPU-Auslastung Metrikname: Warnung: MQL:
Kritische MQL:
|
>80 | >90 |
Warnungsalarm für jeden Apache HTTP Server in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für jeden Apache HTTP Server in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten. |
5 |
Hohe Speicherauslastung Metrikname: Warnung: MQL:
Kritische MQL:
|
>80 | >90 |
Warnungsalarm für jeden Apache HTTP Server in einem bestimmten Compartment mit einer Speicherauslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für jeden Apache HTTP Server in einem bestimmten Compartment mit einer Speicherauslastung von über 90% für die letzten 5 Minuten. |
5 |
Hohe Verarbeitungszeit von Webanforderungen Metrikname: Warnung: MQL:
Kritische MQL:
|
>1.500 | >3.000 |
Warnungsalarm für jeden Apache HTTP Server in einem bestimmten Compartment, der über 1500 ms berichtet, bedeutet die Verarbeitungszeit von Webanforderungen für die letzten 5 Minuten. Kritischer Alarm für jeden Apache HTTP Server in einem bestimmten Compartment, der über 3000 ms berichtet, bedeutet die Verarbeitungszeit von Webanforderungen für die letzten 5 Minuten. |
Oracle Unified Directory
Beispielalarmregel: Oracle Unified Directory (OUD)
-
Ressourcentyp: Oracle Unified Directory
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
oud_directory
,oud_proxy
,oud_gateway
Alarm | Warnung | Kritisch | Beschreibung |
---|---|---|---|
Monitoringstatus Metrikname: MQL: oud_base_status[1m].mean() != 1 || oud_base_status[1m].absent() |
nicht zutreffend | < 1 |
Verfügbarkeitsstatus des OUD-Servers. Ein kritischer Alert wird ausgelöst, wenn der Antwortwert kleiner als 1 ist. |
Status von Verbindungs-Handler Metrikname: MQL: ConnectionHandlerState[1m].mean() < 1 |
nicht zutreffend | <1 |
Status von Verbindungs-Handler Ein kritischer Alert wird ausgelöst, wenn der Verbindungs-Handler-Status kleiner als 1 ist.
|
Backend-Einträge Metrikname: BackendEntries Warnung: MQL: BackendEntries[5m].mean() > 30 Kritische MQL: BackendEntries[5m].mean() > 50 |
> 30 | >50 |
Backend-Einträge Ein Warnhinweis wird ausgelöst, wenn die Backend-Eintragszeit größer als 30 ist. Ein kritischer Alert wird ausgelöst, wenn die Backend-Einträge größer als 50 sind. |
Aufenthaltszeit von allen Vorgängen des Verbindungs-Handlers Metrikname: ConnectionHandlerAllResidentTime Warnung: MQL: ConnectionHandlerAllResidentTime[5m].mean() > 300 Kritische MQL: ConnectionHandlerAllResidentTime[5m].mean() > 500 |
> 300 | > 500 |
Aufenthaltszeit aller Verbindungs-Handler Ein Warnhinweis wird ausgelöst, wenn der Connection Handler "All Resident Time" größer als 60 ist. Ein kritischer Alert wird ausgelöst, wenn der Connection Handler "All Resident Time" größer als 90 ist.
|
Verbindungen von Verbindungs-Handler Metrikname: Warnung: MQL: ConnectionHandlerConnections[5m].mean() > 30 Kritische MQL: ConnectionHandlerConnections[5m].mean() > 50 |
> 30 | >50 |
Verbindungen von Verbindungs-Handler Ein Warnungsalert wird ausgelöst, wenn die Connection Handler-Verbindungen größer als 30 sind. Ein kritischer Alert wird ausgelöst, wenn die Connection Handler-Verbindungen größer als 50 sind.
|
Belegter JVM-Arbeitsspeicher Metrikname: Warnung: MQL: JVMUsedMemory[5m].mean() > 1.5 Kritische MQL: JVMUsedMemory[5m].mean() > 3 |
> 1,5 | > 3 |
Belegter JVM-Speicher Ein Warnhinweis wird ausgelöst, wenn der belegte JVM-Speicher größer als 1,5 MB ist. Ein kritischer Alert wird ausgelöst, wenn der belegte JVM-Speicher größer als 3 MB ist.
|
Belegter BS-Arbeitsspeicher Metrikname: Warnung: MQL: OSUsedMemory[5m].mean() > 1.5 Kritische MQL: OSUsedMemory[5m].mean() > 3 |
> 1,5 | > 3 |
Belegter Betriebssystemspeicher Ein Warnhinweis wird ausgelöst, wenn der belegte BS-Speicher größer als 1,5 MB ist. Ein kritischer Alert wird ausgelöst, wenn der belegte BS-Speicher größer als 3 MB ist.
|
Replikationsdomainstatus Metrikname: MQL: ReplicationDomainState[5m].mean() < 1 |
nicht zutreffend | < 1 |
Replikationsdomainstatus Ein kritischer Alert wird ausgelöst, wenn der Status der Replikationsdomain kleiner als 1 ist.
|
Gesamtaufenthaltszeit von WFE-Vorgängen Metrikname: Warnung: MQL: WFEResidentTimeOperationsTotalTime[5m].mean() > 60 Kritische MQL: WFEResidentTimeOperationsTotalTime[5m].mean() > 90 |
> 60 | > 90 |
Gesamtzeit der WFE-Vorgänge Eine Warnmeldung wird ausgelöst, wenn die Gesamtzeit für WFE-Resident Time Operations größer als 60 ist. Ein kritischer Alert wird ausgelöst, wenn die Gesamtzeit für WFE-Resident Time Operations größer als 90 ist.
|
Aktuelles Backlog in Arbeitsqueue Metrikname: Warnung: MQL: WorkQueueCurrentBacklog[5m].mean() > 15 Kritische MQL: WorkQueueCurrentBacklog[5m].mean() > 30 |
> 15 | > 30 |
Aktuelles Backlog in Arbeitsqueue Wenn der aktuelle Rückstand in der Arbeitswarteschlange größer als 15 ist, wird eine Warnmeldung ausgelöst. Ein kritischer Alert wird ausgelöst, wenn der aktuelle Rückstand in der Arbeitswarteschlange größer als 30 ist.
|
LDAP-Erweiterung - Verbindungen Metrikname: Warnung: MQL: ExtensionLDAPConnections[5m].mean() > 30 Kritische MQL: ExtensionLDAPConnections[5m].mean() > 50 |
> 30 | > 50 |
LDAP-Erweiterung - Verbindungen Wenn die LDAP-Erweiterungsverbindungen größer als 30 sind, wird ein Warnungsalert ausgelöst. Ein kritischer Alert wird ausgelöst, wenn die LDAP-Erweiterungsverbindungen größer als 50 sind.
|
LDAP-Erweiterung - Gesamtantwortzeit für Vorgänge Metrikname: Warnung: MQL: ExtensionLDAPOperationsTotalResponseTime[5m].mean() > 60 Kritische MQL: ExtensionLDAPOperationsTotalResponseTime[5m].mean() > 90 |
> 60 | > 90 |
LDAP-Erweiterung - Gesamtantwortzeit für Vorgänge Eine Warnmeldung wird ausgelöst, wenn die Gesamtantwortzeit der LDAP-Erweiterungsvorgänge größer als 60 ist. Ein kritischer Alert wird ausgelöst, wenn die Gesamtantwortzeit der Erweiterungs-LDAP-Vorgänge größer als 90 ist. |
Oracle GoldenGate
Beispielalarmregel: Goldengate
-
Ressourcentyp: Oracle Goldengate
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
oracle_goldengate
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Goldengate Down Metrikname: Kritische MQL: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für Goldengate in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat. |
Beispielalarmregel: Goldengate AdminServer
-
Ressourcentyp: Goldengate-Admin-Server
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
oracle_goldengate_admin_server
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Goldengate-Admin-Server heruntergefahren Metrikname: MQL: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für Goldengate AdminServer in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat. |
5 |
Hohe CPU-Auslastung Metrikname: Warnung: MQL: CpuTimeUtilizationPercentage[5m].mean() > 80 Kritische MQL: CpuTimeUtilizationPercentage[5m].mean() > 90 |
80 | 90 | Warnalarm für jeden Goldengate-Admin-Server in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für jeden Goldengate-Admin-Server in einem bestimmten Compartment, der über 90% CPU-Auslastung für die letzten 5 Minuten meldet. |
5 |
Private Memory Metrikname: Warnung: MQL: PrivateMemory[5m].mean() > 30 Kritische MQL: PrivateMemory[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 30 GB ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 40 GB ist. |
5 |
I/O-Leserate Metrikname: Warnung: MQL: IOReadRate[5m].mean() > 10 Kritische MQL: IOReadRate[5m].mean() > 20 |
10 | 20 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 20 MB/s ist. |
5 |
I/O-Schreibrate Metrikname: Warnung: MQL: IOWriteRate[5m].mean() > 10 Kritische MQL: IOWriteRate[5m].mean() > 20 |
10 | 20 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 20 MB/s ist. |
5 |
Rate verworfener Pakete Metrikname: Warnung: MQL: DroppedPacketRate[5m].mean() > 30 Kritische MQL: DroppedPacketRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Rate fehlender Pakete Metrikname: Warnung: MQL: MissingPacketRate[5m].mean() > 30 Kritische MQL: MissingPacketRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Paketfehlerrate Metrikname: Warnung: MQL: PacketErrorRate[5m].mean() > 30 Kritische MQL: PacketErrorRate[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Paketempfangsrate Metrikname: Warnung: MQL: PacketReceiveRate[5m].mean() > 30 Kritische MQL: PacketReceiveRate[5m].mean() > 40 |
30 | 40 |
Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
Beispielalarmregel: Goldengate-Verteilungsservice
-
Ressourcentyp: Goldengate-Verteilungsdienst
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
oracle_goldengate_distribution_server
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Goldengate-Verteilungsservice Metrikname: Kritische MQL: Überwachungsstatus [1m].mean() == 0 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für jeden Goldengate-Verteilungsservice in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat. |
5 |
Hohe CPU-Auslastung Metrikname: Warnung: MQL: CpuTimeUtilizationPercentage[5m].mean() > 80 Kritische MQL: CpuTimeUtilizationPercentage[5m].mean() > 90 |
80 | 90 | Warnungsalarm für jeden Goldengate-Verteilungsservice in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für jeden Goldengate-Verteilungsservice in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten. |
5 |
Private Memory Metrikname: Warnung: MQL: PrivateMemory[5m].mean() > 30 Kritische MQL: PrivateMemory[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 30 GB ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 40 GB ist. |
5 |
I/O-Leserate Metrikname: Warnung: MQL: IOReadRate[5m].mean() > 10 Kritische MQL: IOReadRate[5m].mean() > 20 |
10 | 20 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 20 MB/s ist. |
5 |
I/O-Schreibrate Metrikname: Warnung: MQL: IOWriteRate[5m].mean() > 10 Kritische MQL: IOWriteRate[5m].mean() > 20 |
10 | 20 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 20 MB/s ist. |
5 |
Rate verworfener Pakete Metrikname: Warnung: MQL: DroppedPacketRate[5m].mean() > 30 Kritische MQL: DroppedPacketRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Rate fehlender Pakete Metrikname: Warnung: MQL: MissingPacketRate[5m].mean() > 30 Kritische MQL: MissingPacketRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Paketfehlerrate Metrikname: Warnung: MQL: PacketErrorRate[5m].mean() > 30 Kritische MQL: PacketErrorRate[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Paketempfangsrate Metrikname: Warnung: MQL: PacketReceiveRate[5m].mean() > 30 Kritische MQL: PacketReceiveRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
Beispielalarmregel: Goldengate-Empfängerdienst
-
Ressourcentyp: Goldengate-Empfängerdienst
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
oracle_goldengate_receiver_server
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Goldengate-Empfangsservice Metrikname: Kritische MQL: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für jeden Goldengate-Empfängerservice in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat. |
5 |
Hohe CPU-Auslastung Metrikname: Warnung: MQL: CpuTimeUtilizationPercentage[5m].mean() > 80 Kritische MQL: CpuTimeUtilizationPercentage[5m].mean() > 90 |
80 | 90 | Warnalarm für jeden Goldengate-Empfängerservice in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für jeden Goldengate-Empfängerservice in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten. |
5 |
Private Memory Metrikname: Warnung: MQL: PrivateMemory[5m].mean() > 30 Kritische MQL: PrivateMemory[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 30 GB ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 40 GB ist. |
5 |
I/O-Leserate Metrikname: Warnung: MQL: IOReadRate[5m].mean() > 10 Kritische MQL: IOReadRate[5m].mean() > 20 |
10 | 20 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 20 MB/s ist. |
5 |
I/O-Schreibrate Metrikname: Warnung: MQL: IOWriteRate[5m].mean() > 10 Kritische MQL: IOWriteRate[5m].mean() > 20 |
10 | 20 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 20 MB/s ist. |
5 |
Rate verworfener Pakete Metrikname: Warnung: MQL: DroppedPacketRate[5m].mean() > 30 Kritische MQL: DroppedPacketRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Rate fehlender Pakete Metrikname: Warnung: MQL: MissingPacketRate[5m].mean() > 30 Kritische MQL: MissingPacketRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Paketfehlerrate Metrikname: Warnung: MQL: PacketErrorRate[5m].mean() > 30 Kritische MQL: PacketErrorRate[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Paketempfangsrate Metrikname: Warnung: MQL: PacketReceiveRate[5m].mean() > 30 Kritische MQL: PacketReceiveRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
Beispielalarmregel: Goldengate Service Manager
-
Ressourcentyp: Goldengate-Servicemanager
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
oracle_goldengate_service_manager
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Service-Manager von Goldengate Metrikname: StatusCritical MQL: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für einen Goldengate-Servicemanager in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat. |
Beispielalarmregel: Goldengate-Leistungsmetrikservice
-
Ressourcentyp: Goldengate-Leistungsmetrikservice
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
oracle_goldengate_pm_server
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Goldengate-Leistungskennzahlenservice Metrikname: Kritische MQL: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für jeden Goldengate-Performancemetrikservice in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat. |
5 |
Hohe CPU-Auslastung Metrikname: Warnung: MQL: CpuTimeUtilizationPercentage[5m].mean() > 80 Kritische MQL: CpuTimeUtilizationPercentage[5m].mean() > 90 |
80 | 90 | Warnungsalarm für jeden Goldengate Performance Metric Service in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für jeden Goldengate Performance Metric Service in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten. |
5 |
Private Memory Metrikname: Warnung: MQL: PrivateMemory[5m].mean() > 30 Kritische MQL: PrivateMemory[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 30 GB ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 40 GB ist. |
5 |
I/O-Leserate Metrikname: Warnung: MQL: IOReadRate[5m].mean() > 10 Kritische MQL: IOReadRate[5m].mean() > 20 |
10 | 20 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 20 MB/s ist. |
5 |
I/O-Schreibrate Metrikname: Warnung: MQL: IOWriteRate[5m].mean() > 10 Kritische MQL: IOWriteRate[5m].mean() > 20 |
10 | 20 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 20 MB/s ist. |
Beispielalarmregel: Goldengate-Extrakt
-
Ressourcentyp: Goldengate-Extrakt
-
Ressourcentyp:
goldengate_extract
-
Ressourcengruppe:
oracle_goldengate_extract
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Goldengate-Extrakt Metrikname: Kritische MQL: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für einen Goldengate-Extrakt in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat. |
5 |
Hohe CPU-Auslastung Metrikname: Warnung: MQL: CpuTimeUtilizationPercentage[5m].mean() > 80 Kritische MQL: CpuTimeUtilizationPercentage[5m].mean() > 90 |
80 | 90 | Warnalarm für jeden Goldengate-Extrakt in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für jeden Goldengate-Extrakt in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten. |
5 |
Private Memory Metrikname: Warnung: MQL: PrivateMemory[5m].mean() > 30 Kritische MQL: PrivateMemory[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 30 GB ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 40 GB ist. |
5 |
I/O-Leserate Metrikname: Warnung: MQL: IOReadRate[5m].mean() > 10 Kritische MQL: IOReadRate[5m].mean() > 20 |
10 | 20 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 20 MB/s ist. |
5 |
I/O-Schreibrate Metrikname: Warnung: MQL: IOWriteRate[5m].mean() > 10 Kritische MQL: IOWriteRate[5m].mean() > 20 |
10 | 20 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 20 MB/s ist. |
5 |
Rate verworfener Pakete Metrikname: Warnung: MQL: DroppedPacketRate[5m].mean() > 30 Kritische MQL: DroppedPacketRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Rate fehlender Pakete Metrikname: Warnung: MQL: MissingPacketRate[5m].mean() > 30 Kritische MQL: MissingPacketRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Paketfehlerrate Metrikname: Warnung: MQL: PacketErrorRate[5m].mean() > 30 Kritische MQL: PacketErrorRate[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Paketempfangsrate Metrikname: Warnung: MQL: PacketReceiveRate[5m].mean() > 30 Kritische MQL: PacketReceiveRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Rate zugeordneter DELETE-Anweisungen Metrikname: Warnung: MQL: MappedDeleteRate[5m].mean() > 30 Kritische MQL: MappedDeleteRate[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der zugeordneten Löschrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Löschrate in den letzten 5 Minuten größer als 40 MB/s ist. |
5 |
Rate zugeordneter INSERT-Anweisungen Metrikname: Warnung: MQL: MappedInsertRate[5m].mean() > 30 Kritische MQL: MappedInsertRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der zugeordneten Einfügerate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Einfügerate in den letzten 5 Minuten größer als 40 MB/s ist. |
5 |
Rate zugeordneter TRUNCATE-Anweisungen Metrikname: Warnung: MQL: MappedTruncateRate[5m].mean() > 30 Kritische MQL: MappedTruncateRate[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der zugeordneten Abschneiderate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Abschneiderate in den letzten 5 Minuten größer als 40 MB/s ist. |
5 |
Rate zugeordneter UPDATE-Anweisungen Metrikname: Warnung: MQL: MappedUpdateRate[5m].mean() > 30 Kritische MQL: MappedUpdateRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der zugeordneten Aktualisierungsrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Aktualisierungsrate in den letzten 5 Minuten größer als 40 MB/s ist. |
5 |
Verwerfungsrate Metrikname: Warnung: MQL: DiscardRate[5m].mean() > 30 Kritische MQL: DiscardRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der Verwerfungsrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Verwerfungsrate in den letzten 5 Minuten größer als 40 MB/s ist. |
5 |
Rate ignorieren Metrikname: Warnung: MQL: IgnoreRate[5m].mean() > 30 Kritische MQL: IgnoreRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die Ignorierrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die Ignorierrate in den letzten 5 Minuten größer als 40 MB/s ist. |
5 |
Lag Metrikname: Warnung: MQL: Lag[5m].mean() > 10 Kritische MQL: Lag[5m].mean() > 20 |
10 | 20 | Eine Warnmeldung wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 10 Sekunden ist. Ein kritischer Alert wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 20 Sekunden ist. |
5 |
Vorgangsrate Metrikname: Warnung: MQL: OperationsPerSec[5m].mean() > 30 Kritische MQL: OperationsPerSec[5m].mean() > 40 |
20 | 30 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der Operationsrate in den letzten 5 Minuten größer als 20 Ops/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Operationsrate in den letzten 5 Minuten größer als 30 Ops/s ist. |
Beispielalarmregel: Goldengate Replicat
-
Ressourcentyp: Goldengate Replicat
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
oracle_goldengate_replicat
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Goldengate-Replikat Metrikname: Kritische MQL: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für ein Goldengate-Replicat in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat. |
5 |
Hohe CPU-Auslastung Metrikname: Warnung: MQL: CpuTimeUtilizationPercentage[5m].mean() > 80 Kritische MQL: CpuTimeUtilizationPercentage[5m].mean() > 90 |
80 | 90 | Warnungsalarm für jedes Goldengate-Replicat in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für jedes Goldengate-Replicat in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten. |
5 |
Private Memory Metrikname: Warnung: MQL: PrivateMemory[5m].mean() > 30 Kritische MQL: PrivateMemory[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 30 GB ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 40 GB ist. |
5 |
I/O-Leserate Metrikname: Warnung: MQL: IOReadRate[5m].mean() > 10 Kritische MQL: IOReadRate[5m].mean() > 20 |
10 | 20 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 20 MB/s ist. |
5 |
I/O-Schreibrate Metrikname: Warnung: MQL: IOWriteRate[5m].mean() > 10 Kritische MQL: IOWriteRate[5m].mean() > 20 |
10 | 20 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 20 MB/s ist. |
5 |
Rate verworfener Pakete Metrikname: Warnung: MQL: DroppedPacketRate[5m].mean() > 30 Kritische MQL: DroppedPacketRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Rate fehlender Pakete Metrikname: Warnung: MQL: MissingPacketRate[5m].mean() > 30 Kritische MQL: MissingPacketRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Paketfehlerrate Metrikname: PacketErrorRate Warnung: MQL: PacketErrorRate[5m].mean() > 30 Kritische MQL: PacketErrorRate[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Paketempfangsrate Metrikname: Warnung: MQL: PacketReceiveRate[5m].mean() > 30 Kritische MQL: PacketReceiveRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 40 Msgs/min ist. |
5 |
Rate zugeordneter DELETE-Anweisungen Metrikname: Warnung: MQL: MappedDeleteRate[5m].mean() > 30 Kritische MQL: MappedDeleteRate[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der zugeordneten Löschrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Löschrate in den letzten 5 Minuten größer als 40 MB/s ist. |
5 |
Rate zugeordneter INSERT-Anweisungen Metrikname: Warnung: MQL: MappedInsertRate[5m].mean() > 30 Kritische MQL: MappedInsertRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der zugeordneten Einfügerate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Einfügerate in den letzten 5 Minuten größer als 40 MB/s ist. |
5 |
Rate zugeordneter TRUNCATE-Anweisungen Metrikname: Warnung: MQL: MappedTruncateRate[5m].mean() > 30 Kritische MQL: MappedTruncateRate[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der zugeordneten Abschneiderate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Abschneiderate in den letzten 5 Minuten größer als 40 MB/s ist. |
5 |
Rate zugeordneter UPDATE-Anweisungen Metrikname: Warnung MQL: MappedUpdateRate[5m].mean() > 30 Kritische MQL: MappedUpdateRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der zugeordneten Aktualisierungsrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Aktualisierungsrate in den letzten 5 Minuten größer als 40 MB/s ist. |
5 |
Verwerfungsrate Metrikname: Warnung MQL: DiscardRate[5m].mean() > 30 Kritische MQL: DiscardRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der Verwerfungsrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Verwerfungsrate in den letzten 5 Minuten größer als 40 MB/s ist. |
5 |
Rate ignorieren Metrikname: Warnung MQL: IgnoreRate[5m].mean() > 30 Kritische MQL: IgnoreRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die Ignorierrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die Ignorierrate in den letzten 5 Minuten größer als 40 MB/s ist. |
5 |
Lag Metrikname: Warnung MQL: Lag[5m].mean() > 30 Kritische MQL: Lag[5m].mean() > 40 |
10 | 20 | Eine Warnmeldung wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 10 Sekunden ist. Ein kritischer Alert wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 20 Sekunden ist. |
5 |
Vorgangsrate Metrikname: Warnung MQL: OperationsPerSec[5m].mean() > 30 Kritische MQL: OperationsPerSec[5m].mean() > 40 |
20 | 30 | Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der Operationsrate in den letzten 5 Minuten größer als 20 Ops/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Operationsrate in den letzten 5 Minuten größer als 30 Ops/s ist. |
Beispielalarmregel: Goldengate-Verteilungspfad
-
Ressourcentyp: Goldengate-Verteilungspfad
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
oracle_goldengate_distribution_path
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Goldengate-Verteilungspfad Metrikname: Kritische MQL: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für jeden Goldengate-Verteilungspfad in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat. |
5 |
Lag Metrikname: Warnung MQL: Lag[5m].mean() > 30 Kritische MQL: Lag[5m].mean() > 40 |
10 | 20 | Eine Warnmeldung wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 10 Sekunden ist. Ein kritischer Alert wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 20 Sekunden ist. |
5 |
Netzwerksenderate Metrikname: Warnung MQL: NetworkSentRate[5m].mean() > 30 Kritische MQL: NetworkSentRate[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der Netzwerk-Sendrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Netzwerk-Sendrate in den letzten 5 Minuten größer als 40 MB/s ist. |
5 |
Netzwerkempfangsrate Metrikname: Warnung MQL: NetworkReceiveRate[5m].mean() > 30 Kritische MQL: NetworkReceiveRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der vom Netzwerk gesendete Empfangsmittelwert in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Netzwerkempfangsrate in den letzten 5 Minuten größer als 40 MB/s ist. |
Beispielalarmregel: Goldengate-Empfängerpfad
-
Ressourcentyp: Goldengate-Empfängerpfad
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
oracle_goldengate_receiver_path
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Goldengate-Empfangspfad Metrikname: Kritische MQL: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für jeden Goldengate-Empfängerpfad in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat. |
5 |
Lag Metrikname: Warnung MQL: Lag[5m].mean() > 30 Kritische MQL: Lag[5m].mean() > 40 |
10 | 20 | Eine Warnmeldung wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 10 Sekunden ist. Ein kritischer Alert wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 20 Sekunden ist. |
5 |
Netzwerksenderate Metrikname: Warnung MQL: NetworkSentRate[5m].mean() > 30 Kritische MQL: NetworkSentRate[5m].mean() > 40 |
30 | 40 | Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der Netzwerk-Sendrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Netzwerk-Sendrate in den letzten 5 Minuten größer als 40 MB/s ist. |
5 |
Netzwerkempfangsrate Metrikname: Warnung MQL: NetworkReceiveRate[5m].mean() > 30 Kritische MQL: NetworkReceiveRate[5m].mean() > 40 |
30 | 40 | Eine Warnmeldung wird ausgelöst, wenn der vom Netzwerk gesendete Empfangsmittelwert in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Netzwerkempfangsrate in den letzten 5 Minuten größer als 40 MB/s ist. |
Prozessbasierte Beispielalarmregeln für benutzerdefinierte Ressourcen
-
Ressourcentyp: Benutzerdefinierte Ressource
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
custom_resource
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Benutzerdefinierte Ressource heruntergefahren Metrikname: Kritische MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für eine benutzerdefinierte Ressource in einem bestimmten Compartment, die über 1 Minute lang den Status "Heruntergefahren" oder "Nicht gemeldet" aufweist. |
5 |
Hohe CPU-Auslastung Metrikname: Warnung MQL: CpuUtilization[1m].mean() > 80 Kritische MQL: CpuUtilization[1m].mean() > 90 |
>80 | >90 |
Warnalarm für jede benutzerdefinierte Ressource in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% über 5 Minuten. Kritischer Alarm für jede benutzerdefinierte Ressource in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% über 5 Minuten. |
15 |
Hohe Speicherauslastung Metrikname: Warnung MQL: MemoryUtilization[1m].mean() > 80 Kritische MQL: MemoryUtilization[1m].mean() > 90 |
>80 | >90 |
Warnalarm für jede benutzerdefinierte Ressource in einem bestimmten Compartment mit einer Speicherauslastung von über 80% über 15 Minuten. Kritischer Alarm für jede benutzerdefinierte Ressource in einem bestimmten Compartment mit einer Speicherauslastung von über 90% über 15 Minuten. |
Oracle Service Bus (OSB)
-
Ressourcentyp: Oracle Service Bus
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
oracle_servicebus
Beurteilungszeitraum (Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
Monitoringstatus Metrikname: Kritische MQL: MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm für jeden Service Bus in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat. |
5 |
Service Bus-Fehler Metrikname: Kritische MQL: ServiceBusErrors[1m].mean() > 0 |
nicht zutreffend | >0 | Kritischer Alarm für jeden Service Bus in einem bestimmten Compartment, der über 5 Minuten lang meldet, wenn Fehler in einem der OSB-Services aufgetreten sind. |
Microsoft-IIS
-
Ressourcenart: IIS
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
microsoft_iis
Auswertungszeitraum | Alarmtule | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
IIS heruntergefahren Metrikname: Kritische MQL:
|
nicht zutreffend | nicht zutreffend | Kritischer Alarm, der keine Verbindung zu IIS mehr herstellen kann |
5 |
ASP.Net Neustart des Worker-Prozesses Metrikname: Kritische MQL: ASPDotNetWorkerProcessRestarts[1m].mean() > 1 |
>1 | nicht zutreffend | Kritischer Alarm, um zu wissen, ob Worker-Prozessneustarts aufgetreten sind. Dies kann durch eine Reihe von Dingen verursacht werden und Probleme verursachen, einschließlich Performanceauswirkungen und Informationsverlust. |
5 |
ASP.Net Anforderungen in Queue Metrikname: Warnung MQL: ASPDotNetRequests.Type.Queued[1m].mean() > 5 Kritische MQL: ASPDotNetRequests.Type.Queued[1m].mean() > 10 |
>5 | >10 | Schwellenwert für kritische/Warnung, um uns mitzuteilen, ob eingehende HTTP-Anforderungen aufgrund des Ladevorgangs in eine Queue gestellt werden. |
5 |
ASP.Net-Fehlerrate Metrikname: Warnung MQL: ErrorRate[1m].mean() > 1%* Kritische MQL: ErrorRate[1m].mean() > 2%* |
> 1%* | > 2%* | Kritischer/Warnungsschwellenwert, um den Benutzer darüber zu informieren, dass die Fehlerrate einer ASP.Net-Anwendung einen bestimmten Schwellenwert überschreitet. Diese Metrik gibt Fehler pro Sekunde zurück. Daher muss der Schwellenwert basierend auf den durchschnittlichen Gesamtanforderungen festgelegt werden, die sie erhalten. Beispiel: Wenn sie normalerweise 100 Anforderungen/s erhalten, empfehlen wir 1 Fehler für eine Warnung und 2 für einen kritischen Fehler. |
-
Ressourcentyp: IIS-Website
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
microsoft_iis
Beurteilungszeitraum (in Minuten) | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
1 |
IIS-Website heruntergefahren Metrikname: Kritische MQL: MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent() |
nicht zutreffend | nicht zutreffend | Kritischer Alarm, der keine Verbindung mehr zur IIS-Website herstellen kann |
5 |
WWW - Aktuelle Verbindungen Metrikname: Warnung MQL: CurrentConnections.Service.WWW[1m].mean() > 90%* Kritische MQL: CurrentConnections.Service.WWW[1m].mean() > 95%* |
> 90%* | > 95%* | Kritischer/Warnungsschwellenwert, um den Benutzer darauf hinzuweisen, dass die Anzahl der Verbindungen nahe am Maximum liegt. Hinweis: Der Kunde muss die Zahl auf 90 / 95% seiner maximalen Verbindungen setzen. Die Metrik ist eine Zahl. Daher ist dieser eingerichtete Alert für jeden Kunden eindeutig. Beispiel: Wenn für den Benutzer insgesamt 200 Verbindungen zulässig sind, empfehlen wir 180 für Warnungen und 190 für kritische Verbindungen. |
NGINX
-
Ressourcentyp: NGINX
-
Metrik-Namespace:
oracle_appmgmt
-
Ressourcengruppe:
nginx
Beurteilungszeitraum | Alarmregel | Warnung | Kritisch | Beschreibung |
---|---|---|---|---|
3 |
Nginx heruntergefahren Anzeigename: MQL:
|
nicht zutreffend | 0 |
Alarm, weil keine Verbindung zum NGINX-API-Endpunkt hergestellt werden kann. |
5 |
Rate der beantworteten Prozesse Metrikname: Warnung MQL: RespawnedProcessesRate[5m].mean() > 1 Kritische MQL:
|
>1 | >2 |
Die Anzahl der Prozesse, die während des Intervalls neu gestartet wurden. |
5 |
HTTP-Upstreams-Health Checks bewerten fehlerhaft Metrikname: Dimensionsname: Dimensionswert: Warnung MQL:
|
>1 | nicht zutreffend |
Von NGINX erkannter fehlerhafter Status, der sich negativ auf Performance oder Verfügbarkeit auswirken könnte. |
5 |
Stream-Upstreams-Health Checks bewerten fehlerhaften Status >1 fehlerhaften Status durch NGINX-Performance oder -Verfügbarkeit erkannt Metrikname:
Dimensionsname: Dimensionswert: Warnung MQL:
|
>1 | nicht zutreffend |
Von NGINX erkannter fehlerhafter Status, der sich negativ auf Performance oder Verfügbarkeit auswirken könnte |
Metrikerweiterungen
Sie können Alarmregeln erstellen, um Alarme auszulösen, wenn Metrikwerte aus den Metrikerweiterungen Schwellenwerte überschreiten. Verwenden Sie denselben allgemeinen Workflow, den Sie befolgen würden, um eine Alarmregel für integrierte Metriken für Ihre Ressourcen zu erstellen. Der Hauptunterschied liegt im Abschnitt "Metrikbeschreibung".
- Compartment: Wählen Sie das Compartment der Ressource aus, in der die Metrikerweiterung aktiviert wurde
- Metrik-Namespace: wählen Sie
oracle_metric_extensions_appmgmt
aus - Ressourcengruppe: Der Ressourcentyp der Ressource, auf der die Metrikerweiterung bereitgestellt wurde.
Das Erstellen einer Alarmregel für eine Metrikerweiterung eines Hosts wird in der folgenden Abbildung gezeigt:
