Alarme einrichten

Mit dem Oracle Cloud Infrastructure Monitoring-Service können Sie Alarme generieren, wenn Metriken Schwellenwerte überschreiten.

Machen Sie sich zunächst mit den Konzepten und Features des Monitoring-Service vertraut, indem Sie den Überblick über Monitoring lesen. Weitere Informationen zum Einrichten von Alarmen finden Sie unter Alarme verwalten. In der Monitoring Query Language-(MQL-)Referenz wird beschrieben, wie Sie erweiterte Abfragen für Monitoring und Alarme erstellen.

Stellen Sie außerdem sicher, dass Sie die entsprechenden Policys für die Verwendung von Alarmregeln festgelegt haben. Weitere Informationen finden Sie unter Erste Schritte.

Bevor Sie fortfahren, sollten Sie ein Alarmziel erstellt haben, z.B. einen Benachrichtigungsservice sowie Themen, die definieren, wer diese Alarme erhält.

In der folgenden Tabelle sind Metrikdetails aufgeführt, die Sie zum Erstellen von Alarmregeln für Metriken benötigen, die in Stackmonitoring verwendet werden.

Resource Type Metrik-Namespace Ressourcengruppe für Alarmregel Alarmregeln Metrikreferenz
Host
  • GPU
oracle_appmgmt host
Nicht-Container-, Container- und integrierbare Oracle-Datenbanken oracle_oci_database N/V Oracle Database Oracle Database
Oracle Database-System, ASM, Cluster und Listener oracle_oci_database_cluster oracle_asm, oracle_cluster, oracle_db_node, oracle_lsnr Oracle Database Oracle Database-Cluster

Oracle WebLogic Domain

Oracle WebLogic Cluster

oracle_appmgmt

weblogic_cluster

Oracle Weblogic-Server WebLogic-Metriken
Oracle WebLogic Server oracle_appmgmt weblogic_j2eeserver Oracle Weblogic-Server WebLogic-Metriken
Oracle HTTP Server (OHS) oracle_appmgmt oracle_http_server Oracle HTTP Server (OHS) Oracle HTTP Server-(OHS-)Metriken
Oracle Identity Manager (OIM) oracle_appmgmt oracle_oim / oracle_oim_cluster Oracle Identity Manager (OIM) Oracle Identity Manager (OIM)
Oracle Access Manager (OAM) oracle_appmgmt oracle_oam / oracle_oam_cluster Oracle Access Manager (OAM) Oracle Access Manager (OAM)
Oracle JVM Runtime oracle_appmgmt oracle_jvm Oracle JVM Oracle JVM-Metriken
Oracle E-Business Suite oracle_appmgmt ebs_instance Oracle E-Business Suite E-Business Suite-Kennzahlen
EBS-Anwendungs-Listener oracle_appmgmt oracle_ebs_app_lsnr Oracle E-Business Suite E-Business Suite-Kennzahlen
EBS - Nebenläufige Verarbeitung oracle_appmgmt oracle_ebs_conc_mgmt_service Gleichzeitige Verarbeitung E-Business Suite-Kennzahlen
EBS-Hintergrundverarbeitung - Spezialisiert oracle_appmgmt oracle_ebs_conc_mgmt_service_specialized Nebenläufige Verarbeitung E-Business Suite-Kennzahlen
Knoten für EBS-Hintergrundverarbeitung oracle_appmgmt oracle_ebs_cp_node Oracle E-Business Suite E-Business Suite-Kennzahlen
EBS - Formularsystem oracle_appmgmt oracle_ebs_forms_system Oracle E-Business Suite E-Business Suite-Kennzahlen
EBS - Workflow-Agent-Listener oracle_appmgmt oracle_ebs_wf_agent_lsnr Oracle E-Business Suite E-Business Suite-Kennzahlen
EBS - Workflow - Hintergrund-Engine oracle_appmgmt oracle_ebs_wf_bkgd_engine Oracle E-Business Suite E-Business Suite-Kennzahlen
EBS-Workflowgruppe oracle_appmgmt oracle_ebs_wf_group Oracle E-Business Suite E-Business Suite-Metriken
EBS-Workflowbenachrichtigungs-Mailer oracle_appmgmt oracle_ebs_wf_notification_mailer Mailer für Workflowbenachrichtigung E-Business Suite-Metriken
Apache Tomcat oracle_appmgmt apache_tomcat Apache Tomcat Apache Tomcat-Metriken
Microsoft SQL Server oracle_appmgmt sql_server Microsoft SQL Server Microsoft SQL Server-Metriken
PeopleSoft Anwendungsserverdomain oracle_appmgmt oracle_psft_appserv PeopleSoft PeopleSoft-Metriken
Domain für PeopleSoft Process Scheduler oracle_appmgmt oracle_psft_prcs PeopleSoft PeopleSoft-Metriken
PeopleSoft (PIA) oracle_appmgmt oracle_psft_pia PeopleSoft PeopleSoft-Metriken
PeopleSoft Suchmaschine

(OpenSearch / Elasticsearch)

oracle_appmgmt elastic_search, open_search PeopleSoft PeopleSoft-Metriken
PeopleSoft Prozessüberwachung oracle_appmgmt oracle_psft_prcm PeopleSoft PeopleSoft-Metriken
Apache HTTP Server oracle_appmgmt apache_http_server Apache HTTP Server Apache HTTP Server-Metriken
OUD Directory-Server oracle_appmgmt oud_directory Oracle Unified Directory Oracle Unified Directory - Metriken
OUD- Proxy-Server oracle_appmgmt oud_proxy Oracle Unified Directory Oracle Unified Directory - Metriken
OUD-Replication Gateway oracle_appmgmt oud_gateway Oracle Unified Directory Oracle Unified Directory - Metriken
GoldenGate oracle_appmgmt oracle_goldengate Oracle GoldenGate Oracle GoldenGate-Metriken
GoldenGate ServiceManager oracle_appmgmt oracle_goldengate_service_manager Oracle GoldenGate Oracle GoldenGate-Metriken
GoldenGate AdminServer oracle_appmgmt oracle_goldengate_admin_server Oracle GoldenGate Oracle GoldenGate-Metriken
GoldenGate-Performancemetrikserver oracle_appmgmt oracle_goldengate_pm_server Oracle GoldenGate Oracle GoldenGate-Metriken
GoldenGate Extract oracle_appmgmt oracle_goldengate_extract Oracle GoldenGate Oracle GoldenGate-Metriken
GoldenGate Replicat oracle_appmgmt oracle_goldengate_replicat Oracle GoldenGate Oracle GoldenGate-Metriken
GoldenGate DistributionServer oracle_appmgmt oracle_goldengate_distribution_server Oracle GoldenGate Oracle GoldenGate-Metriken
GoldenGate Verteilungspfad oracle_appmgmt oracle_goldengate_distribution_path Oracle GoldenGate Oracle GoldenGate-Metriken

GoldenGate Empfängerserver

oracle_appmgmt oracle_goldengate_receiver_server Oracle GoldenGate Oracle GoldenGate-Metriken
GoldenGate Empfangspfad oracle_appmgmt oracle_goldengate_receiver_path Oracle GoldenGate Oracle GoldenGate-Metriken
Benutzerdefinierte Ressource oracle_appmgmt custom_resource Prozessbasierte Beispielalarmregeln für benutzerdefinierte Ressourcen Prozessbasierte benutzerdefinierte Ressourcenmetriken
Oracle Service Bus oracle_appmgmt oracle_servicebus Oracle Service Bus (OSB) Oracle Service Bus (OSB)
Microsoft-IIS oracle_appmgmt microsoft_iis Microsoft-IIS Microsoft IIS-Metriken
Microsoft IIS-Website oracle_appmgmt microsoft_iis_website Microsoft-IIS Microsoft IIS-Metriken
NGINX oracle_appmgmt nginx NGINX NGINX-Metriken

Best Practices für gängige Alarmszenarien

  1. Erstellen Sie die Alarmregeln in demselben Compartment, in dem Sie Ihre Ressourcen erkannt haben.
  2. Um eine Alarmregel einzurichten, die einen Alarm generiert, wenn eine Ressource heruntergefahren ist, geben Sie den entsprechenden Metrik-Namespace und die entsprechende Ressourcengruppe an, und verwenden Sie die folgende Metrik und Triggerregel:

    Metrikname: MonitoringStatus

    Triggerregel:

    • Operator: equal to

    • Wert: 0

    • Triggerverzögerung in Minuten: 1

  3. Um eine Alarmregel einzurichten, die für einzelne Ressourceninstanzen ausgelöst werden soll, müssen Sie zusätzlich zur Auswahl der Metrik auch Metrikdimensionen hinzufügen, um die Ressource eindeutig zu identifizieren.

    So identifizieren Sie eine Ressourceninstanz eindeutig:

    1. Sie können resourceName und resourceType ODER verwenden.
    2. Sie können resourceId verwenden.

      Die meisten Metriken definieren zusätzliche Dimensionen, mit denen erweiterte Alarme festgelegt werden können.

  4. Verweisen Sie immer auf die Metrikbeschreibung in der Metrikreferenz, und prüfen Sie den Auswertungszeitraum (wie oft jede Metrik erfasst wird). Stellen Sie beim Einrichten von Alarmen sicher, dass Sie denselben Wert wie der Alarmwert Intervall angeben. Dies kann über In den erweiterten Modus wechseln in der oberen rechten Ecke der Alarmerstellungsseite erfolgen. Sie können erweiterte MQL im Abschnitt Abfragecodeeditor der Seite "Erweiterter Modus" angeben.

Hosts

Beispielalarmregel: Hostüberwachung

  • Ressourcentyp: Host
  • Metrik-Namespace: oracle_appmgmt
  • Ressourcengruppe: host
Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
4

Host heruntergefahren

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[4m].mean() != 1 || MonitoringStatus[4m].absent()
n/v n/v Kritischer Alarm für jeden Host in einem bestimmten Compartment, der über einen Zeitraum von mehr als 1 Minuten als heruntergefahren oder nicht gemeldet wird.
4

Hohe CPU-Auslastung

Metrikname: CpuUtilization

Warnung: MQL:

CpuUtilization[4m]{type="Total"}.mean() > 80

Kritische MQL:

CpuUtilization[4m]{type="Total"}.mean() > 90
> 80 > 90 Warnungsalarm für jeden Host in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 3 Minuten.

Kritischer Alarm für jeden Host in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 3 Minuten.

4

Hohe Speicherauslastung

Metrikname: MemoryUtilization

Warnung: MQL:

MemoryUtilization[4m]{type="Logical"}.mean() > 80

Kritische MQL:

MemoryUtilization[4m]{type="Logical"}.mean() > 90
> 80 > 90 Warnungsalarm für jeden Host in einem bestimmten Compartment, der eine Speicherauslastung von über 80% für die letzten 3 Minuten meldet.

Warnungsalarm für jeden Host in einem bestimmten Compartment, der eine Speicherauslastung von über 90% für die letzten 3 Minuten meldet.

4

Dateisystemauslastung

Metrikname: FilesystemUtilization

Warnung: MQL:

FilesystemUtilization[4m].mean() > 80

Kritische MQL:

FilesystemUtilization[4m].mean() > 90
> 80 > 90 Warnalarm für jedes Dateisystem auf einem Host in einem bestimmten Compartment, das über 80% Speicherauslastung meldet.

Kritischer Alarm für jedes Dateisystem auf einem Host in einem bestimmten Compartment, der über 90% Speicherauslastung meldet.

Hinweis

Um ausgewählte Dateisysteme zu überwachen, können Sie die Dimension fileSystemName weiter angeben und Ihre Alarme an Ihre spezifischen Anforderungen anpassen. Beispiel: Die folgende MQL FilesystemUtilization[1m]{fileSystemName = "/", osType = "Linux"}.mean() > 80 gilt nur für Root-Dateisysteme auf Linux-Hosts in einem bestimmten Compartment.

GPU

Beispielalarmregel: GPU

1

GPU-Temperatur

Metrikname: GPUTemperature

Warnung: MQL:

GPUTemperature[4m]{Type="GPU"}.mean() > 98

Kritische MQL:

GPUTemperature[4m]{Type="GPU"}.mean() > 101
> 98 > 101

Warnung, wenn eine GPU die Verlangsamungstemperatur überschreitet.

Kritischer Alarm, wenn eine GPU die Abschalttemperatur überschreitet.

Die Temperaturen für Verlangsamung und Herunterfahren können je nach GPU-Modell variieren. Die richtigen Werte für eine erkannte GPU können auf der Stack Monitoring GPU-Homepage geprüft werden.

  1. Homepage einer einzelnen GPU aufrufen
  2. Wählen Sie die Menüoption "Konfiguration"
  3. Suchen Sie im Abschnitt "Ressourcenspezifische Eigenschaften" nach den Einträgen temperatureSlowdown und temperatureShutdown.

Oracle Database

Um das Risiko von Fehlalarmen zu minimieren, schließen Sie optional collectionName="sensor" ein.

Beispiel:

MonitoringStatus[4m]{collectionName="sensor"}.groupBy(resourceName).last() < 1 || MonitoringStatus[4m] collectionName="sensor"}.groupBy(resourceName).absent()

Beispielalarmregel: Nicht-Containerdatenbank

  • Ressourcentyp: Nicht-Container-DB

  • Metrik-Namespace: oracle_oci_database

  • Ressourcengruppe: n/v

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Verwendeter empfohlener DBM-Wert? Beschreibung
30

Speicherplatzauslastung

Metrikname: StorageUtilizationByTablespace

Dimension: tablespaceContents = PERMANENT

Oder

Warnung: MQL:

StorageUtilizationByTablespace[30m]{tablespaceContents ="PERMANENT"}.mean()> 75

Kritische MQL:

StorageUtilizationByTablespace[30m]{tablespaceContents ="PERMANENT"}.mean() > 85
>75 >85 Y Warnungs- und kritische Alarmregelbedingungen für permanente Tablespaces, deren Auslastung in den letzten 30 Minuten mehr als 75% oder 85% beträgt.
24 Stunden InvalidObjects >150 >200 N/V  
15 BlockingSessions >1 >10 Y Warnungs- und kritische Alarmregelbedingungen, um einen Alarm auszulösen, wenn die Anzahl der blockierenden Sessions in den letzten 15 Minuten mehr als 1 oder 10 beträgt.
15 UsableFRA < 20 <10 N/V Bedingungen für Warnungs- und kritische Alarmregeln zum Auslösen eines Alarms, wenn der Prozentsatz des nutzbaren Fast Recovery-Bereichs in den letzten 15 Minuten weniger als 20% oder 10% beträgt.
5 ProcessLimitUtilization >70 >80 Y Warnungs- und kritische Alarmregelbedingungen, um einen Alarm auszulösen, wenn die Prozessauslastung (%) in den letzten 5 Minuten mehr als 70% oder 80% beträgt.
5 SessionLimitUtilization >90 >97 N/V  
5 CPUUtilization >80 >85 Y  
5 FRAUtilization >70 >75 Y  
5 StorageUtilization >75 >85 Y  
5

Monitoringstatus

Metrikname:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
N/V nicht zutreffend   Kritischer Alarm für alle Nicht-Container-Oracle Database-Berichte, die den Status über 1min heruntergefahren haben oder nicht melden.

Beispielalarmregel: Containerdatenbank

  • Ressourcentyp: Container-DB

  • Metrik-Namespace: oracle_oci_database

  • Ressourcengruppe: n/v

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Verwendeter empfohlener DBM-Wert? Beschreibung
1

Monitoringstatus

Metrikname:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend nicht zutreffend Kritischer Alarm für alle Nicht-Container-Oracle Database-Berichte, die den Status über 1min heruntergefahren haben oder nicht melden.
30

Metrik: StorageUtilizationByTablespace

Dimension: tablespaceContents = PERMANENT

Oder

Warnung: MQL:

StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 75

Kritische MQL:

StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 85

>75 >85 Y Warnungs- und kritische Alarmregelbedingungen für permanente Tablespaces, deren Auslastung in den letzten 30 Minuten mehr als 85% oder 90% beträgt.
5 ProcessLimitUtilization >70 >80 Y Warnungs- und kritische Alarmregelbedingungen, um einen Alarm auszulösen, wenn die Prozessauslastung (%) in den letzten 5 Minuten mehr als 90% oder 95% beträgt.
5 SessionLimitUtilization >90 >97 nicht zutreffend  
15 UsableFRA < 20 <10 nicht zutreffend Bedingungen für Warnungs- und kritische Alarmregeln zum Auslösen eines Alarms, wenn der Prozentsatz des nutzbaren Fast Recovery-Bereichs in den letzten 15 Minuten weniger als 20% oder 10% beträgt.
5 CPUUtilization >80 >85 Y  
5 FRAUtilization >70 >75 Y  
5 StorageUtilization >75 >85 Y  

Beispielalarmregel: Integrierbare Datenbank

  • Ressourcentyp: Integrierbare DB

  • Metrik-Namespace: oracle_oci_database

  • Ressourcengruppe: n/v

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Verwendeter empfohlener DBM-Wert? Beschreibung
1

Monitoringstatus

Metrikname:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend nicht zutreffend Kritischer Alarm für alle Nicht-Container-Oracle Database-Berichte, die länger als 1 Minute ausfallen oder den Status nicht melden.
5 CPUUtilization >80 >85 Y  
5 StorageUtilization >75 >85 Y  
15 BlockingSessions >1 >10 Y Bedingungen für Warnungs- und kritische Alarmregeln, um einen Alarm auszulösen, wenn die Anzahl der blockierenden Sessions in den letzten 15 Minuten größer als 1 oder 5 ist.
24 Stunden InvalidObjects >150 >200 nicht zutreffend  
30

Metrik: StorageUtilizationByTablespace

Dimension: tablespaceContents = PERMANENT

Oder

Warnung: MQL:

StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 75

Kritische MQL:

StorageUtilizationByTablespace[1m]{tablespaceContents = "PERMANENT"}.mean() > 85

>75 >85 Y Warnungs- und kritische Alarmregelbedingungen für permanente Tablespaces, deren Auslastung in den letzten 30 Minuten mehr als 85% oder 90% beträgt.

Beispielalarmregel: ASM/ASM-Instanz

  • Ressourcentyp: ASM

  • Metrik-Namespace: oracle_oci_database_cluster

  • Ressourcengruppe: oracle_asm

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Monitoringstatus

Metrikname:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für alle Nicht-Container-Oracle Database-Berichte, die länger als 1 Minute ausfallen oder den Status nicht melden.
30 DiskGroupUtilization >85 >95  
30 DiskUtilization >85 >95  
Beispielalarmregel: ASM-Cluster
  • Ressourcentyp: Cluster

  • Metrik-Namespace: oracle_oci_database_cluster

  • Ressourcengruppe: oracle_cluster

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Monitoringstatus

Metrikname:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für alle Nicht-Container-Oracle Database-Berichte, die länger als 1 Minute ausfallen oder den Status nicht melden.

Beispielalarmregel: Listener

  • Ressourcentyp: Listener

  • Metrik-Namespace: oracle_oci_database_cluster

  • Ressourcengruppe: oracle_lsnr

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Monitoringstatus

Metrikname:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für alle Nicht-Container-Oracle Database-Berichte, die länger als 1 Minute ausfallen oder den Status nicht melden.
5 RefusedConnections >1 >5  

E-Business Suite

Beispielalarmregel: EBS

  • Ressourcenart: Oracle E-Business Suite
  • Metrik-Namespace: oracle_appmgmt
  • Ressourcengruppe: ebs_instance
Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
15

Ausgeführte Programme nach Ausführungszeit (ms)

Metrikname: ExecutedProgramsByRunningTime

MQL:

ExecutedProgramsByRunningTime[15m].mean() > 4000

Tip1:

Sie können den Alarm in eine bestimmte Anwendung filtern, indem Sie den Dimensionsfilter ProgramName oder ProgramShortName hinzufügen.

> 4.000 > 40.000 Die Laufzeit der Anforderungen
15

Abgeschlossene Anforderungen nach Anwendung (Verhältnis)

Metrikname: CompletedRequestsByApplication

Dimensionsname: Category

Dimensionswert: Error

MQL:

CompletedRequestsByApplication[15m]{Category = "Error"}.mean() > 0.001

Tip1:

Sie können den Alarm in eine bestimmte Anwendung filtern, indem Sie den Dimensionsfilter ApplicationName oder A hinzufügen.

MQL:

CompletedRequestsByApplication[15m]{Category = "Error", ApplicationName = "<YOUR APP NAME>"}.mean() > 0.001
> 0,001 > 0,003

Das Verhältnis der Anforderungen, die mit Fehlern abgeschlossen wurden, zu allen Anforderungen im angegebenen Erfassungsintervall.

Das bedeutet, wenn mehr als 0,1% angefordert fehlgeschlagen sind, erhalten Sie eine Warnung. Für mehr als 0,25% erhalten Sie eine kritische

15

Aktive Benutzersessions

Metrikname: ActiveUserSessions

MQL:

ActiveUserSessions[15m].mean() > 200
> 200 > 250 Die Anzahl der aktiven Benutzersessions

Beispielalarmregel: EBS-Anwendungs-Listener

Ressourcentyp: EBS-Anwendungs-Listener

Metrik-Namespace: oracle_appmgmt

Ressourcengruppe: oracle_ebs_app_lsnr

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Monitoringstatus

Metrikname:MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
nicht zutreffend 0 Kritischer Alarm für EBS-Anwendungs-Listener in einem bestimmten Compartment, bei dem über einen Zeitraum von mehr als 1 Minute gemeldet wird, dass der Status heruntergefahren ist oder nicht.

Beispielalarmregel: EBS-Hintergrundverarbeitung

Ressourcenart: EBS - Hintergrundverarbeitung

Metrik-Namespace: oracle_appmgmt

Ressourcengruppe: oracle_ebs_conc_mgmt_service

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Monitoringstatus

Metrikname: MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
nicht zutreffend 0 Der Verfügbarkeitsstatus.
15

Fehlerrate bei gleichzeitigen Anforderungen

Metrikname: CompletedConcurrentRequests

Dimensionsname: State

Dimensionswert: Errored

MQL:

CompletedConcurrentRequests[15m]{State = "Errored"}.mean() > 0.001
> 0,001 > 0,003 Die Rate der Anforderungen, die auf Stundenbasis mit Fehlern abgeschlossen wurden. Wird der Wert mit 100 multipliziert, wird er zu einem Prozentsatz.
15

Nebenläufige Anforderungen - Warnrate

Metrikname: CompletedConcurrentRequests

Dimensionsname: State

Dimensionswert: WithWarning

MQL:

CompletedConcurrentRequests[15m]{State = "WithWarning"}.mean() > 0.15
> 0,002 > 0,003 Die Rate der Anforderungen, die auf Stundenbasis mit Warnung abgeschlossen wurden. Wird der Wert mit 100 multipliziert, wird er zu einem Prozentsatz.
15

Hintergrundprozesse erfolgreich abgeschlossen (OPS/Evaluierungszeitraum)

Metrikname: CompletedConcurrentRequests

Dimensionsname: State

Dimensionswert: Erfolgreich

Essentiell

MQL:

CompletedConcurrentRequests[15m]{State = "Successful"}.sum() > 2500
> 625 > 2.500 Die Rate der Anforderungen, die in einem Bewertungszeitraum erfolgreich abgeschlossen wurden (standardmäßig 15 Minuten).
15

Gleichzeitige Anforderungen werden ausgeführt

Metrikname: ConcurrentRequestsByStatus

Dimensionsname: State

Dimensionswert: Runn

Gramm

MQL:

ConcurrentRequestsByStatus[15m]{State = "Running"}.mean() > 100
> 2.500 > 10.000 Die Anzahl der ausgeführten Anforderungen nach Benutzer.
15

Ausstehende nebenläufige Anforderungen - Normal

Metrikname: ConcurrentRequestsByStatus

Dimensionsname: State

Dimensionswert: PendingNormal

MQL:

ConcurrentRequestsByStatus[15m]{State = "PendingNormal"}.mean() > 100
> 2.500 > 10.000 Die Anzahl der ausstehenden Anforderungen nach Benutzer.
15

Ausstehende nebenläufige Anforderungen - Standby

Metrikname: ConcurrentRequestsByStatus

Dimensionsname: State

Dimensionswert: PendingStandBy

MQL:

ConcurrentRequestsByStatus[15m]{State = "PendingStandBy"}.mean() > 100
> 100 > 500 Die Anzahl von Anforderungen mit dem Status "Standby ausstehend".
15

Inaktive Hintergrundprozesse - Kein Manager

Metrikname: ConcurrentRequestsByStatus

Dimensionsname: State

Dimensionswert: InactiveNoManager

MQL:

ConcurrentRequestsByStatus[15m]{State = "InactiveNoManager"}.mean() > 100
> 100 > 500 Die Anzahl der Anforderungen mit dem Status "Inaktiv, kein Manager".
15

Inaktive Hintergrundprozesse - Gesperrt

Metrikname: ConcurrentRequestsByStatus

Dimensionsname: State

Dimensionswert: InactiveOnHold

MQL:

ConcurrentRequestsByStatus[15m]{State = "InactiveOnHold"}.mean() > 100
> 100 > 500 Die Anzahl der Anforderungen mit dem Status "Inaktiv gesperrt".
5

Langfristige Hintergrundprozesse

Metrikname: LongActiveConcurrentRequests

MQL:

LongActiveConcurrentRequests[5m].mean() > 43200000

Tip1:

Sie können den Alarm in eine Running- oder Pending-Anforderung filtern, indem Sie den Dimensionsfilter Phase hinzufügen.

MQL:

LongActiveConcurrentRequests[5m]{Phase = "Running"}.mean() > 43200000

Tip2:

Sie können nach einem bestimmten Programm weiter filtern, indem Sie den Dimensionsfilter ProgramName oder ProgramShortName hinzufügen.

MQL:

LongActiveConcurrentRequests[1m]{Phase = "Running", ProgramShortName = "<PROGRAM SHORT NAME>"}.mean() > 43200000
> 43.200.000 > 86.400.000 Die abgelaufene Zeit in ms für eine ausstehende oder laufende Anforderung. Nur die Top 10 Anforderungen werden verfolgt. In diesem Fall empfehlen wir, Warnung nach 12 Stunden und Kritisch nach 24 Stunden zu erhalten.

EBS-Hintergrundverarbeitung - Spezialisiert

Ressourcenart: EBS Hintergrundverarbeitung - Spezialisiert

Metrik-Namespace: oracle_appmgmt

Ressourcengruppe: oracle_ebs_conc_mgmt_service_specialized

Metrik Metrikanzeigename Maßeinheit Beschreibung Collection-Häufigkeit Dimension Ressourcenname
MonitoringStatus Verfügbarkeit Status

Status der Ressource. Werte:

1 = Oben

0 = Heruntergefahren

Nur wenn ALLE anderen Manager hochgefahren sind, ist der Status hochgefahren. Wenn nur ein Manager heruntergefahren ist, ist der Gesamtstatus heruntergefahren.

1 Minuten nicht zutreffend oracle_ebs_conc_mgmt_service_specialized
ConcurrentProcesingComponentStatus Concurrent Manager-Status Status Verfügbarkeit des Hintergrundmanagers 1 Minuten Nebenläufige Queue - Name, Beschreibung, Hostname oracle_ebs_conc_mgmt_service_specialized
CapacityUtilizationOfConcurrentManagers Kapazitätsauslastung von Concurrent Manager Prozentsatz Prozentsatz der maximal ausgeführten Prozesse. Wenn die maximalen Prozesse des Managers 10 und 5 ausgeführt werden, beträgt die Kapazitätsauslastung 50% 1 Minuten Name von Manager oracle_ebs_conc_mgmt_service_specialized
ManagerMaxProcesses Max. Prozesse von Concurrent Manager Anzahl Maximale Anzahl Prozesse, die sich in der Warteschlange des Managers befinden. 1 Minuten Name von Manager oracle_ebs_conc_mgmt_service_specialized
ManagerRunningProcesses Aktive Prozesse von Concurrent Manager Anzahl Anzahl der laufenden Prozesse in der Managerqueue 1 Minuten Name von Manager oracle_ebs_conc_mgmt_service_specialized

Beispielalertregel: EBS-Workflowbenachrichtigungs-Mailer

Ressourcentyp: EBS-Workflowbenachrichtigungs-Mailer

Metrik-Namespace: oracle_appmgmt

Ressourcengruppe: oracle_ebs_wf_notification_mailer

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Monitoringstatus

Metrikname: MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
nicht zutreffend 0 Kritischer Alarm für nebenläufige EBS-Verarbeitung, der in einem bestimmten Compartment darauf spezialisiert ist, dass der Status für über 1min heruntergefahren oder nicht gemeldet wird.
1

Kapazitätsauslastung von Concurrent Manager

Metrikname: CapacityUtilizationOfConcurrentManagers

MQL:

CapacityUtilizationOfConcurrentManagers[1m].mean() < 100
< 50 < 100 Prozentsatz der Kapazitätsauslastung aller aktivierten Manager.

Apache Tomcat

Beispielalarmregel: Apache Tomcat

Ressourcentyp: Apache Tomcat

Metrik-Namespace: oracle_appmgmt

Ressourcengruppe: apache_tomcat

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
3

Apache Tomcat heruntergefahren

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für Apache Tomcat in einem bestimmten Compartment, bei dem über einen Zeitraum von mehr als 3 Minuten gemeldet wird, dass der Status heruntergefahren oder nicht gemeldet wurde.
5

Hohe CPU-Auslastung

Metrikname: CPUUtilization

Warnung: MQL:

CPUUtilization[5m].mean() > 80

Kritische MQL:

CPUUtilization[5m].mean() > 90
>80 >90

Warnungsalarm für Apache Tomcat in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten.

Kritischer Alarm für Apache Tomcat in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten.

5

Hohe JVM-Heap-Speicherauslastung

Metrikname: JVMMemoryUtilization

Warnung: MQL:

JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 80

Kritische MQL:

JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 90
>80 >90

Warnungsalarm für jeden Apache Tomcat in einem bestimmten Compartment mit einer Speicherauslastung von über 80% JVM-Heap für die letzten 5 Minuten.

Warnungsalarm für Apache Tomcat in einem bestimmten Compartment mit einer Speicherauslastung von über 90% JVM-Heap für die letzten 5 Minuten.

5

Hohe Verarbeitungszeit von Webanforderungen

Metrikname: WebRequestProcessingTime

Warnung: MQL:

WebRequestProcessingTime[5m].mean() > 1000

Kritische MQL:

WebRequestProcessingTime[5m].mean() > 1500
>1.500 >3.000

Warnungsalarm für jeden Apache Tomcat in einem bestimmten Compartment, der über 1500 ms berichtet, bedeutet die Verarbeitungszeit von Webanforderungen für die letzten 5 Minuten.

Warnungsalarm für jeden Apache Tomcat in einem bestimmten Compartment, der über 3000 ms berichtet, bedeutet die Verarbeitungszeit von Webanforderungen für die letzten 5 Minuten.

Microsoft SQL Server

Beispielalarmregeln: Microsoft SQL Server

Ressourcentyp: Microsoft SQL Server

Metrik-Namespace: oracle_appmgmt

Ressourcengruppe: sql_server

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
3

SQL Server-Verfügbarkeitsstatus

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für einen SQL-Server in einem bestimmten Compartment, der über einen Zeitraum von mehr als 3 Minuten als heruntergefahren oder nicht gemeldet wird.
10

SQL Server-CPU-Auslastung (%)

Metrikname: CPUUtilization

Warnung: MQL:

CpuUtilization[10m].mean() > 80

Kritische MQL:

CpuUtilization[10m].mean() > 95
>80 >95 Warnungsalarm für jeden SQL-Server in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 10 Minuten.

Kritischer Alarm für jeden SQL-Server in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 10 Minuten.

15

SQL Server-Datenbankauslastung

Metrikname: StorageDatabaseUtilization

Warnung: MQL:

StorageDatabaseUtilization[15m].mean() > 80

Kritische MQL:

StorageDatabaseUtilization[15m].mean() > 95
>80 >95 Warnungsalarm für jeden SQL-Server in einem bestimmten Compartment, der über 80% der Datenbankauslastung für die letzten 15 Minuten berichtet.

Kritischer Alarm für jeden SQL-Server in einem bestimmten Compartment, der über 90% der Datenbankauslastung für die letzten 15 Minuten berichtet.

PeopleSoft

PeopleSoft Anwendungsserver

  • Ressourcentyp: PeopleSoft Application Server-Domain
  • Metrik-Namespace: oracle_appmgmt
  • Ressourcengruppe: oracle_psft_appserv
Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
5

Zustand

Metrikname: Health

Warnung: MQL:

Health[1m]{HealthState = "Warning"}.mean() = 1

Kritische MQL:

Health[1m]{HealthState = "Critical"}.mean() = 1
1 1

Gesamtzustand der Application Server-Domain.

Ein Warnalarm wird ausgelöst, wenn der Status "Warnung" gleich 1 ist.

Ein kritischer Alarm wird ausgelöst, wenn der Status "kritisch" gleich 1 ist.

5

Belastung

Metrikname: Load

Warnung: MQL:

Load[1m]{LoadState = "Medium"}.mean() = 1

Kritischer MQL

Load[1m]{LoadState = "Heavy"}.mean() = 1
1 1

Gesamtlast der Application Server-Domain.

Ein Warnalarm wird ausgelöst, wenn der Status "mittel" gleich 1 ist.

Ein kritischer Alarm wird ausgelöst, wenn der Zustand "schwer" gleich 1 ist.

5

Durchschnittliche Ausführungszeit für Serviceanfragen

Metrikname: AverageServiceRequestExecutionTime

Warnung: MQL:

AverageServiceRequestExecutionTime[5m].mean()> 1000
> 1.000 nicht zutreffend

Durchschnittliche Zeit in Millisekunden für die Ausführung einer Serviceanfrage.

Warnalarm wird ausgelöst, wenn eine Anforderung im Durchschnitt mehr als eine Sekunde (1000 ms) benötigt.

5

Prozesse in der Queue für Anwendungsserver

Metrikname: QueuedTuxedoProcesses

Dimensionsname: Category

Dimensionswert: ApplicationServer

Kritische MQL:

QueuedTuxedoProcesses[5m]{Category = "ApplicationServer"}.mean() > 1
nicht zutreffend > 1 Anzahl der Prozesse, die sich derzeit in der Queue für den Application Server befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus.
5

In Queue gestellte Prozesse für BRK-Handler

Metrikname: QueuedTuxedoProcesses

Dimensionsname: Category

Dimensionswert: BRKHandler

Kritische MQL:

QueuedTuxedoProcesses[5m]{Category = "BRKHandler"}.mean() > 1
nicht zutreffend > 1 Anzahl der Prozesse, die sich derzeit in der Queue für den BRK-Handler befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus.
5

In Queue gestellte Prozesse für BRK Dispatcher

Metrikname: QueuedTuxedoProcesses

Dimensionsname: Category

Dimensionswert: BRKDispatcher

Kritische MQL:

QueuedTuxedoProcesses[5m]{Category = "BRKDispatcher"}.mean() > 1
nicht zutreffend > 1 Anzahl der Prozesse, die sich derzeit in der Queue für den BRK-Dispatcher befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus.
5

In Queue gestellte Prozesse für PUB Dispatcher

Metrikname: QueuedTuxedoProcesses

Dimensionsname: Category

Dimensionswert: PUBDispatcher

MQL:

QueuedTuxedoProcesses[5m]{Category = "PUBDispatcher"}.mean() > 1
nicht zutreffend > 1 Anzahl der Prozesse, die sich derzeit in der Warteschlange für den PUB-Dispatcher befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus.
5

In Queue gestellte Prozesse für PUB-Handler

Metrikname: QueuedTuxedoProcesses

Dimensionsname: Category

Dimensionswert: PUBHandler

Kritische MQL:

QueuedTuxedoProcesses[5m]{Category = "PUBHandler"}.mean() > 1
nicht zutreffend > 1 Anzahl der Prozesse, die sich derzeit in der Queue für den PUB-Handler befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus.
5

In Queue gestellte Prozesse für SUB Dispatcher

Metrikname: QueuedTuxedoProcesses

Dimensionsname: Category

Dimensionswert: SUBDispatcher

Kritische MQL:

QueuedTuxedoProcesses[5m]{Category = "SUBDispatcher"}.mean() > 1
nicht zutreffend > 1 Anzahl der Prozesse, die sich derzeit in der Warteschlange für den SUB-Dispatcher befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus.
5

Prozesse in Queue für SUB-Handler

Metrikname: QueuedTuxedoProcesses

Dimensionsname: Category

Dimensionswert: SUBHandler

Kritische MQL:

QueuedTuxedoProcesses[5m]{Category = "SUBHandler"}.mean() > 1
nicht zutreffend > 1 Anzahl der Prozesse, die sich derzeit in der Queue für den SUB-Handler befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus.
5

Nicht erfolgreiche Serverprozesse

Metrikname: FailedServerProcesses

Kritische MQL:

FailedServerProcesses[5m].mean() > 0
nicht zutreffend > 0 Anzahl der Serverprozesse, die in der Domain nicht erfolgreich waren oder heruntergefahren sind. Wenn ein Serverprozess ausfällt, wird ein kritischer Alarm ausgelöst.
15

Statusdateien

Metrikname: PeopleToolsStateFiles

Warnung: MQL:

PeopleToolsStateFiles[15m].mean() > 0
> 0 nicht zutreffend Anzahl der im Domainlogverzeichnis generierten PeopleTools-Statusdateien. Wenn eine Statusdatei generiert wird, wird ein Warnalarm ausgelöst.

PeopleSoft Process Scheduler

  • Ressourcentyp: Domain des PeopleSoft Process Scheduler
  • Metrik-Namespace: oracle_appmgmt
  • Ressourcengruppe: oracle_psft_prcs
Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
5

Zustand

Metrikname: Health

Warnung: MQL:

Health[1m]{HealthState = "Warning"}.mean() = 1

Kritische MQL:

Health[1m]{HealthState = "Critical"}.mean() = 1
1 1

Gesamtzustand der Prozess-Scheduler-Domain.

Ein Warnalarm wird ausgelöst, wenn der Status "Warnung" gleich 1 ist.

Ein kritischer Alarm wird ausgelöst, wenn der Status "kritisch" gleich 1 ist.

5

Laden

Metrikname: Load

Warnung: MQL:

Load[1m]{LoadState = "Medium"}.mean() = 1

Kritische MQL:

Load[1m]{LoadState = "Heavy"}.mean() = 1
1 1

Gesamtlast der Prozess-Scheduler-Domain.

Ein Warnalarm wird ausgelöst, wenn der Status "mittel" gleich 1 ist.

Ein kritischer Alarm wird ausgelöst, wenn der Zustand "schwer" gleich 1 ist.

5

In Queue gestellte Prozesse für PSPRCSRV

Metrikname: QueuedTuxedoProcesses

Dimensionsname: ProcessType

Dimensionswert: PSPRCSRV

Kritische MQL:

QueuedTuxedoProcesses[5m]{ProcessType = "PSPRCSRV"}.mean() > 1
nicht zutreffend > 1 Anzahl der Prozesse, die sich derzeit in der Queue für den Process Scheduler (PSPRCSRV) befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus.
5

In Queue gestellte Prozesse für PSDSTSRV

Metrikname: QueuedTuxedoProcesses

Dimensionsname: ProcessType

Dimensionswert: PSDSTSRV

Kritische MQL:

QueuedTuxedoProcesses[5m]{ProcessType = "PSDSTSRV"}.mean() > 1
nicht zutreffend > 1 Anzahl der Prozesse, die sich derzeit in der Warteschlange für den Distributionsserver (PSDSTSRV) befinden. Mehr als 1 Prozess in der Warteschlange löst einen kritischen Alarm aus.
5

Nicht erfolgreiche Prozesse

Metrikname: FailedProcesses

Kritische MQL:

FailedProcesses[5m].mean() > 1
nicht zutreffend > 0 Anzahl der Serverprozesse, die in der Domain nicht erfolgreich waren oder heruntergefahren sind. Wenn ein Serverprozess ausfällt, wird ein kritischer Alarm ausgelöst.

PeopleSoft (PIA)

  • Ressourcentyp: PeopleSoft PIA
  • Metrik-Namespace: oracle_appmgmt
  • Ressourcengruppe: oracle_psft_pia
Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
5

Zustand

Metrikname: Health

Warnung: MQL:

Health[1m]{HealthState = "Warning"}.mean() = 1

Kritische MQL:

Health[1m]{HealthState = "Critical"}.mean() = 1
1 1

Gesamtzustand der PIA.

Ein Warnalarm wird ausgelöst, wenn der Status "Warnung" gleich 1 ist.

Ein kritischer Alarm wird ausgelöst, wenn der Status "kritisch" gleich 1 ist.

5

Belastung

Metrikname: Load

Warnung: MQL:

Load[1m]{LoadState = "Medium"}.mean() = 1

Kritische MQL:

Load[1m]{LoadState = "Heavy"}.mean() = 1
1 1

Gesamtlast der PIA.

Ein Warnalarm wird ausgelöst, wenn der Status "mittel" gleich 1 ist.

Ein kritischer Alarm wird ausgelöst, wenn der Zustand "schwer" gleich 1 ist.

5

Sockets im Wait-Status

Metrikname: WaitStateSockets

Warnung: MQL:

WaitStateSockets[5m].mean() > 100
> 100 nicht zutreffend Anzahl Webserver-Sockets, die sich im WAIT-Status befinden. Wenn sich mehr als 100 Webserver-Sockets im WAIT-Status befinden, wird ein Warnalarm ausgelöst.
5

Schwerwiegende Fehler

Metrikname: FatalErrors

Warnung: MQL:

FatalErrors[5m].mean() > 0
> 0 nicht zutreffend Anzahl schwerwiegender Fehler in den JOLTService-Servletlogs. Wenn im Servlet JOLTService ein Fehler auftritt, wird ein Warnalarm ausgelöst.

PeopleSoft Suchmaschine

  • Ressourcentyp: PeopleSoft Elasticsearch, PeopleSoft OpenSearch
  • Metrik-Namespace: oracle_appmgmt
  • Ressourcengruppe: elastic_search, open_search
Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Cluster Zustand

Metrikname: ClusterHealth

MQL:

ClusterHealth[1m]{Status = "Red"}.mean() = 1ClusterHealth[1m]{Status = "Yellow"}.mean() = 1
1 1

Gesamtzustand des Suchmaschinenclusters.

Eine Warnmeldung wird ausgelöst, wenn der Status "gelb" 1 ist.

Ein kritischer Alert wird ausgelöst, wenn der Status 'rot' gleich 1 ist.

10

Speichernutzung

Metrikname: MemoryUsage

MQL:

MemoryUsage[10m].mean()
> 80 > 90

Maximal konfigurierter Heap des Suchmaschinenknotens.

Eine Warnmeldung wird ausgelöst, wenn die Speicherauslastung größer als 80% ist.

Ein kritischer Alert wird ausgelöst, wenn die Speicherauslastung größer als 90% ist.

PeopleSoft Prozessüberwachung

  • Ressourcentyp: PeopleSoft Process Monitor
  • Metrik-Namespace: oracle_appmgmt
  • Ressourcengruppe: oracle_psft_prcm
Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
5

Aktiver Verteilungsstatus

Metrikname: ActiveDistributionState

MQL:

ActiveDistributionState[5m]{State = "NotPosted"}.mean() > 1
nicht zutreffend > 1

Ein kritischer Alert wird ausgelöst, wenn zu viele Verteilungsprozesse den Status "Nicht veröffentlicht" aufweisen.

5

Run-Status

Metrikname: ActiveRunState

MQL:

ActiveRunState[5m]{State = "NoSuccess"}.mean() > 1
nicht zutreffend > 1

Ein kritischer Alert wird ausgelöst, wenn zu viele ausgeführte Prozesse keinen Erfolgsstatus aufweisen.

5

Run-Status

Metrikname: RunStatus

MQL:

RunStatus[5m]{Status = "Error"}.mean() > 0
nicht zutreffend > 0

Ein kritischer Alert wird ausgelöst, wenn zu viele Prozesse im Ausführungsfehlerstatus sind.

Oracle Weblogic-Server

Beispielalarmregel: Oracle Weblogic-Server

  • Ressourcentyp: OracleWeblogic-Server
  • Metrik-Namespace: oracle_appmgmt
  • Ressourcengruppe: weblogic_j2eeserver
Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
3

WebLogic Server heruntergefahren

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()

nicht zutreffend nicht zutreffend Kritischer Alarm für WebLogic Server in einem bestimmten Compartment, bei dem über einen Zeitraum von mehr als 3 Minuten gemeldet wird, dass der Status heruntergefahren oder nicht gemeldet wurde.
5

Hohe CPU-Auslastung

Metrikname: CpuUtilization

Warnung: MQL:

CpuUtilization[5m].mean() > 80

Kritische MQL:

CpuUtilization[5m].mean() > 90

> 80 > 90

Warnungsalarm für WebLogic Server in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten.

Kritischer Alarm für WebLogic Server in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten.

5

Hohe Heap-Auslastung

Metrikname: JVMMemroyUtilization

Warnung: MQL:

JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 80

Kritische MQL:

JVMMemoryUtilization[5m]{Type = "Heap"}.mean() > 90
> 80 > 90

Warnungsalarm für WebLogic Server in einem bestimmten Compartment mit einer Heap-Auslastung von über 80% für die letzten 5 Minuten.

Kritischer Alarm für WebLogic Server in einem bestimmten Compartment mit einer Heap-Auslastung von über 90% für die letzten 5 Minuten.

5

Hängende Work Manager-Threads

Metrikname: WorkManagerStuckThreads

Warnung:

WorkManagerStuckThreads[5m].mean() > 10

Kritisch

WorkManagerStuckThreads[5m].mean() > 15
> 10 > 15

Warnungsalarm für WebLogic Server in einem bestimmten Compartment, der mehr als 10 hängende Work Manager-Threads für die letzten 5 Minuten meldet.

Kritischer Alarm für WebLogic Server in einem bestimmten Compartment, der mehr als 15 Work Manager-Threads für die letzten 5 Minuten protokolliert.

5

Wartende Verbindungsanforderungen

Metrikname:

ServerConnectionPoolConnections

Warnung: MQL:

ServerConnectionPoolConnections[5m].mean() > 1

Kritische MQL:

ServerConnectionPoolConnections[5m].mean() > 2

>1 >2  
5

Verarbeitungszeit von Webanforderungen

Metrikname: WebRequestProcessingTime

Warnung:

WebRequestProcessingTime[5m].mean() > 10000

Kritisch

WebRequestProcessingTime[5m].mean() > 15000
>10.000 >15.000  
5

Aktive Threadpoolthreads

Metrikname: ThreadPoolThreads

Warnung:

ThreadPoolThreads[5m]{Status = "Active"}.mean() > 1000

Kritisch

ThreadPoolThreads[5m]{Status = "Active"}.mean() > 1250
>1.000 >1.250  

Beispielalarmregel: Oracle Weblogic-Servercluster

  • Ressourcentyp: Oracle Weblogic-Servercluster

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: weblogic_cluster

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

WebLogic Cluster heruntergefahren

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für ein WebLogic-Cluster in einem bestimmten Compartment, bei dem über einen Zeitraum von mehr als 1 Minute gemeldet wird, dass der Status heruntergefahren ist oder nicht.

Beispielalarmregeln: Oracle HTTP Server (OHS)

  • Ressourcentyp: Oracle HTTP Server

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: oracle_http_server

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
3

Oracle HTTP Server heruntergefahren

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()

nicht zutreffend nicht zutreffend Kritischer Alarm für Oracle HTTP Server in einem bestimmten Compartment, bei dem über einen Zeitraum von mehr als 3 Minuten gemeldet wird, dass der Status heruntergefahren oder nicht gemeldet wurde.
5

Hohe CPU-Auslastung

Metrikname: CPUUtilization

Warnung: MQL:

CPUUtilization[5m].mean() > 80

Kritische MQL:

CPUUtilization[5m].mean() > 90
>80 >90

Warnalarm für jeden Oracle HTTP Server in einem bestimmten Compartment, der über 80% CPU-Auslastung für die letzten 5 Minuten meldet.

Kritischer Alarm für jeden Oracle HTTP Server in einem bestimmten Compartment, der über 90% CPU-Auslastung für die letzten 5 Minuten meldet.

5

Hohe Speicherauslastung

Metrikname: MemoryUtilization

Warnung: MQL:

MemoryUtilization[5m].mean() > 80

Kritische MQL:

MemoryUtilization[5m].mean() > 90

>80 >90

Warnalarm für jeden Oracle HTTP Server in einem bestimmten Compartment, der über 80% Speicherauslastung für die letzten 5 Minuten meldet.

Kritischer Alarm für jeden Oracle HTTP Server in einem bestimmten Compartment, der über 90% Speicherauslastung für die letzten 5 Minuten meldet.

5

Hohe Verarbeitungszeit von Webanforderungen

Metrikname: WebRequestProcessingTime

Warnung: MQL:

WebRequestProcessingTime[5m].mean() > 1500

Kritische MQL:

WebRequestProcessingTime[5m].mean() > 3000

>1.500 >3.000

Warnungsalarm für jeden Oracle HTTP Server in einem bestimmten Compartment, der über 1500 ms berichtet, bedeutet die Verarbeitungszeit von Webanforderungen für die letzten 5 Minuten.

Kritischer Alarm für jeden Oracle HTTP Server in einem bestimmten Compartment, der über 3000 ms berichtet, bedeutet die Verarbeitungszeit von Webanforderungen für die letzten 5 Minuten.

Oracle Identity Manager (OIM)

Beispielalarmregel: Oracle Identity Manager (OIM)

  • Ressourcentyp: Oracle Identity Manager/Oracle Identity Manager-Cluster

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: oracle_oim / oracle_oim_cluster

Beurteilungszeitraum (Minuten) Alarm Warnung Kritisch Beschreibung
1

Monitoringstatus

Metrikname: MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
nicht zutreffend < 1

Verfügbarkeitsstatus des OIM-Clusters/-Servers.

Ein kritischer Alert wird ausgelöst, wenn der Antwortwert nicht 1 ist.

15

Orchestrierung - Durchschnittliche Ausführungszeit

Metrikname: Orchestration-AverageExecutionTime

MQL:

Orchestration-AverageExecutionTime[15m].mean() > 300 Orchestration-AverageExecutionTime[15m].mean() > 500
> 300 > 500

Durchschnittliche Orchestrierungsausführung

Ein Warnungsalert wird ausgelöst, wenn die durchschnittliche Ausführungszeit der Orchestrierung größer als 300 ms ist

Ein kritischer Alert wird ausgelöst, wenn die durchschnittliche Ausführungszeit der Orchestrierung größer als 500 ms ist

Oracle Access Manager (OAM)

Beispielalarmregel: Oracle Access Manager (OAM)

  • Ressourcentyp: Oracle Access Manager/Oracle Access Manager-Cluster

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: oracle_oam / oracle_oam_cluster

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Monitoringstatus

Metrikname: MonitoringStatus

MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
nicht zutreffend < 1

Verfügbarkeitsstatus des OAM-Clusters/-Servers.

Ein kritischer Alert wird ausgelöst, wenn der Antwortwert nicht 1 ist.

5

Autorisierungslatenz

Metrikname: AuthorizationLatency

MQL:

authorizationLatency[5m].mean() > 300 authorizationLatency[5m].mean() > 500
> 500 > 800

Autorisierungslatenzzeit

Eine Warnmeldung wird ausgelöst, wenn die Autorisierungslatenz größer als 500 ms ist

Ein kritischer Alert wird ausgelöst, wenn die Autorisierungslatenz größer als 800 ms ist

Oracle JVM

Ressourcentyp: Oracle JVM Runtime

ServerMetric-Namespace: oracle_appmgmt

Ressourcengruppe: oracle_jvm

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Oracle JVM-Laufzeit heruntergefahren

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[1m].mean()!=1||MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm, da keine Verbindung mehr zu Oracle JVM Runtime hergestellt werden kann
5

Speicherpoolauslastung

Metrikname: MemoryPoolUtilization

Dimensionsname: Type

Dimensionswert: Used

Warnung: MQL:

MemoryPoolUtilization[5m]{Type="Used"}.mean()>80%

Kritische MQL:

MemoryPoolUtilization[5m]{Type=Used"}.mean()>90%
>80% >90% Prozentsatz des in Speicherpools belegten Speichers im Verhältnis zum maximal verfügbaren Speicher
5

Auslastung des belegten Heap-Speichers

Metrikname:

HeapMemoryUtilization

Dimensionsname: Type

Dimensionswert: Used

Warnung: MQL:

HeapMemoryUtilization[5m]{Type="Used"}.mean()>80%

Kritische MQL:

HeapMemoryUtilization[5m]{Type = "Used"}.mean() >90%
>80% >90% Der Prozentsatz des im Heap-Speicher belegten Speichers im Verhältnis zum maximal verfügbaren Speicher.
5

Belegte Auslastung des nicht belegten Heap-Speichers

Metrikname:

NonHeapMemoryUtilization

Dimensionsname: Type

Dimensionswert: Used

Warnung: MQL:

NonHeapMemoryUtilization[5m]{Type="Used"}.mean()>80%

Kritische MQL:

NonHeapMemoryUtilization[5m]{Type = "Used"}.mean() >90%
>80% >90% Der Prozentsatz des im Nicht-Heap-Speicher belegten Speichers im Verhältnis zum maximal verfügbaren Speicher.
5

CPU-Auslastung

Metrikname:

CPUUtilization

Warnung: MQL:

CPUUtilization[5m]. mean() > 80%

Kritische MQL:

CPUUtilization[5m]. mean() > 90%
>80% >90% Prozentsatz der vom JVM-Prozess verbrauchten CPU-Ressourcen

Apache HTTP Server

Ressourcentyp: Apache HTTP

ServerMetric-Namespace: oracle_appmgmt

Ressourcengruppe: apache_http_server

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
3

Apache HTTP Server heruntergefahren

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[3m].mean() != 1 || MonitoringStatus[3m].absent()

nicht zutreffend nicht zutreffend Kritischer Alarm für einen Apache HTTP Server in einem bestimmten Compartment, bei dem über einen Zeitraum von mehr als 3 Minuten gemeldet wird, dass der Status heruntergefahren oder nicht gemeldet wurde.
5

Hohe CPU-Auslastung

Metrikname: CPUUtilization

Warnung: MQL:

CPUUtilization[5m].mean() > 80

Kritische MQL:

CPUUtilization[5m].mean() > 90

>80 >90

Warnungsalarm für jeden Apache HTTP Server in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten.

Kritischer Alarm für jeden Apache HTTP Server in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten.

5

Hohe Speicherauslastung

Metrikname: MemoryUtilization

Warnung: MQL:

MemoryUtilization[5m].mean() > 80

Kritische MQL:

MemoryUtilization[5m].mean() > 90

>80 >90

Warnungsalarm für jeden Apache HTTP Server in einem bestimmten Compartment mit einer Speicherauslastung von über 80% für die letzten 5 Minuten.

Kritischer Alarm für jeden Apache HTTP Server in einem bestimmten Compartment mit einer Speicherauslastung von über 90% für die letzten 5 Minuten.

5

Hohe Verarbeitungszeit von Webanforderungen

Metrikname: WebRequestProcessingTime

Warnung: MQL:

WebRequestProcessingTime[5m].mean() > 1500

Kritische MQL:

WebRequestProcessingTime[5m].mean() > 3000

>1.500 >3.000

Warnungsalarm für jeden Apache HTTP Server in einem bestimmten Compartment, der über 1500 ms berichtet, bedeutet die Verarbeitungszeit von Webanforderungen für die letzten 5 Minuten.

Kritischer Alarm für jeden Apache HTTP Server in einem bestimmten Compartment, der über 3000 ms berichtet, bedeutet die Verarbeitungszeit von Webanforderungen für die letzten 5 Minuten.

Oracle Unified Directory

Beispielalarmregel: Oracle Unified Directory (OUD)

  • Ressourcentyp: Oracle Unified Directory

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: oud_directory, oud_proxy, oud_gateway

Alarm Warnung Kritisch Beschreibung

Monitoringstatus

Metrikname: oud_base_status

MQL:

oud_base_status[1m].mean() != 1 || oud_base_status[1m].absent()
nicht zutreffend < 1

Verfügbarkeitsstatus des OUD-Servers.

Ein kritischer Alert wird ausgelöst, wenn der Antwortwert kleiner als 1 ist.

Status von Verbindungs-Handler

Metrikname: ConnectionHandlerState

MQL:

ConnectionHandlerState[1m].mean() < 1
nicht zutreffend <1

Status von Verbindungs-Handler

Ein kritischer Alert wird ausgelöst, wenn der Verbindungs-Handler-Status kleiner als 1 ist.

Backend-Einträge

Metrikname: BackendEntries

Warnung: MQL:

BackendEntries[5m].mean() > 30

Kritische MQL:

BackendEntries[5m].mean() > 50
> 30 >50

Backend-Einträge

Ein Warnhinweis wird ausgelöst, wenn die Backend-Eintragszeit größer als 30 ist.

Ein kritischer Alert wird ausgelöst, wenn die Backend-Einträge größer als 50 sind.

Aufenthaltszeit von allen Vorgängen des Verbindungs-Handlers

Metrikname: ConnectionHandlerAllResidentTime

Warnung: MQL:

ConnectionHandlerAllResidentTime[5m].mean() > 300

Kritische MQL:

ConnectionHandlerAllResidentTime[5m].mean() > 500
> 300 > 500

Aufenthaltszeit aller Verbindungs-Handler

Ein Warnhinweis wird ausgelöst, wenn der Connection Handler "All Resident Time" größer als 60 ist.

Ein kritischer Alert wird ausgelöst, wenn der Connection Handler "All Resident Time" größer als 90 ist.

Verbindungen von Verbindungs-Handler

Metrikname: ConnectionHandlerConnections

Warnung: MQL:

ConnectionHandlerConnections[5m].mean() > 30

Kritische MQL:

ConnectionHandlerConnections[5m].mean() > 50
> 30 >50

Verbindungen von Verbindungs-Handler

Ein Warnungsalert wird ausgelöst, wenn die Connection Handler-Verbindungen größer als 30 sind.

Ein kritischer Alert wird ausgelöst, wenn die Connection Handler-Verbindungen größer als 50 sind.

Belegter JVM-Arbeitsspeicher

Metrikname: JVMUsedMemory

Warnung: MQL:

JVMUsedMemory[5m].mean() > 1.5

Kritische MQL:

JVMUsedMemory[5m].mean() > 3
> 1,5 > 3

Belegter JVM-Speicher

Ein Warnhinweis wird ausgelöst, wenn der belegte JVM-Speicher größer als 1,5 MB ist.

Ein kritischer Alert wird ausgelöst, wenn der belegte JVM-Speicher größer als 3 MB ist.

Belegter BS-Arbeitsspeicher

Metrikname: OSUsedMemory

Warnung: MQL:

OSUsedMemory[5m].mean() > 1.5

Kritische MQL:

OSUsedMemory[5m].mean() > 3
> 1,5 > 3

Belegter Betriebssystemspeicher

Ein Warnhinweis wird ausgelöst, wenn der belegte BS-Speicher größer als 1,5 MB ist.

Ein kritischer Alert wird ausgelöst, wenn der belegte BS-Speicher größer als 3 MB ist.

Replikationsdomainstatus

Metrikname: ReplicationDomainState

MQL:

ReplicationDomainState[5m].mean() < 1
nicht zutreffend < 1

Replikationsdomainstatus

Ein kritischer Alert wird ausgelöst, wenn der Status der Replikationsdomain kleiner als 1 ist.

Gesamtaufenthaltszeit von WFE-Vorgängen

Metrikname: WFEResidentTimeOperationsTotalTime

Warnung: MQL:

WFEResidentTimeOperationsTotalTime[5m].mean() > 60

Kritische MQL:

WFEResidentTimeOperationsTotalTime[5m].mean() > 90
> 60 > 90

Gesamtzeit der WFE-Vorgänge

Eine Warnmeldung wird ausgelöst, wenn die Gesamtzeit für WFE-Resident Time Operations größer als 60 ist.

Ein kritischer Alert wird ausgelöst, wenn die Gesamtzeit für WFE-Resident Time Operations größer als 90 ist.

Aktuelles Backlog in Arbeitsqueue

Metrikname: WorkQueueCurrentBacklog

Warnung: MQL:

WorkQueueCurrentBacklog[5m].mean() > 15

Kritische MQL:

WorkQueueCurrentBacklog[5m].mean() > 30
> 15 > 30

Aktuelles Backlog in Arbeitsqueue

Wenn der aktuelle Rückstand in der Arbeitswarteschlange größer als 15 ist, wird eine Warnmeldung ausgelöst.

Ein kritischer Alert wird ausgelöst, wenn der aktuelle Rückstand in der Arbeitswarteschlange größer als 30 ist.

LDAP-Erweiterung - Verbindungen

Metrikname: ExtensionLDAPConnections

Warnung: MQL:

ExtensionLDAPConnections[5m].mean() > 30

Kritische MQL:

ExtensionLDAPConnections[5m].mean() > 50
> 30 > 50

LDAP-Erweiterung - Verbindungen

Wenn die LDAP-Erweiterungsverbindungen größer als 30 sind, wird ein Warnungsalert ausgelöst.

Ein kritischer Alert wird ausgelöst, wenn die LDAP-Erweiterungsverbindungen größer als 50 sind.

LDAP-Erweiterung - Gesamtantwortzeit für Vorgänge

Metrikname: ExtensionLDAPOperationsTotalResponseTime

Warnung: MQL:

ExtensionLDAPOperationsTotalResponseTime[5m].mean() > 60

Kritische MQL:

ExtensionLDAPOperationsTotalResponseTime[5m].mean() > 90
> 60 > 90

LDAP-Erweiterung - Gesamtantwortzeit für Vorgänge

Eine Warnmeldung wird ausgelöst, wenn die Gesamtantwortzeit der LDAP-Erweiterungsvorgänge größer als 60 ist.

Ein kritischer Alert wird ausgelöst, wenn die Gesamtantwortzeit der Erweiterungs-LDAP-Vorgänge größer als 90 ist.

Oracle GoldenGate

Beispielalarmregel: Goldengate

  • Ressourcentyp: Oracle Goldengate

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: oracle_goldengate

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Goldengate Down

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für Goldengate in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat.

Beispielalarmregel: Goldengate AdminServer

  • Ressourcentyp: Goldengate-Admin-Server

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: oracle_goldengate_admin_server

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Goldengate-Admin-Server heruntergefahren

Metrikname: MonitoringStatusCritical

MQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für Goldengate AdminServer in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat.
5

Hohe CPU-Auslastung

Metrikname:CpuTimeUtilizationPercentage

Warnung: MQL:

CpuTimeUtilizationPercentage[5m].mean() > 80

Kritische MQL:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 Warnalarm für jeden Goldengate-Admin-Server in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für jeden Goldengate-Admin-Server in einem bestimmten Compartment, der über 90% CPU-Auslastung für die letzten 5 Minuten meldet.
5

Private Memory

Metrikname: PrivateMemory

Warnung: MQL:

PrivateMemory[5m].mean() > 30

Kritische MQL:

PrivateMemory[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 30 GB ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 40 GB ist.
5

I/O-Leserate

Metrikname: IOReadRate

Warnung: MQL:

IOReadRate[5m].mean() > 10

Kritische MQL:

IOReadRate[5m].mean() > 20
10 20 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 20 MB/s ist.
5

I/O-Schreibrate

Metrikname: IOWriteRate

Warnung: MQL:

IOWriteRate[5m].mean() > 10

Kritische MQL:

IOWriteRate[5m].mean() > 20
10 20 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 20 MB/s ist.
5

Rate verworfener Pakete

Metrikname: DroppedPacketRate

Warnung: MQL:

DroppedPacketRate[5m].mean() > 30

Kritische MQL:

DroppedPacketRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Rate fehlender Pakete

Metrikname: MissingPacketRate

Warnung: MQL:

MissingPacketRate[5m].mean() > 30

Kritische MQL:

MissingPacketRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Paketfehlerrate

Metrikname: PacketErrorRate

Warnung: MQL:

PacketErrorRate[5m].mean() > 30

Kritische MQL:

PacketErrorRate[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Paketempfangsrate

Metrikname: PacketReceiveRate

Warnung: MQL:

PacketReceiveRate[5m].mean() > 30

Kritische MQL:

PacketReceiveRate[5m].mean() > 40
30 40

Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 30 Msgs/min ist.

Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 40 Msgs/min ist.

Beispielalarmregel: Goldengate-Verteilungsservice

  • Ressourcentyp: Goldengate-Verteilungsdienst

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: oracle_goldengate_distribution_server

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Goldengate-Verteilungsservice

Metrikname: MonitoringStatus

Kritische MQL: Überwachungsstatus

[1m].mean() == 0 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für jeden Goldengate-Verteilungsservice in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat.
5

Hohe CPU-Auslastung

Metrikname: CpuTimeUtilizationPercentage

Warnung: MQL:

CpuTimeUtilizationPercentage[5m].mean() > 80

Kritische MQL:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 Warnungsalarm für jeden Goldengate-Verteilungsservice in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für jeden Goldengate-Verteilungsservice in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten.
5

Private Memory

Metrikname: PrivateMemory

Warnung: MQL:

PrivateMemory[5m].mean() > 30

Kritische MQL:

PrivateMemory[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 30 GB ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 40 GB ist.
5

I/O-Leserate

Metrikname: IOReadRate

Warnung: MQL:

IOReadRate[5m].mean() > 10

Kritische MQL:

IOReadRate[5m].mean() > 20
10 20 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 20 MB/s ist.
5

I/O-Schreibrate

Metrikname: IOWriteRate

Warnung: MQL:

IOWriteRate[5m].mean() > 10

Kritische MQL:

IOWriteRate[5m].mean() > 20
10 20 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 20 MB/s ist.
5

Rate verworfener Pakete

Metrikname: DroppedPacketRate

Warnung: MQL:

DroppedPacketRate[5m].mean() > 30

Kritische MQL:

DroppedPacketRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Rate fehlender Pakete

Metrikname: MissingPacketRate

Warnung: MQL:

MissingPacketRate[5m].mean() > 30

Kritische MQL:

MissingPacketRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Paketfehlerrate

Metrikname: PacketErrorRate

Warnung: MQL:

PacketErrorRate[5m].mean() > 30

Kritische MQL:

PacketErrorRate[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Paketempfangsrate

Metrikname: PacketReceiveRate

Warnung: MQL:

PacketReceiveRate[5m].mean() > 30

Kritische MQL:

PacketReceiveRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 40 Msgs/min ist.

Beispielalarmregel: Goldengate-Empfängerdienst

  • Ressourcentyp: Goldengate-Empfängerdienst

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: oracle_goldengate_receiver_server

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Goldengate-Empfangsservice

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für jeden Goldengate-Empfängerservice in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat.
5

Hohe CPU-Auslastung

Metrikname: CpuTimeUtilizationPercentage

Warnung: MQL:

CpuTimeUtilizationPercentage[5m].mean() > 80

Kritische MQL:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 Warnalarm für jeden Goldengate-Empfängerservice in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für jeden Goldengate-Empfängerservice in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten.
5

Private Memory

Metrikname: PrivateMemory

Warnung: MQL:

PrivateMemory[5m].mean() > 30

Kritische MQL:

PrivateMemory[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 30 GB ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 40 GB ist.
5

I/O-Leserate

Metrikname: IOReadRate

Warnung: MQL:

IOReadRate[5m].mean() > 10

Kritische MQL:

IOReadRate[5m].mean() > 20
10 20 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 20 MB/s ist.
5

I/O-Schreibrate

Metrikname: IOWriteRate

Warnung: MQL:

IOWriteRate[5m].mean() > 10

Kritische MQL:

IOWriteRate[5m].mean() > 20
10 20 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 20 MB/s ist.
5

Rate verworfener Pakete

Metrikname: DroppedPacketRate p

Warnung: MQL:

DroppedPacketRate[5m].mean() > 30

Kritische MQL:

DroppedPacketRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Rate fehlender Pakete

Metrikname: MissingPacketRate

Warnung: MQL:

MissingPacketRate[5m].mean() > 30

Kritische MQL:

MissingPacketRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Paketfehlerrate

Metrikname: PacketErrorRate

Warnung: MQL:

PacketErrorRate[5m].mean() > 30

Kritische MQL:

PacketErrorRate[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Paketempfangsrate

Metrikname: PacketReceiveRate

Warnung: MQL:

PacketReceiveRate[5m].mean() > 30

Kritische MQL:

PacketReceiveRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 40 Msgs/min ist.

Beispielalarmregel: Goldengate Service Manager

  • Ressourcentyp: Goldengate-Servicemanager

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: oracle_goldengate_service_manager

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Service-Manager von Goldengate

Metrikname: MonitoringStatus

StatusCritical MQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für einen Goldengate-Servicemanager in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat.

Beispielalarmregel: Goldengate-Leistungsmetrikservice

  • Ressourcentyp: Goldengate-Leistungsmetrikservice

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: oracle_goldengate_pm_server

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Goldengate-Leistungskennzahlenservice

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für jeden Goldengate-Performancemetrikservice in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat.
5

Hohe CPU-Auslastung

Metrikname: CpuTimeUtilizationPercentage

Warnung: MQL:

CpuTimeUtilizationPercentage[5m].mean() > 80

Kritische MQL:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 Warnungsalarm für jeden Goldengate Performance Metric Service in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für jeden Goldengate Performance Metric Service in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten.
5

Private Memory

Metrikname: PrivateMemory

Warnung: MQL:

PrivateMemory[5m].mean() > 30

Kritische MQL:

PrivateMemory[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 30 GB ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 40 GB ist.
5

I/O-Leserate

Metrikname: IOReadRate

Warnung: MQL:

IOReadRate[5m].mean() > 10

Kritische MQL:

IOReadRate[5m].mean() > 20
10 20 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 20 MB/s ist.
5

I/O-Schreibrate

Metrikname: IOWriteRate

Warnung: MQL:

IOWriteRate[5m].mean() > 10

Kritische MQL:

IOWriteRate[5m].mean() > 20
10 20 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 20 MB/s ist.

Beispielalarmregel: Goldengate-Extrakt

  • Ressourcentyp: Goldengate-Extrakt

  • Ressourcentyp: goldengate_extract

  • Ressourcengruppe: oracle_goldengate_extract

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Goldengate-Extrakt

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für einen Goldengate-Extrakt in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat.
5

Hohe CPU-Auslastung

Metrikname: CpuTimeUtilizationPercentage

Warnung: MQL:

CpuTimeUtilizationPercentage[5m].mean() > 80

Kritische MQL:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 Warnalarm für jeden Goldengate-Extrakt in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für jeden Goldengate-Extrakt in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten.
5

Private Memory

Metrikname: PrivateMemory

Warnung: MQL:

PrivateMemory[5m].mean() > 30

Kritische MQL:

PrivateMemory[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 30 GB ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 40 GB ist.
5

I/O-Leserate

Metrikname: IOReadRate

Warnung: MQL:

IOReadRate[5m].mean() > 10

Kritische MQL:

IOReadRate[5m].mean() > 20
10 20 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 20 MB/s ist.
5

I/O-Schreibrate

Metrikname: IOWriteRate

Warnung: MQL:

IOWriteRate[5m].mean() > 10

Kritische MQL:

IOWriteRate[5m].mean() > 20
10 20 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 20 MB/s ist.
5

Rate verworfener Pakete

Metrikname: DroppedPacketRate

Warnung: MQL:

DroppedPacketRate[5m].mean() > 30

Kritische MQL:

DroppedPacketRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Rate fehlender Pakete

Metrikname: MissingPacketRate

Warnung: MQL:

MissingPacketRate[5m].mean() > 30

Kritische MQL:

MissingPacketRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Paketfehlerrate

Metrikname: PacketErrorRate

Warnung: MQL:

PacketErrorRate[5m].mean() > 30

Kritische MQL:

PacketErrorRate[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Paketempfangsrate

Metrikname: PacketReceiveRate

Warnung: MQL:

PacketReceiveRate[5m].mean() > 30

Kritische MQL:

PacketReceiveRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Rate zugeordneter DELETE-Anweisungen

Metrikname: MappedDeleteRate

Warnung: MQL:

MappedDeleteRate[5m].mean() > 30

Kritische MQL:

MappedDeleteRate[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der zugeordneten Löschrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Löschrate in den letzten 5 Minuten größer als 40 MB/s ist.
5

Rate zugeordneter INSERT-Anweisungen

Metrikname: MappedInsertRate

Warnung: MQL:

MappedInsertRate[5m].mean() > 30

Kritische MQL:

MappedInsertRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der zugeordneten Einfügerate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Einfügerate in den letzten 5 Minuten größer als 40 MB/s ist.
5

Rate zugeordneter TRUNCATE-Anweisungen

Metrikname: MappedTruncateRate

Warnung: MQL:

MappedTruncateRate[5m].mean() > 30

Kritische MQL:

MappedTruncateRate[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der zugeordneten Abschneiderate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Abschneiderate in den letzten 5 Minuten größer als 40 MB/s ist.
5

Rate zugeordneter UPDATE-Anweisungen

Metrikname: MappedUpdateRate

Warnung: MQL:

MappedUpdateRate[5m].mean() > 30

Kritische MQL:

MappedUpdateRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der zugeordneten Aktualisierungsrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Aktualisierungsrate in den letzten 5 Minuten größer als 40 MB/s ist.
5

Verwerfungsrate

Metrikname: DiscardRate

Warnung: MQL:

DiscardRate[5m].mean() > 30

Kritische MQL:

DiscardRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der Verwerfungsrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Verwerfungsrate in den letzten 5 Minuten größer als 40 MB/s ist.
5

Rate ignorieren

Metrikname: IgnoreRate

Warnung: MQL:

IgnoreRate[5m].mean() > 30

Kritische MQL:

IgnoreRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die Ignorierrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die Ignorierrate in den letzten 5 Minuten größer als 40 MB/s ist.
5

Lag

Metrikname: Lag

Warnung: MQL:

Lag[5m].mean() > 10

Kritische MQL:

Lag[5m].mean() > 20
10 20 Eine Warnmeldung wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 10 Sekunden ist. Ein kritischer Alert wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 20 Sekunden ist.
5

Vorgangsrate

Metrikname: OperationsPerSec

Warnung: MQL:

OperationsPerSec[5m].mean() > 30

Kritische MQL:

OperationsPerSec[5m].mean() > 40
20 30 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der Operationsrate in den letzten 5 Minuten größer als 20 Ops/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Operationsrate in den letzten 5 Minuten größer als 30 Ops/s ist.

Beispielalarmregel: Goldengate Replicat

  • Ressourcentyp: Goldengate Replicat

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: oracle_goldengate_replicat

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Goldengate-Replikat

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für ein Goldengate-Replicat in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat.
5

Hohe CPU-Auslastung

Metrikname: CpuTimeUtilizationPercentage

Warnung: MQL:

CpuTimeUtilizationPercentage[5m].mean() > 80

Kritische MQL:

CpuTimeUtilizationPercentage[5m].mean() > 90
80 90 Warnungsalarm für jedes Goldengate-Replicat in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% für die letzten 5 Minuten. Kritischer Alarm für jedes Goldengate-Replicat in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% für die letzten 5 Minuten.
5

Private Memory

Metrikname: PrivateMemory

Warnung: MQL:

PrivateMemory[5m].mean() > 30

Kritische MQL:

PrivateMemory[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 30 GB ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert des privaten Speichers in den letzten 5 Minuten größer als 40 GB ist.
5

I/O-Leserate

Metrikname: IOReadRate

Warnung: MQL:

IOReadRate[5m].mean() > 10

Kritische MQL:

IOReadRate[5m].mean() > 20
10 20 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der I/O-Leserate in den letzten 5 Minuten größer als 20 MB/s ist.
5

I/O-Schreibrate

Metrikname: IOWriteRate

Warnung: MQL:

IOWriteRate[5m].mean() > 10

Kritische MQL:

IOWriteRate[5m].mean() > 20
10 20 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 10 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die I/O-Schreibrate in den letzten 5 Minuten größer als 20 MB/s ist.
5

Rate verworfener Pakete

Metrikname: DroppedPacketRate

Warnung: MQL:

DroppedPacketRate[5m].mean() > 30

Kritische MQL:

DroppedPacketRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der verworfenen Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Rate fehlender Pakete

Metrikname: MissingPacketRate

Warnung: MQL:

MissingPacketRate[5m].mean() > 30

Kritische MQL:

MissingPacketRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die fehlende Paketrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Paketfehlerrate

Metrikname:

PacketErrorRate

Warnung: MQL:

PacketErrorRate[5m].mean() > 30

Kritische MQL:

PacketErrorRate[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Paketfehlerrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Paketempfangsrate

Metrikname: PacketReceiveRate

Warnung: MQL:

PacketReceiveRate[5m].mean() > 30

Kritische MQL:

PacketReceiveRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 30 Msgs/min ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die Paketempfangsrate in den letzten 5 Minuten größer als 40 Msgs/min ist.
5

Rate zugeordneter DELETE-Anweisungen

Metrikname: MappedDeleteRate

Warnung: MQL:

MappedDeleteRate[5m].mean() > 30

Kritische MQL:

MappedDeleteRate[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der zugeordneten Löschrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Löschrate in den letzten 5 Minuten größer als 40 MB/s ist.
5

Rate zugeordneter INSERT-Anweisungen

Metrikname: MappedInsertRate

Warnung: MQL:

MappedInsertRate[5m].mean() > 30

Kritische MQL:

MappedInsertRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der zugeordneten Einfügerate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Einfügerate in den letzten 5 Minuten größer als 40 MB/s ist.
5

Rate zugeordneter TRUNCATE-Anweisungen

Metrikname: MappedTruncateRate

Warnung: MQL:

MappedTruncateRate[5m].mean() > 30

Kritische MQL:

MappedTruncateRate[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der zugeordneten Abschneiderate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Abschneiderate in den letzten 5 Minuten größer als 40 MB/s ist.
5

Rate zugeordneter UPDATE-Anweisungen

Metrikname: MappedUpdateRate

Warnung MQL:

MappedUpdateRate[5m].mean() > 30

Kritische MQL:

MappedUpdateRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der zugeordneten Aktualisierungsrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der zugeordneten Aktualisierungsrate in den letzten 5 Minuten größer als 40 MB/s ist.
5

Verwerfungsrate

Metrikname: DiscardRate

Warnung MQL:

DiscardRate[5m].mean() > 30

Kritische MQL:

DiscardRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der Verwerfungsrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Verwerfungsrate in den letzten 5 Minuten größer als 40 MB/s ist.
5

Rate ignorieren

Metrikname: IgnoreRate

Warnung MQL:

IgnoreRate[5m].mean() > 30

Kritische MQL:

IgnoreRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert für die Ignorierrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert für die Ignorierrate in den letzten 5 Minuten größer als 40 MB/s ist.
5

Lag

Metrikname: Lag

Warnung MQL:

Lag[5m].mean() > 30

Kritische MQL:

Lag[5m].mean() > 40
10 20 Eine Warnmeldung wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 10 Sekunden ist. Ein kritischer Alert wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 20 Sekunden ist.
5

Vorgangsrate

Metrikname: OperationsPerSec

Warnung MQL:

OperationsPerSec[5m].mean() > 30

Kritische MQL:

OperationsPerSec[5m].mean() > 40
20 30 Eine Warnmeldung wird ausgelöst, wenn der Mittelwert der Operationsrate in den letzten 5 Minuten größer als 20 Ops/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Operationsrate in den letzten 5 Minuten größer als 30 Ops/s ist.

Beispielalarmregel: Goldengate-Verteilungspfad

  • Ressourcentyp: Goldengate-Verteilungspfad

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: oracle_goldengate_distribution_path

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Goldengate-Verteilungspfad

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für jeden Goldengate-Verteilungspfad in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat.
5

Lag

Metrikname: Lag

Warnung MQL:

Lag[5m].mean() > 30

Kritische MQL:

Lag[5m].mean() > 40
10 20 Eine Warnmeldung wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 10 Sekunden ist. Ein kritischer Alert wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 20 Sekunden ist.
5

Netzwerksenderate

Metrikname: NetworkSentRate

Warnung MQL:

NetworkSentRate[5m].mean() > 30

Kritische MQL:

NetworkSentRate[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der Netzwerk-Sendrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Netzwerk-Sendrate in den letzten 5 Minuten größer als 40 MB/s ist.
5

Netzwerkempfangsrate

Metrikname: NetworkReceiveRate

Warnung MQL:

NetworkReceiveRate[5m].mean() > 30

Kritische MQL:

NetworkReceiveRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der vom Netzwerk gesendete Empfangsmittelwert in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Netzwerkempfangsrate in den letzten 5 Minuten größer als 40 MB/s ist.

Beispielalarmregel: Goldengate-Empfängerpfad

  • Ressourcentyp: Goldengate-Empfängerpfad

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: oracle_goldengate_receiver_path

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Goldengate-Empfangspfad

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für jeden Goldengate-Empfängerpfad in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat.
5

Lag

Metrikname: Lag

Warnung MQL:

Lag[5m].mean() > 30

Kritische MQL:

Lag[5m].mean() > 40
10 20 Eine Warnmeldung wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 10 Sekunden ist. Ein kritischer Alert wird ausgelöst, wenn der Lag-Mittelwert in den letzten 5 Minuten größer als 20 Sekunden ist.
5

Netzwerksenderate

Metrikname: NetworkSentRate

Warnung MQL:

NetworkSentRate[5m].mean() > 30

Kritische MQL:

NetworkSentRate[5m].mean() > 40
30 40 Ein Warnhinweis wird ausgelöst, wenn der Mittelwert der Netzwerk-Sendrate in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Netzwerk-Sendrate in den letzten 5 Minuten größer als 40 MB/s ist.
5

Netzwerkempfangsrate

Metrikname: NetworkReceiveRate

Warnung MQL:

NetworkReceiveRate[5m].mean() > 30

Kritische MQL:

NetworkReceiveRate[5m].mean() > 40
30 40 Eine Warnmeldung wird ausgelöst, wenn der vom Netzwerk gesendete Empfangsmittelwert in den letzten 5 Minuten größer als 30 MB/s ist. Ein kritischer Alert wird ausgelöst, wenn der Mittelwert der Netzwerkempfangsrate in den letzten 5 Minuten größer als 40 MB/s ist.

Prozessbasierte Beispielalarmregeln für benutzerdefinierte Ressourcen

  • Ressourcentyp: Benutzerdefinierte Ressource

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: custom_resource

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Benutzerdefinierte Ressource heruntergefahren

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für eine benutzerdefinierte Ressource in einem bestimmten Compartment, die über 1 Minute lang den Status "Heruntergefahren" oder "Nicht gemeldet" aufweist.
5

Hohe CPU-Auslastung

Metrikname: CpuUtilization

Warnung MQL:

CpuUtilization[1m].mean() > 80

Kritische MQL:

CpuUtilization[1m].mean() > 90
>80 >90

Warnalarm für jede benutzerdefinierte Ressource in einem bestimmten Compartment mit einer CPU-Auslastung von über 80% über 5 Minuten.

Kritischer Alarm für jede benutzerdefinierte Ressource in einem bestimmten Compartment mit einer CPU-Auslastung von über 90% über 5 Minuten.

15

Hohe Speicherauslastung

Metrikname: MemoryUtilization

Warnung MQL:

MemoryUtilization[1m].mean() > 80

Kritische MQL:

MemoryUtilization[1m].mean() > 90
>80 >90

Warnalarm für jede benutzerdefinierte Ressource in einem bestimmten Compartment mit einer Speicherauslastung von über 80% über 15 Minuten.

Kritischer Alarm für jede benutzerdefinierte Ressource in einem bestimmten Compartment mit einer Speicherauslastung von über 90% über 15 Minuten.

Oracle Service Bus (OSB)

  • Ressourcentyp: Oracle Service Bus

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: oracle_servicebus

Beurteilungszeitraum (Minuten) Alarmregel Warnung Kritisch Beschreibung
1

Monitoringstatus

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[1m].mean() == 0 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm für jeden Service Bus in einem bestimmten Compartment, der den Status über 1 Minute lang als heruntergefahren oder nicht gemeldet hat.
5

Service Bus-Fehler

Metrikname: ServiceBusErrors

Kritische MQL:

ServiceBusErrors[1m].mean() > 0
nicht zutreffend >0 Kritischer Alarm für jeden Service Bus in einem bestimmten Compartment, der über 5 Minuten lang meldet, wenn Fehler in einem der OSB-Services aufgetreten sind.

Microsoft-IIS

  • Ressourcenart: IIS

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: microsoft_iis

Auswertungszeitraum Alarmtule Warnung Kritisch Beschreibung
1

IIS heruntergefahren

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()

nicht zutreffend nicht zutreffend Kritischer Alarm, der keine Verbindung zu IIS mehr herstellen kann
5

ASP.Net Neustart des Worker-Prozesses

Metrikname: ASPDotNetWorkerProcessRestarts

Kritische MQL:

ASPDotNetWorkerProcessRestarts[1m].mean() > 1
>1 nicht zutreffend Kritischer Alarm, um zu wissen, ob Worker-Prozessneustarts aufgetreten sind. Dies kann durch eine Reihe von Dingen verursacht werden und Probleme verursachen, einschließlich Performanceauswirkungen und Informationsverlust.
5

ASP.Net Anforderungen in Queue

Metrikname: ASPDotNetRequests.Type.Queued

Warnung MQL:

ASPDotNetRequests.Type.Queued[1m].mean() > 5

Kritische MQL:

ASPDotNetRequests.Type.Queued[1m].mean() > 10
>5 >10 Schwellenwert für kritische/Warnung, um uns mitzuteilen, ob eingehende HTTP-Anforderungen aufgrund des Ladevorgangs in eine Queue gestellt werden.
5

ASP.Net-Fehlerrate

Metrikname: ErrorRate

Warnung MQL:

ErrorRate[1m].mean() > 1%*

Kritische MQL:

ErrorRate[1m].mean() > 2%*
> 1%* > 2%* Kritischer/Warnungsschwellenwert, um den Benutzer darüber zu informieren, dass die Fehlerrate einer ASP.Net-Anwendung einen bestimmten Schwellenwert überschreitet. Diese Metrik gibt Fehler pro Sekunde zurück. Daher muss der Schwellenwert basierend auf den durchschnittlichen Gesamtanforderungen festgelegt werden, die sie erhalten. Beispiel: Wenn sie normalerweise 100 Anforderungen/s erhalten, empfehlen wir 1 Fehler für eine Warnung und 2 für einen kritischen Fehler.
  • Ressourcentyp: IIS-Website

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: microsoft_iis

Beurteilungszeitraum (in Minuten) Alarmregel Warnung Kritisch Beschreibung
1

IIS-Website heruntergefahren

Metrikname: MonitoringStatus

Kritische MQL:

MonitoringStatus[1m].mean() != 1 || MonitoringStatus[1m].absent()
nicht zutreffend nicht zutreffend Kritischer Alarm, der keine Verbindung mehr zur IIS-Website herstellen kann
5

WWW - Aktuelle Verbindungen

Metrikname: CurrentConnections.Service.WWW

Warnung MQL:

CurrentConnections.Service.WWW[1m].mean() > 90%*

Kritische MQL:

CurrentConnections.Service.WWW[1m].mean() > 95%*
> 90%* > 95%* Kritischer/Warnungsschwellenwert, um den Benutzer darauf hinzuweisen, dass die Anzahl der Verbindungen nahe am Maximum liegt. Hinweis: Der Kunde muss die Zahl auf 90 / 95% seiner maximalen Verbindungen setzen. Die Metrik ist eine Zahl. Daher ist dieser eingerichtete Alert für jeden Kunden eindeutig. Beispiel: Wenn für den Benutzer insgesamt 200 Verbindungen zulässig sind, empfehlen wir 180 für Warnungen und 190 für kritische Verbindungen.

NGINX

  • Ressourcentyp: NGINX

  • Metrik-Namespace: oracle_appmgmt

  • Ressourcengruppe: nginx

Beurteilungszeitraum Alarmregel Warnung Kritisch Beschreibung
3

Nginx heruntergefahren

Anzeigename: MonitoringStatus

MQL:

MonitoringStatus[3m].mean() != 1 ||MonitoringStatus[1m].absent()

nicht zutreffend 0

Alarm, weil keine Verbindung zum NGINX-API-Endpunkt hergestellt werden kann.

5

Rate der beantworteten Prozesse

Metrikname: RespawnedProcessesRate

Warnung MQL:

RespawnedProcessesRate[5m].mean() > 1

Kritische MQL:

RespawnedProcessesRate[5m].mean() > 2

>1 >2

Die Anzahl der Prozesse, die während des Intervalls neu gestartet wurden.

5

HTTP-Upstreams-Health Checks bewerten fehlerhaft

Metrikname: HttpUpstreamsHealthChecksRate

Dimensionsname: Type

Dimensionswert: Unhealthy

Warnung MQL:

HttpUpstreamsHealthChecksRate[5m]{Type = "Unhealthy"}.mean() > 1

>1 nicht zutreffend

Von NGINX erkannter fehlerhafter Status, der sich negativ auf Performance oder Verfügbarkeit auswirken könnte.

5

Stream-Upstreams-Health Checks bewerten fehlerhaften Status >1 fehlerhaften Status durch NGINX-Performance oder -Verfügbarkeit erkannt

Metrikname:

StreamUpstreamsHealthChecksRate

Dimensionsname: Type

Dimensionswert: Unhealthy

Warnung MQL:

StreamUpstreamsHealthChecksRate[5m] {Type = "Unhealthy"}.mean() > 1

>1 nicht zutreffend

Von NGINX erkannter fehlerhafter Status, der sich negativ auf Performance oder Verfügbarkeit auswirken könnte

Metrikerweiterungen

Sie können Alarmregeln erstellen, um Alarme auszulösen, wenn Metrikwerte aus den Metrikerweiterungen Schwellenwerte überschreiten. Verwenden Sie denselben allgemeinen Workflow, den Sie befolgen würden, um eine Alarmregel für integrierte Metriken für Ihre Ressourcen zu erstellen. Der Hauptunterschied liegt im Abschnitt "Metrikbeschreibung".

  • Compartment: Wählen Sie das Compartment der Ressource aus, in der die Metrikerweiterung aktiviert wurde
  • Metrik-Namespace: wählen Sie oracle_metric_extensions_appmgmt aus
  • Ressourcengruppe: Der Ressourcentyp der Ressource, auf der die Metrikerweiterung bereitgestellt wurde.

Das Erstellen einer Alarmregel für eine Metrikerweiterung eines Hosts wird in der folgenden Abbildung gezeigt:


Alarmregeln für Metrikerweiterungen erstellen