Hinweis:

VM-Datenträgerauslastung mit Stackmonitoring verwalten

Einführung

Eine der Hauptaufgaben eines Cloudadministrators ist die Verwaltung und Überwachung der in den Organisationsumgebungen bereitgestellten Ressourcen. Für alle Arten von Workloads ist es erforderlich, den Zustand der Ressourcen und Änderungen von Zeit zu Zeit zu überwachen und sicherzustellen, dass alle Workloads grün sind - fehlerfrei und gestartet.

In Compute-Instanzen spielt der Speicher eine entscheidende Rolle in Bezug auf Anwendungsstabilität, Ausführung und Speicherung der Anwendungsdaten, der Benutzer in Datenbankdateien usw. Ein Administrator muss den Speicher jedes Volumes oder Datenträgers überwachen und verwalten, der an die Compute-Instanz angeschlossen ist, um Anwendungsabstürze, Ausfallzeiten und Datenverlust der Benutzer und Organisationen zu minimieren.

Stack Monitoring ist einer der Services für die Überwachung von Compute-Instanzen in Oracle Cloud Infrastructure (OCI) unter Beobachtbarkeit und Management für die Infrastruktur, die unter dem OCI-Mandanten bereitgestellt ist. Mit Stack Monitoring können nicht nur die einzelnen Datenträger, sondern auch die Dateisysteme gespeichert werden, die auf jedem Volume erstellt werden, das an die Compute-Instanzen angeschlossen ist. Zusätzlich zum Speicher bietet die Stacküberwachung Metriken für Verfügbarkeit, CPU, Arbeitsspeicher und Datenträgeraktivität + Paging der Compute-Instanzen.

Features von Stack Monitoring

Stack Monitoring bietet die Tools, mit denen Sie Probleme schnell erkennen und warnen können, wie ein Dateisystem, das nicht mehr genügend Speicherplatz hat oder eine hohe CPU-Auslastung aufweist. Mit Stackmonitoring erhalten Sie einen besseren Einblick in Zustand und Verfügbarkeit der Compute-Instanzen. Außerdem erhalten Sie ein kompiliertes Ansichts-Dashboard mit allen überwachten Ressourcen. Mit Stack Monitoring können Sie:

Zielsetzung

Erfahren Sie, wie Sie die VM-Datenträgerauslastung mit Stack Monitoring verwalten.

Voraussetzungen

  1. Erstellen oder geben Sie ein zu verwendendes Compartment an:

    Sie können ein neues Compartment erstellen oder ein vorhandenes Compartment zur Installation und Konfiguration des Stackmonitoringservice verwenden. Informationen zu Compartments finden Sie unter Compartments verwalten.

    Stellen Sie beim Festlegen eines Monitoring-Compartments sicher, dass Sie dasselbe Compartment für Ihre Agents sowie native OCI-Ressourcen (z.B. Datenbanken, Compute-Instanzen) verwenden. Wenn sich die Ressourcen in verschiedenen Compartments befinden, verschieben Sie die Ressourcen in dasselbe Compartment der Stackmonitoring-Agents.

  2. Dynamische Gruppe aller Management Agents erstellen:

    Um mit den OCI-Serviceendpunkten zu interagieren, müssen Sie explizit eine dynamische Gruppe erstellen, damit Management Agents mit dem Management Agent-Service (MACS) kommunizieren können. So erstellen Sie eine dynamische Gruppe:

    1. Navigieren Sie unter ID und Sicherheit zu ID, und klicken Sie auf Dynamische Gruppen.

    2. Klicken Sie auf Dynamische Gruppe erstellen.

    3. Geben Sie im Dialogfeld Dynamische Gruppe erstellen einen Namen für die dynamische Gruppe, eine Beschreibung und die Übereinstimmungsregeln ein, und klicken Sie auf Dynamische Gruppe erstellen.

      Dynamische Gruppe

      Beispiel: Sie erstellen eine dynamische Gruppe namens "Demo_DyanmicGroup_For_MonitoringAgent" mit den folgenden Details unter RULE 1:

      ALL {resource.type='managementagent', resource.compartment.id='ocid1.compartment.oc1.examplecompartmentid'}

  3. Policy für die dynamische Gruppe erstellen:

    Sie müssen die folgenden Policys erstellen, damit die Management Agents mit dem Management Agent-Service interagieren und die Management Agents Daten hochladen können.

    • Policy 1: ALLOW DYNAMIC-GROUP <Demo_DynamicGroup_For_MonitoringAgent >TO USE METRICS IN COMPARTMENT <compartment_name> where target.metrics.namespace = 'oracle_appmgmt'

      Beschreibung: Zulassen, dass der Agent Metriken in Telemetrie in den Namespace "oracle_appmgmt" hochlädt. Hier ist die Management_Agent_Dynamic_Group eine dynamische Gruppe von Management Agents in einem Compartment.

    • Policy 2: ALLOW DYNAMIC-GROUP <Demo_DynamicGroup_For_MonitoringAgent> TO {STACK_MONITORING_DISCOVERY_JOB_RESULT_SUBMIT} IN COMPARTMENT <compartment_name>`

      Beschreibung: Ermöglicht dem Agent das Hochladen von Daten in den Discovery-Service. Hier ist die Management_Agent_Dynamic_Group eine dynamische Gruppe von Management Agents in einem Compartment.

    Hinweis: Sie können Voraussetzungen 4 und Voraussetzungen 5 überspringen, wenn Sie Administratorberechtigungen für Mandanten haben. Die folgenden Schritte sind zu befolgen, wenn der Administrator Benutzer erstellen möchte, um nur die Stacküberwachung speziell zu verwalten.

  4. Benutzer und Gruppen erstellen:

    Als Best Practice sollten Sie separate Benutzer und Gruppen erstellen, um die Vorgänge zur Stacküberwachung zu verwalten. Die Administratorgruppe und ihre Benutzer verfügen jedoch standardmäßig über die erforderlichen Berechtigungen. Stackmonitoringbenutzer und -gruppen werden mit dem Identity and Access Management-(IAM-)Service von Oracle Cloud Infrastructure erstellt. Informationen zum Erstellen und Verwalten von Benutzern und Gruppen mit dem Identity and Access Management-(IAM-)Service finden Sie unter Benutzer verwalten und Gruppen verwalten. Erstellen Sie die folgenden Benutzergruppen, die für das Stackmonitoring erforderlich sind.

    Gruppieren Beschreibung
    StackMonitoringAdminGrp Gruppe für Benutzer, die Administrations-/Operatorvorgänge ausführen.
  5. Erstellen Sie die erforderlichen Policys:

    Stackmonitoring-Policys werden mit den Identity and Access Management-(IAM-)Policys erstellt. Dieses Tutorial enthält spezielle Beispiele, mit denen Sie Ihren Mandanten für die Nutzung von Stackmonitoring konfigurieren können. Allgemeine Informationen zu OCI-Policys finden Sie in den ersten Schritten mit Policys.

    Policys für administrative Vorgänge erstellen

    Im Folgenden finden Sie die Liste der Policys, die definiert werden müssen, damit die Benutzer, die Administrationsvorgänge ausführen können, d.h. die Benutzer, die zur Gruppe StackMonitoringAdminGrp gehören.

    • Policy 1: ALLOW GROUP StackMonitoringAdminGrp TO MANAGE stack-monitoring-family IN COMPARTMENT <compartment_name>

      Beschreibung: Benutzern in der Gruppe StackMonitoringAdminGrp erlauben, Admin-Vorgänge in einem Compartment auszuführen.

    • Policy 2: ALLOW GROUP StackMonitoringAdminGrp TO {MGMT_AGENT_DEPLOY_PLUGIN_CREATE, MGMT_AGENT_INSPECT, MGMT_AGENT_READ} IN COMPARTMENT <compartment_name>

      Beschreibung: Benutzern in der Gruppe StackMonitoringAdminGrp erlauben, Agents aufzulisten/zu lesen und das Stack Monitoring Management Agent-Plug-in während der Ressourcen-Discovery bereitzustellen, wenn der Management Agent das Plug-in noch nicht im Geltungsbereich des Compartments enthält.

    • Policy 3: ALLOW GROUP StackMonitoringAdminGrp TO READ metrics IN COMPARTMENT <compartment_name>

      Beschreibung: Lesen von Metriken in einem Compartment durch Benutzer in der Gruppe StackMonitoringAdminGrp zulassen.

    • Policy 4: ALLOW GROUP StackMonitoringAdminGrp to READ instances IN COMPARTMENT<compartment_name>

      Beschreibung: Lesen von Instanzen in einem Compartment durch Benutzer in der Gruppe StackMonitoringAdminGrp zulassen.

    • Policy 5: ALLOW GROUP StackMonitoringAdminGrp to MANAGE external-database-family IN COMPARTMENT <compartment_name>

      Beschreibung: Benutzer in der Gruppe StackMonitoringAdminGrp können externe Datenbanken in einem Compartment verwalten.

    • Policy 6: ALLOW GROUP StackMonitoringAdminGrp to MANAGE alarms IN COMPARTMENT<compartment_name>

      Beschreibung: Benutzern in der Gruppe StackMonitoringAdminGrp das Verwalten von Alarmen in einem Compartment erlauben.

    • Policy 7: ALLOW GROUP StackMonitoringAdminGrp to USE ons-topics IN COMPARTMENT <compartment_name>

      Beschreibung: Benutzern in der StackMonitoringAdminGrp das Auflisten, Erstellen, Aktualisieren, Löschen und Verschieben von Abonnements für Themen im Mandanten erlauben.

Aufgabe 1: Management Agents installieren

Sie müssen das Management Agent-Plug-in installieren, wie es für die Verwendung des Stack Monitoring-Service erforderlich ist.

  1. Melden Sie sich bei der Oracle Cloud-Konsole an, klicken Sie im Navigationsmenü auf Compute und dann auf Instanzen.

  2. Klicken Sie auf die gewünschte Instanz.

  3. Klicken Sie auf die Registerkarte Oracle Cloud Agent. Die Liste der Plug-ins wird angezeigt.

  4. Schalten Sie den Schalter Aktiviert für das Management Agent-Plug-in um.

    Oracle Agents

Nachdem der Agent aktiviert wurde, dauert es etwa 10-15 Minuten, bis der Status "Wird ausgeführt" geändert wird.

Aufgabe 2: Monitoring-Agent-ID prüfen

  1. Melden Sie sich bei der Oracle Cloud-Konsole an, und klicken Sie im Navigationsmenü auf Observability and Management.

  2. Wählen Sie Management Agent Service.

  3. Wählen Sie das Compartment in der Dropdown-Liste "Compartment" aus, und die Liste der Agents wird angezeigt, die für ihre jeweiligen Compute-Instanzen aktiviert sind.

    Agents und Gateways

  4. Wählen Sie den Agent für die Compute-Instanz aus, für die Sie die Stacküberwachung aktivieren möchten, und notieren Sie sich die "Agent-ID" der Überwachung für die zukünftige Verwendung.

    Agent-Überblick

Aufgabe 3: Stackmonitoring-Discovery-Job ausführen

Der letzte Schritt besteht darin, den Discovery-Job durch Hochstufen von OCI Compute-Instanzen auszuführen. Sie können eine Compute-Instanz genauer überwachen und erhalten einen Einblick in die von ihr verwendeten Ressourcen. In diesem Schritt müssen Sie eine cloud shell im OCI-Portal öffnen.

  1. Klicken Sie auf der Homepage auf die OCI Cloud Shell, und das folgende Fenster wird angezeigt. Außerdem können Sie den Schritt auch auf einem Gerät ausführen, auf dem OCI CLI installiert ist.

    Cloud Shell

  2. Prüfen Sie die OCI-CLI-Version mit dem Befehl OCI –version. Stackmonitoringbefehle werden auf OCI-CLI 3.XX oder höher ausgeführt.

  3. Create a JSON file named parameters.json in the cloud shell under any directory. Kopieren Sie die unten angegebene JSON, und ersetzen Sie "", "", "" durch die entsprechenden Parameter. Die Details der zu ändernden Parameter finden Sie in der Tabelle "JSON-Eingabeparameter":

    {
        "discoveryType": "ADD",
        "discoveryClient": "host-discovery",
        "compartmentId": "<Compartment-ID>",
        "discoveryDetails": {
          "agentId": "<Agent-ID>",
          "resourceType": "HOST",
          "resourceName": "<HostName or IP Address>",
          "properties": {
            "propertiesMap": {}
          }
        }
    }
    

    JSON-Eingabeparameter

    Eingabefeld Beschreibung
    compartmentId Compartment-OCID, in der sich die Compute-Instanz befindet.
    agentId OCID des Management Agent, der die Ressource überwacht.
    resourceName Der vollqualifizierte Domainname (FQDN) des Hosts innerhalb von Stackmonitoring.
  4. Nachdem Sie die obige JSON-Datei gespeichert haben, führen Sie den folgenden Befehl aus, indem Sie den Parameter <path_to_JSON_file> durch den tatsächlichen Pfad der JSON-Datei ersetzen, die im vorherigen Schritt erstellt wurde. Mit dem Befehl pwd können Sie den JSON-Dateipfad abrufen.

    oci stack-monitoring discovery-job create --compartment-id "your-compartment-id" --from-json file://< path_to_JSON_file>

    Discovery-Job"

  5. Der Prozess kann bis zu 5-10 Minuten dauern. Nachdem Sie das OCI-Portal aktualisiert haben, können Sie das Stackmonitoring aktiviert und das vollständige Dashboard auf der Seite "Stackmonitoring" anzeigen. Nach dem Hochstufen ist der Ressourcentyp der Compute-Instanz ein Host.

    Dashboard für Stackmonitoring

  6. Prüfen Sie den Status des Promotionjobs unter Ressourcen-Discovery, um zu prüfen, ob die Ressourcen erfolgreich ermittelt wurden.

    SM-Agent-Liste

  7. Wählen Sie im Stackmonitoring-Dashboard den Ressourcenblock aus. Daraufhin wird eine Liste der Compute-Instanzen und Hosts angezeigt, für die Sie das Monitoring aktiviert haben.

    SM Liste 2

  8. Wählen Sie den gewünschten Host aus der Liste. Die detaillierte Ansicht der Metriken und Tabellen, die für diesen bestimmten Host angezeigt werden, wird angezeigt.

    SM-Agent - Überblick

    Hostinformationen und -metriken werden auf der Seite mit den Ressourcendetails als Diagramme und Tabellen angezeigt.

    Hauptseite - Diagramm 1

    Hauptseite - Diagramm 2

    Hauptseite - Diagramm 3

    Sie können das belegte Dateisystem (GBs) und die Dateisystemauslastung (%) auswählen, um genauere Informationen über den im Host vorhandenen Speicher abzurufen. Die Tabellenansicht stellt alle Metriken in einem Tabellenstil/-format bereit.

    Hauptseitentabelle

    Nachdem Sie die spezifischen Informationen der Instanzen ausgewählt haben, werden sie sowohl in Prozent als auch in GB angezeigt. Jedes der auf dem Hostrechner dargestellten Dateisysteme wird mit den Einhängepunkten im Tabellenformat dargestellt.

    Datenträger-Tabellen-Infor

Aufgabe 4: Alarme aktivieren

  1. Wenn die Metriken auf der Seite "Ressourcendetails" für die Hosts angezeigt werden, navigieren Sie zu Observability and Management, Monitoring, Alarmstatus, um einen Alert für bestimmte Metriken abzurufen.

  2. Klicken Sie auf Alarm erstellen, und geben Sie dann den Namen und den Schweregrad des Alarms ein. Wählen Sie das Host-Compartment, den Namespace "oracle appmgmt", den Ressourcengruppenhost, und Sie können den Metriknamen aus der Dropdown-Liste auswählen.

  3. Wählen Sie je nach Anforderung die Metrik "Verwendetes Dateisystem" oder "Dateisystemauslastung", den Intervallzeitraum und die Statistik aus.

  4. Nachdem Sie die Metriken ausgewählt haben, wählen Sie die Metrikdimension aus.

    • Um einen bestimmten Host anzugeben, wählen Sie "agentHostName" und dann im Dropdown-Menü den Dimensionswert für den Host aus.

    • Klicken Sie anschließend auf Zusätzliche Dimension, wählen Sie "fileSystemName", und wählen Sie dann den Dimensionswert für den Mount Point aus, für den Sie einen Alert auslösen möchten.

  5. Legen Sie in der Triggerregel für den Abschnitt die Bedingung fest, dass der Alarm ausgelöst wird. Beispiel: Für agentHostName - "XXXX" und "fileSystemName" - "/Dev" mit Statistiken - "mean". Wenn der Dateisystemspeicher mehr als 90% erreicht, lösen Sie einen Alert für "speicher voll" aus.

  6. Wählen Sie im Abschnitt "Alarmbenachrichtigungen definieren" den Zielservice "Benachrichtigung" und das Thema, in dem Sie die E-Mail-Adresse angegeben haben, an die Sie Alerts für diesen bestimmten Alarm erhalten möchten. Weitere Informationen zur Benachrichtigung und Erstellung von Themen finden Sie hier.

  7. Außerdem können Sie das Nachrichtenformat auswählen, um eine bessere Alert-Formatierung zu erhalten. Aktivieren Sie das Kontrollkästchen Wiederholungsbenachrichtigung, wenn Sie kontinuierliche Alerts für dieselben Metriken erhalten möchten.

  8. Speichern Sie den Alarm.

    Alarm 1

    Alarm 2

    Alarm 3

  9. Sobald die definierte Regel mit der Metrik übereinstimmt, wird der Alarm ausgelöst. Im Folgenden finden Sie den Beispielscreenshot eines Metrikalarms:

    Alarm 5

    Mit den erweiterten Metriken der OCI-Stackmonitoring- und Alarmfunktionen können Sie Ihre Computing-Infrastruktur überwachen, insbesondere im Speichersektor. Sie können auch weitere Features der Stacküberwachung für verschiedene Services untersuchen.

Danksagungen

Weitere Lernressourcen

Sehen Sie sich andere Übungen zu docs.oracle.com/learn an, oder greifen Sie auf weitere kostenlose Lerninhalte im Oracle Learning YouTube-Kanal zu. Besuchen Sie außerdem die Website education.oracle.com/learning-explorer, um Oracle Learning Explorer zu werden.

Produktdokumentation finden Sie im Oracle Help Center.