Compute überwachen

In diesem Abschnitt werden die verschiedenen Methoden und Metriken erläutert, mit denen Sie die Rechenleistung in Oracle AI Data Platform Workbench überwachen können.

Spark-UI anzeigen

Sie können die Spark-Web-UI anzeigen, um den Status und den Ressourcenverbrauch Ihrer Allzweck-Compute-Cluster zu überwachen.

  1. Navigieren Sie zu Ihrem Workspace, und klicken Sie auf Compute.
  2. Klicken Sie auf Ihr Cluster und dann auf die Registerkarte Spark-UI.
  3. Optional: Klicken Sie oben rechts auf die Popup-Schaltfläche, um die Spark-UI in einem separaten Fenster anzuzeigen.

Treiber- und Worker-Logs anzeigen

Sie können die Treiber- und Worker-Logs Ihrer All Purpose Compute-Cluster zur Fehlerbehebung oder zum Debugging anzeigen.

  1. Navigieren Sie zu Ihrem Workspace, und klicken Sie auf Compute.
  2. Klicken Sie auf das Cluster und dann auf die Registerkarte Logs.
  3. Filtern Sie Ihre Protokolle, um spezifischere Informationen anzuzeigen.

    Logfilter für Treiber- und Worker-Logs, Clusternotiz, Worker-Nr., Logebene, Zeitrahmen

  4. Klicken Sie auf Symbol "Herunterladen" Herunterladen, um eine lokale Kopie Ihrer gefilterten Daten zu speichern.

Metriken anzeigen

Sie können die Infrastrukturmetriken Ihrer Compute-Cluster zur Fehlerbehebung oder für Größenanpassungen überwachen.

Sie können Status und Historie für die folgenden Metriken anzeigen:
  • CPU-Auslastung
  • Arbeitsspeicherauslastung
  • Datenträger-Lesevorgang
  • Datenträger-Schreibvorgang
  • Dateisystemauslastung
  • CPU-Auslastung des Garbage Collectors
  • Netzwerk empfangen
  • Netzwerk übertragen
  • Aktive Aufgaben
  • Gesamte nicht erfolgreiche Aufgaben
  • Aufgaben gesamt
  • Gesamte abgeschlossene Aufgaben
  • Gesamtanzahl der Aufgaben
  • Gelesene Bytes für Shuffles gesamt
  • Schreibbyte für Shuffle gesamt
  • Gesamtaufgabendauer in Sekunden
  • SQL: Gleichzeitige Peak-Abfragen
  • SQL: Gleichzeitige Peak-Verbindungen
  1. Navigieren Sie zu Ihrem Workspace, und klicken Sie auf Compute.
  2. Klicken Sie auf das Cluster und dann auf die RegisterkarteMetriken.

    Registerkarte "Compute-Metriken" geöffnet. Die Dropdown-Liste "Intervall" für die Speicherauslastung ist geöffnet, wobei "Automatisch" ausgewählt ist.

  3. Wählen Sie Zeitrahmen mit dem Filter Datum aus, um Metriken über einen bestimmten Zeitraum anzuzeigen.
  4. Wählen Sie in der Dropdown-Liste Intervall eine Option aus, um Informationen für eine bestimmte Metrik zu filtern.

Ereignislogs anzeigen

Sie können die Ereignislogs anzeigen, um verschiedene clusterbezogene Vorgänge zu überwachen, wie das Erstellen von Clustern, Neustarts von Clustern, die Ausführung von Init-Skripten oder monatliche Wartungsupdates.

Oracle AI Data Platform Workbench speichert die letzten 14 Tage der Ereignislogs.
  1. Navigieren Sie zu Ihrem Workspace, und klicken Sie auf Compute.
  2. Klicken Sie auf das Cluster und dann auf die Registerkarte Ereignislogs.
  3. Filtern Sie Ihre Protokolle, um spezifischere Informationen anzuzeigen.

    Dropdown-Liste "Ereignistyp anzeigen" mit allen angezeigten Optionen öffnen

Notizbücher anzeigen

Sie können alle Notizbücher anzeigen, an die das aktuelle Cluster angehängt ist. Diese Ansicht enthält die Anzahl der Notizbücher, den Notizbuchstatus und bietet Ihnen eine schnelle Möglichkeit, zu den entsprechenden Notizbüchern zu navigieren.

  1. Navigieren Sie zu Ihrem Workspace, und klicken Sie auf Compute.
  2. Klicken Sie auf Ihr Cluster und dann auf die Registerkarte Notizbücher.

    Compute-Seite geöffnet mit hervorgehobener Registerkarte "Notizbücher"

    Der Notizbuchstatus lautet Aktiv, wenn Code aus diesem Notizbuch ausgeführt wird. Der Notizbuchstatus lautet Inaktiv, wenn kein Code aus diesem Notizbuch ausgeführt wird.

  3. Klicken Sie auf den Namen eines Notizbuchs, um es aufzurufen.