Workload überwachen

Machen Sie sich mit einem Überwachungsprozess für alle Oracle Cloud Infrastructure-Services vertraut, und übernehmen Sie ihn. Der Monitoring-Service verwendet Metriken zum Überwachen von Ressourcen und Alarmen, um Sie zu benachrichtigen, wenn Metriken alarmspezifische Trigger erfüllen.

Vorgangsmetriken analysieren

Netzwerkarchitekt, Infrastrukturarchitekt

Definieren, erfassen und analysieren Sie Vorgangsmetriken, um Einblick in Ereignisse zu erhalten.

Oracle Cloud Infrastructure Monitoring-Service bietet die erforderlichen Erkenntnisse zum Zustand Ihrer Ressourcen, zur Optimierung der Performance Ihrer Anwendungen und zur Reaktion auf Anomalien in Echtzeit. Sie können Alarme so festlegen, dass Sie in Echtzeit auf wichtige Änderungen in Ihrer Cloud-Infrastruktur und -Services hingewiesen werden, sodass Sie schnell geeignete Aktionen ausführen können.

Integritätsprüfungen definieren

Cloud Architect, Infrastructure Architect

Mit dem Oracle Cloud Infrastructure Health Checks-Service erhalten Benutzer ein hochfrequentiertes externes Monitoring, um die Verfügbarkeit und Performance von öffentlich zugänglichen Services zu bestimmen, einschließlich gehosteten Websites, API-Endpunkten oder externen Load Balancern.
Verwenden Sie Oracle Cloud Infrastructure Health Checks, um sicherzustellen, dass Sie alle Verfügbarkeitsprobleme, die sich auf Ihre Kunden auswirken, sofort kennen.

Compute-Services überwachen

Infrastructure Architect

Stellen Sie sicher, dass Ihr Betriebsteam Compute-Services-Metriken verwendet und anwendet.

Mit Metriken, Alarmen und Benachrichtigungen können Sie Folgendes überwachen:

  • Compute-Instanz: Überwachen Sie Zustand, Kapazität und Performance Ihrer Compute-Instanzen.
  • Infrastrukturzustand: Integrität, Kapazität und Performance Ihrer Compute-Bare-Metal-Instanzen überwachen
  • Oracle Cloud Infrastructure Functions: Überwachen Sie Zustand, Kapazität und Performance von Funktionen, die Sie in Oracle Cloud Infrastructure Functions bereitgestellt haben.
  • Datenbankintegrität: Überwachen Sie Zustand, Kapazität und Performance Ihrer Datenbankservices.

Überwachen der Netzwerke

Netzwerkarchitekt, Infrastrukturarchitekt

Nehmen Sie ein Verfahren an, bei dem Metriken an verschiedenen Netzwerkendpunkten angewendet werden. Sie können Metriken für das interne virtuelle Cloud-Netzwerk (VCN) sowie für Konnektivität (Oracle Cloud Infrastructure FastConnect und IPsec-VPN) oder Load Balancer verwenden.

Mit Metriken, Alarmen und Benachrichtigungen können Sie Folgendes überwachen:

  • VNIC-Metriken: Überwachen Sie Zustand, Kapazität und Performance Ihrer Networking-Service-VNICs (virtuelle Netzwerkschnittstellenkarten).
  • FastConnect-Metriken: Überwachen Sie Zustand, Kapazität und Performance der Verbindung zwischen Ihrem On-Premise-Netzwerk und dem VCN (Oracle Cloud Infrastructure FastConnect-Verbindung).
  • VPN Connect-Metriken: Überwachen Sie Zustand, Kapazität und Performance der Verbindung zwischen Ihrem On-Premise-Netzwerk und dem VCN (auch als IPSec-VPN bezeichnet).
  • Servicegatewaymetriken: Überwachen Sie den Zustand, die Kapazität und die Performance Ihrer Servicegateways, mit denen On-Premise-Hosts oder VCN-Hosts privat auf Oracle-Services (wie Object Storage und Autonomous Database) zugreifen können, ohne die Ressourcen für das öffentliche Internet verfügbar zu machen.
  • Load Balancing-Metriken: Überwachen Sie Zustand, Kapazität und Performance Ihrer Load Balancer, die als Vermittler für den Datenverkehr zwischen Clients und Ihren Anwendungsservern fungieren.
  • Customer Premises Equipment: Überwachen Sie Zustand, Kapazität und Performance der Grenzgeräte in Ihrem Netzwerk, die mit Oracle Cloud Infrastructure (OCI) verbunden sind.
  • Aktivieren Sie VCN-Flowlogs, und erfassen Sie diese mit Oracle Cloud Logging Analytics, um sie zu analysieren und interessante Muster zu erkennen und bei Bedarf Erkenntnisse zu gewinnen.

Überwachen von Daten

Cloud Architect, Infrastructure Architect, Security Architect

Überwachen Sie Speicherservices, die Sie zum Speichern von Daten verwenden, indem Sie Metriken, Alarme und Benachrichtigungen verwenden.
  • Block-Volume-Metriken: Durchsatz und Vorgänge von Block-Volumes und Boot-Volumes überwachen.
  • Object Storage-Metriken: Größe und Anzahl der Objekte der Object Storage-Buckets überwachen.
  • Dateisystemmetriken: Überwachen Sie Zustand, Durchsatz, Anforderungen und Latenz der Dateisysteme und Mountziele.

Alarme für jede Metrik erstellen

DevOps Architect, Infrastructure Architect

Erstellen Sie ein Set von Alarmen für Ihre relevanten Servicemetriken. Erstellen Sie für jede Metrik, die von Ihren Ressourcen ausgegeben wird, Alarme, die das Ressourcenverhalten definieren.
  • Gefährdet. Die Ressource ist gefährdet und kann nicht ausgeführt werden, wie mit Metrikwerten angegeben.
  • Nicht optimal. Die Performance der Ressource ist nicht optimal, wie mit Metrikwerten angegeben.
  • Die Ressource ist hoch oder unten. Die Ressource ist entweder nicht zugänglich oder wird nicht ausgeführt.

Alarme optimieren

DevOps Architect, Infrastructure Architect

Prüfen Sie die Alarme regelmäßig, z.B. wöchentlich, um eine optimale Konfiguration zu gewährleisten. Kalibrieren Sie den Schwellenwert, Dringlichkeit und Benachrichtigungsdetails jedes Alarms, einschließlich Methode, Häufigkeit und Zielgruppe.
Metrikschwellenwerte, die zu breit sind, werden unnötig gewarnt, während zu enge Schwellenwerte die Zeit für Korrekturmaßnahmen vor einem Ausfall reduzieren.

Eine optimale Alarmkonfiguration umfasst die folgenden Faktoren:

  • Kritikalität der Ressource.
  • Angemessenes Ressourcenverhalten. Prüfen Sie das Verhalten einzeln und innerhalb des Kontextes des Serviceökosystems. Prüfen Sie Fluktuationen von Metrikwerten für einen bestimmten Zeitraum, und ändern Sie die Schwellenwerte dann nach Bedarf.
  • Annehmbare Anzahl von Benachrichtigungen. Prüfen Sie die Benachrichtigungsmethode (wie E-Mail oder PagerDuty), die entsprechenden Empfänger und die Häufigkeit der wiederholten Benachrichtigungen.

Service-Logging aktivieren

DevOps Architect, Infrastructure Architect, Security Architect

Servicelogs sind Logs, die von Oracle Cloud Infrastructure-(OCI-)Services ausgegeben werden, wie API-Gateway, Ereignisse, Funktionen, Load Balancing, Object Storage und VCN-Flowlogs. Jeder dieser unterstützten Services verfügt über eine Logs-Ressource, mit der Sie das Logging für diesen Service aktivieren oder deaktivieren können.
Aktivieren Sie sie nur, wenn kritische Diagnoseinformationen erforderlich sind, die beschreiben, wie Ressourcen ausgeführt werden und wie darauf zugegriffen wird.

Überlegen Sie die Aufnahme von Serviceprotokollen mit Oracle Cloud Logging Analytics, um bessere Einblicke zu erhalten und Muster und Trends nach Bedarf detailliert zu analysieren.

OCI Operations Insights aktivieren

Infrastructure Architect

Oracle Cloud Infrastructure (OCI) Operations Insights ist ein nativer OCI-Service, der einen vollständigen Einblick in die Ressourcenauslastung und Kapazität autonomer Datenbanken bietet.

Operations Insights besteht aus den folgenden integrierten Anwendungen:

  • Capacity Planning
  • Oracle SQL Warehouse

Oracle Cloud Guard aktivieren

DevOps Architect, Infrastructure Architect, Security Architect

Oracle Cloud Guard ist ein Service, mit dem Kunden Sicherheit in Oracle Cloud überwachen, identifizieren und pflegen können. Prüfen Sie mit dem Service Ihre Oracle Cloud Infrastructure-Ressourcen auf Sicherheitsschwachstellen im Zusammenhang mit der Konfiguration und Ihre Operatoren und Benutzer auf riskante Aktivitäten.

Stellen Sie sicher, dass Oracle Cloud Guard auf der Root-Ebene Ihres Mandanten aktiviert ist, um alle Compartments zu überwachen.

Auditing konfigurieren

DevOps Architect, Infrastructure Architect, Security Architect

Der Oracle Cloud Infrastructure Audit-Service zeichnet Aufrufe von allen unterstützten öffentlichen Oracle Cloud Infrastructure-(OCI-)Endpunkten der Anwendungsprogrammierung automatisch als Logereignisse auf. Derzeit unterstützen alle Services das Logging durch Audit.

Prüfen Sie Folgendes bei der Konfiguration des Auditing:

  • Stellen Sie sicher, dass die Auditaufbewahrung auf 365 Tage festgelegt ist.
  • Wenn Sie Drittanbietertools haben, die auf OCI-Auditdaten zugreifen müssen, konfigurieren Sie einen Service-Connector, um die OCI-Auditdaten in Oracle Cloud Infrastructure Object Storage zu kopieren.
  • Stellen Sie sicher, dass der Aufbewahrungszeitraum im Speicher-Bucket entsprechend konfiguriert ist.
  • Ziehen Sie die Aufnahme einer Teilmenge von Auditlogs mit OCI Log Analytics in Erwägung, um bessere Einblicke und detaillierte Analysen von Mustern und Trends nach Bedarf zu erhalten.