Infrastrukturwartung

Oracle Cloud Infrastructure führt routinemäßige Data-Center-Wartung auf der physischen Infrastruktur für Compute-Instanzen durch. Diese Wartung umfasst Aufgaben wie das Upgrade und Ersetzen von Hardware oder die Durchführung einer Wartung, die den Hostbetrieb unterbricht. Dieses Thema enthält Details zu Infrastrukturwartung, Migrationsoptionen und Statusmetriken, mit denen Sie die Infrastrukturwartung überwachen können.

Mit Compute-Infrastruktur-Zustandsmetriken können Sie den Status Ihrer Instanzen während der Wartung überwachen.

Hinweis

Informationen zu dedizierten VM-Hosts finden Sie unter Wartungsneustartmigration für dedizierte VM-Hosts verwalten.

Wartungsaktionen

Oracle Cloud Infrastructure unterstützt eine Vielzahl von Wartungsaktionen für Compute-Instanzen, einschließlich Livemigration, geplante Wartung, Neuerstellung vor Ort und manuelle Migration. Die Wartungsaktion hängt von Eigenschaften wie der Ausprägung ab, die von der Instanz verwendet wird.

Live-Migration (keine Ausfallzeit)

Die Live-Migration ist ein Mechanismus zum Verschieben einer VM von einem physischen Server auf einen anderen, während die VM noch ausgeführt wird. Während einer Livemigration wird die Quell-VM-Instanz weiterhin ausgeführt, wenn der Compute-Service Speicher und alle virtuellen Komponenten in die neue Ziel-VM-Instanz kopiert. Wenn die Kopie abgeschlossen ist, gibt es nur eine kleine Pause, die normalerweise in zehn Millisekunden gemessen wird, wenn das System zur neuen VM wechselt. Die Störung ist minimal.

Geplante Wartung (kurze Ausfallzeit)

Bei einer geplanten Wartung wird ein Datum festgelegt, an dem eine Instanz auf einen neuen Host verschoben wird. Mit der Neustartmigration wird die Instanz gestoppt, zu einem fehlerhaften Host migriert und neu gestartet. Während der Migration kommt es zu einer kurzen Ausfallzeit. Sie können steuern, wann die Ausfallzeit eintritt, indem Sie die Instanz proaktiv vor dem Fälligkeitsdatum der Wartung per Neustartmigration migrieren. In seltenen Fällen ist eine Neustartmigration nicht möglich, und die Instanz wird beendet.

Neuerstellung an Ort und Stelle (lange Ausfallzeit)

Mit dieser Wartungsaktion wird die Instanz nicht verschoben. Zur geplanten Zeit wird die Instanz gestoppt, auf derselben physischen Hardware neu erstellt und neu gestartet. Während des Wartungsprozesses kommt es zu einer Ausfallzeit von mehreren Stunden.

Bei einer In-Place-Neuerstellung werden Instanzeigenschaften beibehalten, die mit der physischen Hardware verbunden sind, wie der MAC-Adresse oder der universellen ID-Nummer. Bei einer In-Place-Neuerstellung können Sie außerdem die lokal angeschlossene NVMe-basierte SSD auf einer DenseIO-Instanz beibehalten.

Wenn Sie die Ausfallzeit für VMs minimieren möchten und die lokal angehängte NVMe-basierte SSD löschen können, können Sie die Instanz vor der geplanten Wartung proaktiv neu starten. Die Instanz wird per Neustartmigration auf einen fehlerfreien Host migriert, und die SSD wird endgültig gelöscht. Während der Migration kommt es zu einer kurzen Ausfallzeit.

Manuelle Migration

Bei VM-Instanzen, bei denen die vorherigen Aktionen nicht verfügbar sind, müssen Sie die Instanz manuell verschieben. Bei dieser Methode müssen Sie die Instanz löschen (beenden) und eine neue Instanz aus dem beibehaltenen Boot-Volume starten. Instanzen, die zusätzliche VNICs, sekundäre IP-Adressen, angehängte Remoteblock-Volumes oder ein aktiviertes Trusted Platform Module (TPM) aufweisen oder zu einem Backend-Set eines Load Balancers gehören, erfordern zusätzliche Schritte.

In seltenen Fällen ist das Recovery einer VM-Instanz auf demselben physischen Host nicht möglich. Oracle Cloud Infrastructure benachrichtigt Sie, die Instanz innerhalb von 14 Tagen zu löschen (beenden). Wenn Sie die Instanz nicht vor Ablauf der Frist löschen, deaktiviert Oracle Cloud Infrastructure die Instanz am Fristende und löscht sie innerhalb der nächsten sieben Tage. Das Boot-Volume und das angehängte Remotedaten-Volume werden beibehalten.

Instanzen mit geplanter Wartung identifizieren

Wenn eine Instanz eine Neustartmigration oder einen Neuaufbau unterstützt, klicken Sie auf die Registerkarte Wartung. Die Seite mit den Wartungsdetails gibt an, wann die geplante Wartung gestartet werden soll. Die Start- und Endzeit der Wartung werden in der Spalte Geplant für Start angezeigt. Bei Instanzen, die nur die manuelle Migration unterstützen, erhalten Sie eine Benachrichtigung von Oracle Cloud Infrastructure. Auf der Seite mit den Wartungsdetails wird ein Wartungsereignis angezeigt.

Um die Instanzen mit einer geplanten Wartung zu identifizieren, führen Sie einen der folgenden Schritte aus:

Mit der Konsole: So prüfen Sie, welche Instanzen im aktuellen Compartment für eine Wartung geplant sind
  1. Öffnen Sie das Navigationsmenü, und klicken Sie auf Compute. Klicken Sie unter Compute auf Instanzwartung.

    Eine Liste der für die Wartung geplanten Instanzen wird angezeigt.

  2. Klicken Sie auf die gewünschte Instanz, und klicken Sie auf die Registerkarte Wartung für die Instanz. Beginn- und Enddatum/-zeiten werden für alle Wartungsereignisse angezeigt.
Mit der API: So prüfen Sie, welche Instanzen in einem Compartment für eine Wartung geplant sind

Verwenden Sie den Vorgang InstanceMaintenanceEvents, um Ereignisse aufzulisten. Geben Sie ein Compartment-Feld an, um alle Instanzen mit Wartungsereignissen in einem bestimmten Compartment aufzulisten. Filtern Sie Ergebnisse mit Optionen wie instanceAction oder lifecycleState, um die Suche einzugrenzen.

Mit der Suche: So finden Sie alle Instanzen, die für eine Wartung geplant sind
  1. Klicken Sie in der oberen Navigationsleiste auf Nach Ressourcen, Services, Dokumentation und Marketplace und wählen Sie Erweiterte Ressourcenabfrage aus.
  2. Klicken Sie auf Beispielabfrage auswählen und dann auf Alle Instanzen abfragen, bei denen ein geplanter Wartungsneustart bevorsteht.

    Im Folgenden finden Sie eine Beispielabfrage:

    query
      instancemaintenanceevent resources
        where (timeWindowStart > 'Now' && lifecycleState = 'SCHEDULED')
  3. Klicken Sie auf Suchen.

Eine Liste der übereinstimmenden Instanzen wird angezeigt.

Eine Instanz wird nicht mehr von einem Wartungsereignis beeinflusst, wenn die Registerkarte Wartung leer ist.

Wartungsfrist verlängern

Sie können das Wartungstermin für Instanzen verlängern, die für die Wartung oder den Austritt geplant sind. Eine Fristverlängerung wird für VM- und Bare-Metal-Instanzen mit Standardausprägungen unterstützt. OCI bestimmt den letztmöglichen Zeitpunkt, bis zu dem das Fälligkeitsdatum verlängert werden kann.

Konsole verwenden: So verlängern Sie das Fälligkeitsdatum der Wartung für eine Instanz
  1. Öffnen Sie das Navigationsmenü, und klicken Sie auf Compute. Klicken Sie unter Compute auf Instanzen.
  2. Klicken Sie auf die gewünschte Instanz, klicken Sie auf die Registerkarte Wartung und dann auf Neu planen.
  3. Klicken Sie auf Frist verlängern.
  4. Wählen Sie im Feld Neuer Termin ein neues Datum und eine neue Uhrzeit aus.
  5. Klicken Sie auf Änderungen speichern.

    Das Fälligkeitsdatum der Wartung wird verlängert. Binnen 24 Stunden nach dem Fälligkeitsdatum der Wartung wird die Instanz gestoppt, auf einen fehlerfreien Host migriert und neu gestartet. Während der Migration kommt es zu einer kurzen Ausfallzeit.

API verwenden: So verlängern Sie das Fälligkeitsdatum der Wartung für eine Instanz
  1. Prüfen Sie mit dem GetInstanceMaintenanceReboot-Vorgang, bis wann das Fälligkeitsdatum maximal verlängert werden kann.
  2. Verlängern Sie das Fälligkeitsdatum für die Wartung wie folgt:

    • VMs und Bare-Metal-Instanzen: Verwenden Sie den Vorgang InstanceAction, und übergeben Sie den Wert REBOOTMIGRATE als auszuführende Aktion. Geben Sie im Attribut timeScheduled das aktualisierte Fälligkeitsdatum an.
    • VMs: Verwenden Sie den Vorgang UpdateInstance, und übergeben Sie das aktualisierte Fälligkeitsdatum im Attribut timeMaintenanceRebootDue.

    Das Fälligkeitsdatum der Wartung wird verlängert. Binnen 24 Stunden nach dem Fälligkeitsdatum der Wartung wird die Instanz gestoppt, auf einen fehlerfreien Host migriert und neu gestartet. Während der Migration kommt es zu einer kurzen Ausfallzeit.

Instanzen wiederherstellen

Wenn die zugrunde liegende Infrastruktur für eine Instanz fehlerhaft ist, versucht Oracle Cloud Infrastructure automatisch, die Instanz wiederherzustellen. Die Wartungsaktion hängt vom Instanztyp ab.

  • Virtual-Machine-(VM-)Instanzen: Wenn möglich, wird die Instanz per Livemigration zu einem fehlerfreien physischen Host migriert. Wenn keine Livemigration möglich ist, wird die Instanz je nach Ausprägung neu gestartet oder neu erstellt.
  • Bare-Metal-Instanzen: Wenn möglich, wird die Instanz per Neustartmigration zu einem fehlerfreien physischen Host migriert. Wenn die Neustartmigration nicht möglich ist, müssen Sie die Instanz manuell migrieren.

Geplante Wartung für VM-Instanzen

Wenn sich ein Infrastrukturwartungsereignis auf VM-Instanzen auswirkt, werden unterstützte VM-Instanzen von Oracle Cloud Infrastructure live migriert vom physischen VM-Host, der gewartet werden muss, mit minimaler Unterbrechung der ausgeführten Instanzen zu einem neuen VM-Host.

Wenn eine VM-Instanz nicht live migriert werden kann oder keine Livemigration unterstützt, plant Oracle Cloud Infrastructure ein Wartungsfälligkeitsdatum innerhalb von 14 bis 16 Tagen und sendet Ihnen eine Benachrichtigung über den erforderlichen Wartungsaktionstyp, wie eine Neustartmigration. Eine Livemigration ist möglicherweise nicht erfolgreich, wenn eines der folgenden Ereignisse während der Migration auftritt: Es ist zu viel Aktivität auf der Instanz vorhanden, eine Änderung an der Instanz wird mit der API vorgenommen, oder ein interner Fehler tritt auf, der nicht mit der Instanz zusammenhängt.

Wenn eine VM-Instanz gewartet werden soll, können Sie die Instanz vor dem Fälligkeitsdatum der geplanten Wartung jederzeit proaktiv neu starten. Mit einer proaktiven Migration nach einem Neustart können Sie steuern, wie und wann Anwendungen ausfallen. Wenn Sie die Instanz nicht proaktiv neu starten, um sie vor dem Fälligkeitsdatum zu migrieren, wird die Instanz je nach Ausprägung entweder per Neustart migriert oder in-place neu erstellt.

Von Kunden verwaltete Wartung für VM-Instanzen wird auf Standard- und DenseIO- Ausprägungen unterstützt, einschließlich Plattformimages und benutzerdefinierter Images, die außerhalb von Oracle Cloud Infrastructure importiert wurden.

Bei Standard- und DenseIO-Ausprägungen können Sie das Fälligkeitsdatum der Wartung verlängern.

Hinweis

In einigen Fällen, z.B. bei einem sicherheitsbezogenen Wartungsereignis, können Sie das Datum möglicherweise nicht verlängern.

Nach einer Migration wird die Instanz standardmäßig in denselben Lebenszyklusstatus wiederhergestellt wie vor dem Wartungsereignis. Wenn Sie über einen alternativen Prozess verfügen, um die Instanz wiederherzustellen, können Sie optional festlegen, dass die Instanz gestoppt bleibt, nachdem sie per Neustartmigration auf fehlerfreie Hardware migriert wurde.

Geplante Wartung für Bare-Metal-Instanzen

Wenn sich ein Infrastrukturwartungsereignis auf Bare-Metal-Instanzen auswirkt, migriert Oracle Cloud Infrastructure unterstützte Bare-Metal-Instanzen per Neustart vom zu wartenden physischen Host zu einem fehlerfreien Host. Oracle Cloud Infrastructure plant ein Fälligkeitsdatum für die Wartung innerhalb von 14 bis 16 Tagen und sendet Ihnen eine Benachrichtigung mit dem erforderlichen Wartungsaktionstyp, z.B. Neustartmigration. Binnen 24 Stunden nach dem Wartungsfälligkeitsdatum wird die Bare-Metal-Instanz gestoppt, zu einem fehlerfreien Host migriert und neu gestartet. Während der Migration kommt es zu einer kurzen Ausfallzeit.

Wenn eine Bare-Metal-Instanz gewartet werden soll, können Sie die Instanz vor dem Fälligkeitsdatum der geplanten Wartung jederzeit proaktiv neu starten. Mit einem proaktiven Neustart können Sie steuern, wie und wann Anwendungen ausfallen. Wenn Sie die Instanz nicht proaktiv vor dem Fälligkeitsdatum neu starten, wird die Instanz für Sie per Neustart migriert.

Die Neustartmigration für Bare-Metal-Instanzen wird auf Standardinstanzausprägungen unterstützt, die Linux-basierte Plattformimages verwenden. Die Neustartmigration für Bare-Metal-Instanzen wird nicht für Instanzen unterstützt, die Windows oder benutzerdefinierte Images, abgeschirmte Instanzen oder Instanzen mit sekundären VNICs verwenden, die auf physischer NIC mit Index 1 erstellt und konfiguriert wurden. Sie wird auch nicht für Instanzen unterstützt, die nicht den Standardbefehl sanboot im iPXE-Skript verwenden.

Bei Standardausprägungen können Sie das Fälligkeitsdatum der Wartung verlängern.

Wenn Sie keinen Neustart vor der geplanten Zeit vornehmen, migriert Oracle Cloud Infrastructure die Instanz oder erstellt sie neu. Nach einer Migration wird die Instanz standardmäßig in denselben Lebenszyklusstatus wiederhergestellt wie vor dem Wartungsereignis. Wenn Sie über einen alternativen Prozess verfügen, um die Instanz wiederherzustellen, können Sie optional festlegen, dass die Instanz gestoppt bleibt, nachdem sie per Neustartmigration auf fehlerfreie Hardware migriert wurde.

VM-Recovery aufgrund eines Infrastrukturfehlers

Wenn die zugrunde liegende Infrastruktur einer VM-Instanz aufgrund von Software- oder Hardwareproblemen ausfällt, versucht Oracle Cloud Infrastructure automatisch, die Instanz wiederherzustellen.

Standard-VM-Instanzen werden mit einer Neustartmigration wiederhergestellt. Dabei wird die VM automatisch auf einem fehlerfreien Host wiederherstellt, unabhängig davon, ob es sich dabei um den ursprünglichen oder einen anderen physischen Host handelt. Der VM-Fehler wird innerhalb einer Minute nach dem Auftreten erkannt. Wenn der Host nicht sofort wiederhergestellt werden kann, wird die VM auf einen anderen fehlerfreien Host verschoben. In diesem Szenario beginnt der Prozess für Migration zu und Neustart auf einem fehlerfreien Host automatisch innerhalb von fünf Minuten. Beim Neustart werden Instanzeigenschaften wie private und ephemere öffentliche IP-Adressen, angehängte Block-Volumes und VNICs beibehalten.

DenseIO-VM-Instanzen werden wiederhergestellt, indem Sie die Instanz auf demselben physischen Host neu starten. Wenn ein Recovery einer DenseIO-Instanz auf demselben physischen Host nicht möglich ist, benachrichtigt Oracle Cloud Infrastructure Sie, dass die Instanz innerhalb von 14 Tagen neu gestartet oder gelöscht (beendet) werden muss. Wenn die Neustartmigration verwendet wird, gehen die lokalen NVMe-Daten weiterhin verloren. Wenn Sie die Instanz nicht vor Ablauf der Frist löschen, deaktiviert Oracle Cloud Infrastructure die Instanz am Fristende und löscht sie innerhalb der nächsten sieben Tage. Das Boot-Volume und das angehängte Remotedaten-Volume werden beibehalten.

Oracle Cloud Infrastructure benachrichtigt Sie per E-Mail oder Ankündigungen über alle Fehlerereignisse der VM-Infrastruktur unter Angabe des Status der ausgeführten Recovery-Aktion. Sie können auch die Instanzstatusmetrik überwachen, um unerwartete Neustarts zu verfolgen.

Sie können festlegen, dass Ihre VMs nicht automatisch neu gestartet werden, indem Sie Instanzen so konfigurieren, dass sie gestoppt bleiben, nachdem sie wiederhergestellt wurden.

Infrastruktur-Zustandsmetriken

Mit Metriken, Alarmen und Benachrichtigungen können Sie den Wartungsstatus der Infrastruktur überwachen, auf der Ihre Compute-Instanzen ausgeführt werden. Die primären Metriken, die bei der Infrastrukturwartung berücksichtigt werden müssen, sind die Infrastruktur-Zustandsmetriken:

  • Instanzstatus (Hochgefahren/Heruntergefahren): Mit der Metrik instance_status können Sie prüfen, ob eine VM-Instanz verfügbar (Hochgefahren) oder nicht verfügbar (Heruntergefahren) ist, wenn sie den Status "Wird ausgeführt" hat. Wenn die Instanz länger als 30 Minuten nicht verfügbar ist, wenden Sie sich an den Support.
  • Instanzwartungsstatus: Mit der Metrik maintenance_status können Sie überwachen, ob eine VM-Instanz oder eine Bare-Metal-Instanz für eine Infrastrukturwartung geplant ist.
  • Zustandsstatus der Bare-Metal-Infrastruktur: Mit der Metrik health_status können Sie den Zustand der Infrastruktur für Bare-Metal-Instanzen überwachen, einschließlich Hardwarekomponenten wie CPU und Arbeitsspeicher.

Instanzstatus- und Wartungsbenachrichtigungen in der Konsole anzeigen

Sie können den Instanzstatus und Benachrichtigungen zum Wartungsneustart in der Konsole auf der Seite "Instanzdetails" anzeigen. So zeigen Sie diese Felder an:

  1. Öffnen Sie das Navigationsmenü, und klicken Sie auf Compute. Klicken Sie unter Compute auf Instanzen.
  2. Klicken Sie auf die gewünschte Instanz.
  3. Sie finden diese Informationen auf der Registerkarte Instanzinformationen im Abschnitt Instanzdetails in den Feldern Instanzstatus und Wartungsneustart.
    Hinweis

    Das Feld "Instanzstatus" wird nur angezeigt, wenn die Instanz im letzten Monat nicht verfügbar war.