Infrastrukturwartung

Oracle Cloud Infrastructure führt routinemäßige Data Center-Wartung auf der physischen Infrastruktur für Compute-Instanzen aus. Diese Wartung umfasst Aufgaben wie das Upgrade und Ersetzen von Hardware oder die Durchführung einer Wartung, die den Hostbetrieb unterbricht. Dieses Thema enthält Details zu Infrastrukturwartung, Migrationsoptionen und Statusmetriken, mit denen Sie die Infrastrukturwartung überwachen können.

Mit Compute-Infrastruktur-Zustandsmetriken können Sie den Status Ihrer Instanzen während der Wartung überwachen.

Hinweis

Informationen zum dedizierten VM-Hosts finden Sie unter Wartungsneustartmigration für dedizierten VM-Hosts verwalten.

Wartungsaktionen

Oracle Cloud Infrastructure unterstützt eine Vielzahl von Wartungsaktionen für Compute-Instanzen, einschließlich Livemigration, geplante Wartung, Neuerstellung an Ort und Stelle und manuelle Migration. Die Wartungsaktion hängt von Eigenschaften wie der Ausprägung ab, die von der Instanz verwendet wird.

Livemigration (keine Ausfallzeit)

Live-Migration ist ein Mechanismus zum Verschieben einer VM von einem physischen Server auf einen anderen, während die VM noch ausgeführt wird. Während einer Livemigration wird die Quell-VM-Instanz weiterhin ausgeführt, wenn der Compute-Service Arbeitsspeicher und alle virtuellen Komponenten in die neue Ziel-VM-Instanz kopiert. Wenn die Kopie abgeschlossen ist, gibt es nur eine leichte Pause, die normalerweise in zehn Millisekunden gemessen wird, wenn das System zur neuen VM wechselt. Disruption ist minimal.

Geplante Wartung (keine Ausfallzeit)

Bei der geplanten Wartung wird ein Datum festgelegt, an dem eine Instanz auf einen neuen Host verschoben wird. Wenn Sie die Neustartmigration verwenden, wird die Instanz gestoppt, zu einem fehlerfreien Host migriert und neu gestartet. Während der Migration kommt es zu einer kurzen Ausfallzeit. Sie können steuern, wann die Ausfallzeit eintritt, indem Sie die Instanz proaktiv vor dem Fälligkeitsdatum der Wartung per Neustartmigration migrieren. In seltenen Fällen ist eine Neustartmigration nicht möglich, und die Instanz wird beendet.

Neuerstellung (lange Ausfallzeit)

Mit dieser Wartungsaktion wird die Instanz nicht verschoben. Zur geplanten Zeit wird die Instanz gestoppt, auf derselben physischen Hardware neu erstellt und neu gestartet. Während des Wartungsprozesses kommt es zu einer Ausfallzeit von mehreren Stunden.

Bei einer In-Place-Neuerstellung werden Instanzeigenschaften beibehalten, die mit der physischen Hardware verbunden sind, wie der MAC-Adresse oder der universellen ID-Nummer. Bei einer In-Place-Neuerstellung können Sie außerdem die lokal angeschlossene NVMe-basierte SSD auf einer DenseIO-Instanz beibehalten.

Wenn Sie die Ausfallzeit für VMs minimieren möchten und die lokal angehängte NVMe-basierte SSD löschen können, können Sie die Instanz vor der geplanten Wartung proaktiv neu starten. Die Instanz wird per Neustartmigration auf einen fehlerfreien Host migriert, und die SSD wird endgültig gelöscht. Während der Migration kommt es zu einer kurzen Ausfallzeit.

Manuelle Migration

Bei VM-Instanzen, bei denen die vorherigen Aktionen nicht verfügbar sind, müssen Sie die Instanz manuell verschieben. Bei dieser Methode müssen Sie die Instanz löschen (beenden) und eine neue Instanz aus dem beibehaltenen Boot-Volume starten. Instanzen, die zusätzliche VNICs, sekundäre IP-Adressen, angehängte Remoteblock-Volumes oder ein aktiviertes Trusted Platform Module (TPM) aufweisen oder zu einem Backend-Set eines Load Balancers gehören, erfordern zusätzliche Schritte.

In seltenen Fällen ist ein Recovery einer VM-Instanz auf demselben physischen Host nicht möglich. Oracle Cloud Infrastructure benachrichtigt Sie, dass Sie die Instanz innerhalb von 14 Tagen löschen (beenden). Wenn Sie die Instanz nicht vor Ablauf der Frist löschen, deaktiviert Oracle Cloud Infrastructure die Instanz am Fristende und löscht sie innerhalb der nächsten sieben Tage. Das Boot-Volume und das angehängte Remotedaten-Volume werden beibehalten.

Geplante Wartung

Instanzen mit geplanter Wartung identifizieren

Wenn eine Instanz eine Neustartmigration oder eine Neuerstellung unterstützt, klicken Sie auf die Registerkarte Wartung. Die Seite "Wartungsdetails" gibt an, wann die geplante Wartung gestartet werden soll. Start- und Endzeit der Wartung werden in der Spalte Geplanter Start angezeigt. Bei Instanzen, die nur eine manuelle Migration unterstützen, sendet Oracle Cloud Infrastructure eine Benachrichtigung, und auf der Seite mit den Wartungsdetails wird ein Wartungsereignis angezeigt.

Um die Instanzen mit einer geplanten Wartung zu identifizieren, führen Sie einen der folgenden Schritte aus:

Mit der Konsole: So prüfen Sie, welche Instanzen im aktuellen Compartment für eine Wartung geplant sind
  1. Öffnen Sie das Navigationsmenü, und klicken Sie auf Compute. Klicken Sie unter Compute auf Instanzwartung.

    Eine Liste der Instanzen, die für die Wartung geplant sind, wird angezeigt.

  2. Klicken Sie dann auf die gewünschte Instanz und dann auf die Registerkarte Wartung für die Instanz. Dieses Start- und Enddatum und diese Zeiten werden für alle Wartungsereignisse angezeigt.
Mit der API: So prüfen Sie, welche Instanzen in einem Compartment für eine Wartung geplant sind

Verwenden Sie den Vorgang InstanceMaintenanceEvents, um Ereignisse aufzulisten. Geben Sie ein Compartment-Feld an, um alle Instanzen mit Wartungsereignissen in einem bestimmten Compartment aufzulisten. Filtern Sie Ergebnisse mit Optionen wie instanceAction oder lifecycleState, um die Suche einzugrenzen.

Mit der Suche: So finden Sie alle Instanzen, die für eine Wartung geplant sind
  1. Wählen Sie in der oberen Navigationsleiste Nach Ressourcen, Services, Dokumentation und Marketplace suchen, Erweiterte Ressourcenabfrage aus.
  2. Klicken Sie auf Beispielabfrage auswählen und dann auf Alle Instanzen abzufragen, bei denen ein geplanter Wartungsneustart bevorsteht.

    Im Folgenden finden Sie eine Beispielabfrage:

    query
      instancemaintenanceevent resources
        where (timeWindowStart > 'Now' && lifecycleState = 'SCHEDULED')
  3. Klicken Sie auf Suchen.

Eine Liste mit übereinstimmenden Instanzen wird angezeigt.

Eine Instanz ist nicht mehr von einem Wartungsereignis betroffen, wenn die Registerkarte Wartung leer ist.

Verlängerung der Wartungsfrist

Sie können das Wartungsfälligkeitsdatum für Instanzen verlängern, die für die Wartung oder Beendigung geplant sind. Eine Fristverlängerung wird für die Wartung der Neustartmigration unterstützt. Die Fristverlängerung wird normalerweise für VM- und Bare Metal-Instanzen mit Standard- oder Flex-Ausprägungen geplant. OCI bestimmt den letztmöglichen Zeitpunkt, bis zu dem das Fälligkeitsdatum verlängert werden kann.

Konsole verwenden: So verlängern Sie das Fälligkeitsdatum der Wartung für eine Instanz
  1. Rufen Sie das Navigationsmenü auf, und wählen Sie Compute aus. Wählen Sie unter Compute die Option Instanzen aus.
  2. Klicken Sie in der gewünschten Instanz auf die Registerkarte Wartung und dann auf Neu planen.
  3. Klicken Sie auf Frist verlängern.
  4. Wählen Sie in dem Feld Neuer Termin ein neues Datum und eine neue Uhrzeit.
  5. Klicken Sie auf Änderungen speichern.

    Das Fälligkeitsdatum der Wartung wird verlängert. Binnen 24 Stunden nach dem Fälligkeitsdatum der Wartung wird die Instanz gestoppt, auf einen fehlerfreien Host migriert und neu gestartet. Während der Migration kommt es zu einer kurzen Ausfallzeit.

API verwenden: So verlängern Sie das Fälligkeitsdatum der Wartung für eine Instanz
  1. Prüfen Sie mit dem GetInstanceMaintenanceReboot-Vorgang, bis wann das Fälligkeitsdatum maximal verlängert werden kann.
  2. Verlängern Sie das Fälligkeitsdatum für die Wartung wie folgt:

    • VMs und Bare-Metal-Instanzen: Verwenden Sie den Vorgang InstanceAction, und übergeben Sie den Wert REBOOTMIGRATE als auszuführende Aktion. Geben Sie im Attribut timeScheduled das aktualisierte Fälligkeitsdatum an.
    • VMs: Verwenden Sie den Vorgang UpdateInstance, und übergeben Sie das aktualisierte Fälligkeitsdatum im Attribut timeMaintenanceRebootDue.

    Das Fälligkeitsdatum der Wartung wird verlängert. Binnen 24 Stunden nach dem Fälligkeitsdatum der Wartung wird die Instanz gestoppt, auf einen fehlerfreien Host migriert und neu gestartet. Während der Migration kommt es zu einer kurzen Ausfallzeit.

Instanzen wiederherstellen

Wenn die zugrunde liegende Infrastruktur für eine Instanz fehlerhaft ist, versucht Oracle Cloud Infrastructure automatisch, die Instanz wiederherzustellen. Die Wartungsaktion hängt vom Instanztyp ab.

  • Virtual-Machine-(VM-)Instanzen: Wenn möglich, wird die Instanz pro Livemigration zu einem fehlerfreien physischen Host migriert. Wenn keine Livemigration möglich ist, wird die Instanz je nach Ausprägung neu gestartet oder neu erstellt.
  • Bare-Metal-Instanzen: Wenn möglich, wird die Instanz pro Neustartmigration zu einem fehlerfreien physischen Host migriert. Wenn die Neustartmigration nicht möglich ist, müssen Sie die Instanz manuell migrieren.

Geplante Wartung für VM-Instanzen

Wenn sich ein Infrastrukturwartungsereignis auf VM-Instanzen auswirkt, migriert Oracle Cloud Infrastructure live unterstützte VM-Instanzen vom physischen VM-Host, der gewartet werden muss, zu einem neuen VM-Host mit minimaler Unterbrechung ausgeführter Instanzen.

Wenn eine VM-Instanz nicht Per Livemigration migriert werden oder keine Livemigration unterstützt, plant Oracle Cloud Infrastructure ein Wartungsfälligkeitsdatum innerhalb von 14 bis 16 Tagen und sendet Ihnen eine Benachrichtigung, die den erforderlichen Wartungsaktionstyp beschreibt, wie z.B. Neustartmigration. Eine Livemigration ist möglicherweise nicht erfolgreich, wenn eines der folgenden Ereignisse während der Migration auftritt: Es ist zu viel Aktivität auf der Instanz vorhanden, eine Änderung an der Instanz wird mit der API vorgenommen, oder ein interner Fehler tritt auf, der nicht mit der Instanz zusammenhängt.

Wenn eine VM-Instanz für eine Wartung geplant ist, können Sie die Instanz vor dem Fälligkeitsdatum der geplanten Wartung jederzeit proaktiv neu starten. Mit einer proaktiven Neustartmigration können Sie steuern, wie und wann Anwendungen ausfallen. Wenn Sie die Instanz vor dem Fälligkeitsdatum nicht proaktiv neu booten, wird die Instanz je nach Ausprägung entweder per Neustart migriert oder an Ort neu erstellt.

Von Kunden verwaltete Wartung für VM-Instanzen wird auf Standard- und DenseIO-Instanz-Ausprägungen unterstützt, einschließlich Plattformimages und benutzerdefinierten Images, die außerhalb von Oracle Cloud Infrastructure importiert wurden.

Bei Standardausprägungen und DenseIO können Sie das Wartungsfälligkeitsdatum verlängern.

Hinweis

In einigen Fällen, wie bei einem sicherheitsbezogenen Wartungsereignis, können Sie das Datum möglicherweise nicht verlängern.

Nach einer Migration wird die Instanz standardmäßig in denselben Lebenszyklusstatus wiederhergestellt wie vor dem Wartungsereignis. Wenn Sie über einen alternativen Prozess verfügen, um die Instanz wiederherzustellen, können Sie optional festlegen, dass die Instanz gestoppt bleibt, nachdem sie per Neustartmigration auf fehlerfreie Hardware migriert wurde.

Geplante Wartung für Bare-Metal-Instanzen

Wenn ein Infrastrukturwartungsereignis Bare-Metal-Instanzen betrifft, migriert Oracle Cloud Infrastructure neustart unterstützte Bare-Metal-Instanzen vom physischen Host, der gewartet wird, zu einem fehlerfreien Host. Oracle Cloud Infrastructure plant ein Fälligkeitsdatum für eine Wartung innerhalb von 14 bis 16 Tagen und sendet Ihnen eine Benachrichtigung mit dem erforderlichen Wartungsaktionstyp, z.B. Neustartmigration. Binnen 24 Stunden nach dem Wartungsfälligkeitsdatum wird die Bare-Metal-Instanz gestoppt, zu einem fehlerfreien Host migriert und neu gestartet. Während der Migration kommt es zu einer kurzen Ausfallzeit.

Wenn eine Bare-Metal-Instanz gewartet werden soll, können Sie die Instanz vor dem Fälligkeitsdatum der geplanten Wartung jederzeit proaktiv neu starten. Mit einem proaktiven Neustart können Sie steuern, wie und wann Anwendungen ausfallen. Wenn Sie die Instanz nicht proaktiv vor dem Fälligkeitsdatum neu starten, wird die Instanz für Sie per Neustart migriert.

Die Neustartmigration für Bare-Metal-Instanzen wird auf Standardinstanzausprägungen unterstützt, die Linux-basierte Plattformimages verwenden. Die Neustartmigration für Bare-Metal-Instanzen wird nicht für Instanzen unterstützt, die Windows oder benutzerdefinierte Images, abgeschirmte Instanzen oder Instanzen mit sekundären VNICs verwenden, die auf physischer NIC mit Index 1 erstellt und konfiguriert wurden. Sie wird auch nicht für Instanzen unterstützt, die nicht den Standardbefehl sanboot im iPXE-Skript verwenden.

Bei Standardausprägungen können Sie das Fälligkeitsdatum der Wartung verlängern.

Wenn Sie keinen Neustart vor der geplanten Zeit durchführen, migriert Oracle Cloud Infrastructure die Instanz oder erstellt sie neu. Nach einer Migration wird die Instanz standardmäßig in denselben Lebenszyklusstatus wiederhergestellt wie vor dem Wartungsereignis. Wenn Sie über einen alternativen Prozess verfügen, um die Instanz wiederherzustellen, können Sie optional festlegen, dass die Instanz gestoppt bleibt, nachdem sie per Neustartmigration auf fehlerfreie Hardware migriert wurde.

VM-Recovery aufgrund eines Infrastrukturfehlers

Wenn die zugrunde liegende Infrastruktur einer VM-Instanz aufgrund von Software- oder Hardwareproblemen ausfallen, versucht Oracle Cloud Infrastructure automatisch, die Instanz wiederherzustellen.

Standard-VM-Instanzen werden mit einer Neustartmigration wiederhergestellt. Dabei wird die VM automatisch auf einem fehlerfreien Host wiederherstellt, unabhängig davon, ob es sich dabei um den ursprünglichen oder einen anderen physischen Host handelt. Der VM-Fehler wird innerhalb einer Minute nach dem Auftreten erkannt. Wenn der Host nicht sofort wiederhergestellt werden kann, wird die VM auf einen anderen fehlerfreien Host verschoben. In diesem Szenario beginnt der Prozess für Migration zu und Neustart auf einem fehlerfreien Host automatisch innerhalb von fünf Minuten. Beim Neustart werden Instanzeigenschaften wie private und ephemere öffentliche IP-Adressen, angehängte Block-Volumes und VNICs beibehalten.

DenseIO-VM-Instanzen werden wiederhergestellt, indem die Instanz auf demselben physischen Host neu gestartet wird. Wenn das Recovery einer DenseIO-Instanz auf demselben physischen Host nicht möglich war, benachrichtigt Oracle Cloud Infrastructure Sie, die Instanz innerhalb von 14 Tagen neu zu migrieren oder zu löschen (beenden). Wenn die Neustartmigration verwendet wird, gehen die lokalen NVMe-Daten weiterhin verloren. Wenn Sie die Instanz nicht vor Ablauf der Frist löschen, deaktiviert Oracle Cloud Infrastructure die Instanz am Fristende und löscht sie innerhalb der nächsten sieben Tage. Das Boot-Volume und das angehängte Remotedaten-Volume werden beibehalten.

Oracle Cloud Infrastructure benachrichtigt Sie per E-Mail oder Ankündigungen über alle Fehlerereignisse der VM-Infrastruktur unter Angabe des Status der ausgeführten Recovery-Aktion. Sie können auch die Instanzstatusmetrik überwachen, um unerwartete Neustarts zu verfolgen.

Sie können festlegen, dass Ihre VMs nicht automatisch neu gestartet werden, indem Sie Instanzen so konfigurieren, dass sie gestoppt bleiben, nachdem sie wiederhergestellt wurden.

Infrastruktur-Zustandsmetriken

Mit Metriken, Alarmen und Benachrichtigungen können Sie den Wartungsstatus der Infrastruktur überwachen, auf der Ihre Compute-Instanzen ausgeführt werden. Die primären Metriken, die bei der Infrastrukturwartung berücksichtigt werden müssen, sind die Infrastruktur-Zustandsmetriken:

  • Instanzstatus (hochgefahren/heruntergefahren): Mit der Metrik instance_status können Sie prüfen, ob eine VM-Instanz im Status "Wird ausgeführt" verfügbar (hochgefahren) oder nicht verfügbar (heruntergefahren) ist. Wenn die Instanz länger als 30 Minuten nicht verfügbar ist, wenden Sie sich an den Support.
  • Instanzwartungsstatus: Mit der Metrik maintenance_status können Sie überwachen, ob eine VM- oder Bare Metal-Instanz für die geplante Infrastrukturwartung geplant ist.
  • Zustandsstatus einer Bare-Metal-(Bare-Metal-)Infrastruktur: Mit dieser Metrik health_status können Sie den Zustand der Infrastruktur für Bare-Metal-(Bare-Metal-)Instanzen überwachen, einschließlich Hardwarekomponenten wie CPU und Speicher.

Instanzstatus- und Wartungsbenachrichtigungen in der Konsole anzeigen

Sie können den Instanzstatus und Benachrichtigungen über den Wartungsneustart in der Konsole auf der Seite "Instanzdetails" anzeigen. So zeigen Sie diese Felder an:

  1. Rufen Sie das Navigationsmenü auf, und wählen Sie Compute aus. Wählen Sie unter Compute die Option Instanzen aus.
  2. Klicken Sie auf die gewünschte Instanz.
  3. Auf der Registerkarte Instanzinformationen im Abschnitt Instanzdetails finden Sie diese Informationen im Feld Instanzstatus und im Feld Wartungsneustart.
    Hinweis

    Das Feld "Instanzstatus" wird nur angezeigt, wenn die Instanz im letzten Monat nicht verfügbar war.