Infrastrukturwartung

Oracle Cloud Infrastructure führt routinemäßige Data-Center-Wartung auf der physischen Infrastruktur für Compute-Instanzen durch. Diese Wartung umfasst Aufgaben wie das Upgrade und Ersetzen von Hardware oder die Durchführung einer Wartung, die den Hostbetrieb unterbricht. Dieses Thema enthält Details zu Infrastrukturwartung, Migrationsoptionen und Statusmetriken, mit denen Sie die Infrastrukturwartung überwachen können.

Mit Compute-Infrastruktur-Zustandsmetriken können Sie den Status Ihrer Instanzen während der Wartung überwachen.

Hinweis

Informationen zu dedizierten VM-Hosts finden Sie unter Wartungsneustartmigration für dedizierte VM-Hosts verwalten.

Instanzen während einer geplanten Wartung wiederherstellen

Wenn die zugrunde liegende Infrastruktur für eine Instanz einer geplanten Wartung unterzogen werden muss, versucht Oracle Cloud Infrastructure nach Möglichkeit automatisch, die Instanz wiederherzustellen. Die Wartungsaktion hängt vom Instanztyp ab.

  • Virtual-Machine-(VM-)Instanzen: Wenn möglich, wird die Instanz per Livemigration zu einem fehlerfreien physischen Host migriert. Wenn keine Livemigration möglich ist, wird die Instanz je nach Ausprägung neu gestartet oder neu erstellt.
  • Bare-Metal-Instanzen: Wenn möglich, wird die Instanz per Neustartmigration zu einem fehlerfreien physischen Host migriert. Wenn die Neustartmigration nicht möglich ist, müssen Sie die Instanz manuell migrieren.

Geplante Wartung für VM-Instanzen

Wenn ein Infrastrukturwartungsereignis sich auf VM-Instanzen auswirkt, werden die unterstützten VM-Instanzen von Oracle Cloud Infrastructure per Livemigration vom zu wartenden physischen VM-Host zu einem fehlerfreien VM-Host mit nur einer geringfügigen Unterbrechung der ausgeführten Instanzen migriert.

Wenn eine VM-Instanz nicht per Livemigration migriert werden kann oder keine Livemigration unterstützt, plant Oracle Cloud Infrastructure ein Wartungsfälligkeitsdatum innerhalb von 14 bis 16 Tagen. Sie erhalten dann eine Benachrichtigung über den erforderlichen Wartungsaktionstyp, wie eine Neustartmigration. Eine Livemigration ist möglicherweise nicht erfolgreich, wenn eines der folgenden Ereignisse während der Migration auftritt: Es ist zu viel Aktivität auf der Instanz vorhanden, eine Änderung an der Instanz wird mit der API vorgenommen, oder ein interner Fehler tritt auf, der nicht mit der Instanz zusammenhängt.

Wenn für eine VM-Instanz eine Wartung geplant ist, können Sie die Instanz vor der geplanten Wartungsfälligkeit jederzeit proaktiv neu starten (bzw. stoppen und starten). Mit einem proaktiven Neustart können Sie steuern, wie und wann Anwendungen ausfallen. Wenn Sie die Instanz nicht proaktiv vor dem Fälligkeitsdatum neu starten, wird die Instanz je nach Ausprägung entweder per Neustart migriert oder in-place neu erstellt.

Von Kunden verwaltete Wartung für VM-Instanzen wird auf Standard- und DenseIO- Ausprägungen unterstützt, einschließlich Plattformimages und benutzerdefinierter Images, die außerhalb von Oracle Cloud Infrastructure importiert wurden.

Bei Standardausprägungen können Sie das Fälligkeitsdatum der Wartung verlängern.

Wenn Sie keinen Neustart vor der geplanten Zeit vornehmen, migriert Oracle Cloud Infrastructure die Instanz oder erstellt sie neu. Nach einer Migration wird die Instanz standardmäßig in denselben Lebenszyklusstatus wiederhergestellt wie vor dem Wartungsereignis. Wenn Sie über einen alternativen Prozess verfügen, um die Instanz wiederherzustellen, können Sie optional festlegen, dass die Instanz gestoppt bleibt, nachdem sie per Neustartmigration auf fehlerfreie Hardware migriert wurde.

Geplante Wartung für Bare-Metal-Instanzen

Wenn sich ein Infrastrukturwartungsereignis auf Bare-Metal-Instanzen auswirkt, migriert Oracle Cloud Infrastructure unterstützte Bare-Metal-Instanzen per Neustart vom physischen Host, der gewartet werden muss, zu einem fehlerfreien Host. Oracle Cloud Infrastructure plant ein Fälligkeitsdatum für die Wartung innerhalb von 14 bis 16 Tagen und sendet Ihnen eine Benachrichtigung mit dem erforderlichen Wartungsaktionstyp, z.B. Neustartmigration. Binnen 24 Stunden nach dem Wartungsfälligkeitsdatum wird die Bare-Metal-Instanz gestoppt, zu einem fehlerfreien Host migriert und neu gestartet. Während der Migration kommt es zu einer kurzen Ausfallzeit.

Wenn eine Bare-Metal-Instanz gewartet werden soll, können Sie die Instanz vor dem Fälligkeitsdatum der geplanten Wartung jederzeit proaktiv neu starten. Mit einem proaktiven Neustart können Sie steuern, wie und wann Anwendungen ausfallen. Wenn Sie die Instanz nicht proaktiv vor dem Fälligkeitsdatum neu starten, wird die Instanz für Sie per Neustart migriert.

Die Neustartmigration für Bare-Metal-Instanzen wird auf Standardinstanzausprägungen unterstützt, die Linux-basierte Plattformimages verwenden. Die Neustartmigration für Bare-Metal-Instanzen wird nicht für Instanzen unterstützt, die Windows oder benutzerdefinierte Images, abgeschirmte Instanzen oder Instanzen mit sekundären VNICs verwenden, die auf physischer NIC mit Index 1 erstellt und konfiguriert wurden. Sie wird auch nicht für Instanzen unterstützt, die nicht den Standardbefehl sanboot im iPXE-Skript verwenden.

Bei Standardausprägungen können Sie das Fälligkeitsdatum der Wartung verlängern.

Wenn Sie keinen Neustart vor der geplanten Zeit vornehmen, migriert Oracle Cloud Infrastructure die Instanz oder erstellt sie neu. Nach einer Migration wird die Instanz standardmäßig in denselben Lebenszyklusstatus wiederhergestellt wie vor dem Wartungsereignis. Wenn Sie über einen alternativen Prozess verfügen, um die Instanz wiederherzustellen, können Sie optional festlegen, dass die Instanz gestoppt bleibt, nachdem sie per Neustartmigration auf fehlerfreie Hardware migriert wurde.

Instanzen mit geplanter Wartung identifizieren

Wenn eine Instanz die Wartungsaktionen der Livemigration, der Neustartmigration oder der In-Place-Neuerstellung unterstützt, gibt ein Datum im Feld Wartungsneustart für die Instanz (in der Konsole, der CLI und den SDKs verfügbar) an, dass die geplante Wartung geplant ist. Bei Instanzen, die nur die manuelle Migration unterstützen, erhalten Sie eine Benachrichtigung von Oracle Cloud Infrastructure. Im Feld Wartungsneustart wird jedoch kein Datum angezeigt.

Um die Instanzen mit einer geplanten Wartung zu identifizieren, führen Sie einen der folgenden Schritte aus:

Mit der Konsole: So prüfen Sie, welche Instanzen im aktuellen Compartment für eine Wartung geplant sind
  1. Öffnen Sie das Navigationsmenü, und klicken Sie auf Compute. Klicken Sie unter Compute auf Instanzen.

    Wenn für die Instanz eine Wartung geplant ist und sie proaktiv neu gestartet werden kann, wird neben dem Instanznamen ein Warnsymbol angezeigt.

  2. Klicken Sie auf die gewünschte Instanz, und prüfen Sie das Feld Wartungsneustart für die Instanz. In diesem Feld werden Datum und Startzeit der Wartung angezeigt.
Mit der API: So prüfen Sie, welche Instanzen in einem Compartment für eine Wartung geplant sind

Verwenden Sie den ListInstances-Vorgang. Das Feld timeMaintenanceRebootDue für die Instanz gibt Datum und Startzeit der Wartung zurück.

Mit der Suche: So finden Sie alle Instanzen, die für eine Wartung geplant sind
  1. Klicken Sie in der oberen Navigationsleiste auf Nach Ressourcen, Services, Dokumentation und Marketplace suchen und wählen Sie Erweiterte Ressourcenabfrage aus.
  2. Klicken Sie auf Beispielabfrage auswählen und dann auf Alle Instanzen abfragen, bei denen ein geplanter Wartungsneustart bevorsteht.
  3. Klicken Sie auf Suchen.

Eine Instanz wird nicht mehr von einem Wartungsereignis beeinflusst, wenn das Feld Wartungsneustart für die Instanz leer ist.

VM-Recovery aufgrund eines Infrastrukturfehlers

Wenn die zugrunde liegende Infrastruktur einer VM-Instanz aufgrund von Software- oder Hardwareproblemen ausfällt, versucht Oracle Cloud Infrastructure automatisch, die Instanz wiederherzustellen.

Standard-VM-Instanzen werden mit einer Neustartmigration wiederhergestellt. Dabei wird die VM automatisch auf einem fehlerfreien Host wiederherstellt, unabhängig davon, ob es sich dabei um den ursprünglichen oder einen anderen physischen Host handelt. Der VM-Fehler wird innerhalb einer Minute nach dem Auftreten erkannt. Wenn der Host nicht sofort wiederhergestellt werden kann, wird die VM auf einen anderen fehlerfreien Host verschoben. In diesem Szenario beginnt der Prozess für Migration zu und Neustart auf einem fehlerfreien Host automatisch innerhalb von fünf Minuten. Beim Neustart werden Instanzeigenschaften wie private und ephemere öffentliche IP-Adressen, angehängte Block-Volumes und VNICs beibehalten.

Dense I/O-VM-Instanzen werden wiederhergestellt, indem die Instanz auf demselben physischen Host neu gestartet wird. Wenn ein Recovery einer DenseIO-Instanz auf demselben physischen Host nicht möglich ist, benachrichtigt Oracle Cloud Infrastructure Sie, dass die Instanz innerhalb von 14 Tagen gelöscht (beendet) werden muss. Wenn Sie die Instanz nicht vor Ablauf der Frist löschen, deaktiviert Oracle Cloud Infrastructure die Instanz am Fristende und löscht sie innerhalb der nächsten sieben Tage. Das Boot-Volume und das angehängte Remotedaten-Volume werden beibehalten.

Oracle Cloud Infrastructure benachrichtigt Sie per E-Mail oder Ankündigungen über alle Fehlerereignisse der VM-Infrastruktur unter Angabe des Status der ausgeführten Recovery-Aktion. Sie können auch die Instanzstatusmetrik überwachen, um unerwartete Neustarts zu verfolgen.

Sie können festlegen, dass Ihre VMs nicht automatisch neu gestartet werden, indem Sie Instanzen so konfigurieren, dass sie gestoppt bleiben, nachdem sie wiederhergestellt wurden.

Infrastruktur-Zustandsmetriken

Mit Metriken, Alarmen und Benachrichtigungen können Sie den Wartungsstatus der Infrastruktur überwachen, auf der Ihre Compute-Instanzen ausgeführt werden. Die primären Metriken, die bei der Infrastrukturwartung berücksichtigt werden müssen, sind die Infrastruktur-Zustandsmetriken:

  • Instanzstatus (Hochgefahren/Heruntergefahren): Mit der Metrik instance_status können Sie prüfen, ob eine VM-Instanz verfügbar (Hochgefahren) oder nicht verfügbar (Heruntergefahren) ist, wenn sie ausgeführt wird. Wenn die Instanz länger als 30 Minuten nicht verfügbar ist, wenden Sie sich an den Support.
  • Instanzwartungsstatus: Mit der Metrik maintenance_status können Sie überwachen, ob eine VM-Instanz oder eine Bare-Metal-Instanz für eine Infrastrukturwartung geplant ist.
  • Zustandsstatus der Bare-Metal-Infrastruktur: Mit der Metrik health_status können Sie den Zustand der Infrastruktur für Bare-Metal-Instanzen überwachen, einschließlich Hardwarekomponenten wie CPU und Arbeitsspeicher.

Instanzstatus- und Wartungsbenachrichtigungen in der Konsole anzeigen

Sie können den Instanzstatus und Benachrichtigungen zum Wartungsneustart in der Konsole auf der Seite "Instanzdetails" anzeigen. So zeigen Sie diese Felder an:

  1. Öffnen Sie das Navigationsmenü, und klicken Sie auf Compute. Klicken Sie unter Compute auf Instanzen.
  2. Klicken Sie auf die gewünschte Instanz.
  3. Sie finden diese Informationen auf der Registerkarte Instanzinformationen im Abschnitt Instanzdetails in den Feldern Instanzstatus und Wartungsneustart.
    Hinweis

    Das Feld "Instanzstatus" wird nur angezeigt, wenn die Instanz im letzten Monat nicht verfügbar war.

Wartungsaktionen

Oracle Cloud Infrastructure unterstützt eine Vielzahl von Wartungsaktionen für Compute-Instanzen, einschließlich Neuerstellung, Livemigration, Neustartmigration und manueller Migration. Die Wartungsaktion hängt von Eigenschaften wie der Ausprägung ab, die von der Instanz verwendet wird.

In-Place-Neuerstellung

Mit dieser Wartungsaktion wird die Instanz nicht verschoben. Zur geplanten Zeit wird die Instanz gestoppt, auf derselben physischen Hardware neu erstellt und neu gestartet. Während des Wartungsprozesses kommt es zu einer Ausfallzeit von mehreren Stunden.

Bei einer In-Place-Neuerstellung werden Instanzeigenschaften beibehalten, die mit der physischen Hardware verbunden sind, wie der MAC-Adresse oder der universellen ID-Nummer. Bei einer In-Place-Neuerstellung können Sie außerdem die lokal angeschlossene NVMe-basierte SSD auf einer DenseIO-Instanz beibehalten.

Wenn Sie die Ausfallzeit für VMs minimieren möchten und die lokal angehängte NVMe-basierte SSD löschen können, können Sie die Instanz vor der geplanten Wartung proaktiv neu starten. Die Instanz wird per Neustartmigration auf einen fehlerfreien Host migriert, und die SSD wird endgültig gelöscht. Während der Migration kommt es zu einer kurzen Ausfallzeit.

Migrationswartungsaktionen

Die anderen drei Wartungsaktionen umfassen das Migrieren von Instanzen. Ausführliche Informationen zu den einzelnen Wartungsaktionen finden Sie unter Live, Neustart und manuelle Migration: Compute-Instanzen auf neuen Host verschieben. Oder klicken Sie auf einen der folgenden Links, um direkt zu den Details für diese Aktion zu gelangen.