Disaster-Recovery-Plan ausführen

Ein Disaster Recovery-(DR-)Plan kann entweder aus der Standby- oder der primären Private Cloud Appliance ausgeführt werden. Ein Failover-Plan wird jedoch immer vom Standby-System ausgeführt, da das primäre Rack in diesem Szenario heruntergefahren ist.

Ein Switchover kann zum Testen des Disaster-Recovery-Setups oder bei umfangreichen Wartungsarbeiten am primären System durchgeführt werden. Um beide Appliances nach einem Failover wieder in den normalen Betriebszustand zu versetzen, wird auf jedem System ein Postfailover-Plan ausgeführt, wenn die primäre App wieder online ist. Der Switchover-Plan enthält Postfailover-Schritte, sodass keine zusätzliche Ausführung des Postfailover-Plans erforderlich ist.

Durch die Ausführung eines DR-Plans werden Ressourcen zwischen Peer-Systemen und den primären Systemänderungen verschoben. Diese Ressourcen werden nicht automatisch auf das ursprüngliche Hostsystem zurückgesetzt. Um Ressourcen wieder in ihre ursprüngliche Umgebung zu verschieben, müssen Sie einen weiteren Switchover für die entsprechenden DR-Konfigurationen ausführen.

Switchover ausführen

Mit einem Switchover kann der Administrator Ressourcen von einem System entfernen, sodass sie offline gesetzt werden können, z.B. im Falle einer geplanten Wartung. Ein (zweiter) Switchover wird ebenfalls durchgeführt, um Ressourcen wieder auf das ursprüngliche Hostsystem zurückzusetzen, nachdem diese von einem Failover oder Switchover betroffen waren.

Service-CLI verwenden
  1. Suchen Sie die ID des Switchover-DR-Plans, den Sie ausführen möchten. Verwenden Sie drGetConfigs, um die DR-Konfiguration zu suchen und die zugehörigen DR-Pläne mit drListPlan anzuzeigen.

  2. Führen Sie in der Primär- oder Standby-Appliance den Switchover-DR-Plan mit dem Befehl drExecutePlan aus.

    Hinweis

    Um den Befehl im Nur-Check-Modus auszuführen, fügen Sie den Parameter checkOnly=True hinzu. Es werden nur die DR-Planschritte ausgeführt, die für den Nur-Check-Modus aktiviert sind.

    PCA-ADMIN> drExecutePlan planId=6e797d8b-7245-4d49-8e68-bf67f2d53041::sw1
    JobId: 92b4acc2-2dff-492c-9ba2-0a2ac058baa5
    Data: DrPlan id: 6e797d8b-7245-4d49-8e68-bf67f2d53041::sw1. Successfully started job for DR Plan Execute for config_id 6e797d8b-7245-4d49-8e68-bf67f2d53041, plan_name sw1
  3. Mit der Job-ID können Sie den Status des gestarteten Vorgangs prüfen.

    PCA-ADMIN> show Job id=92b4acc2-2dff-492c-9ba2-0a2ac058baa5
    Data:
      Id = 92b4acc2-2dff-492c-9ba2-0a2ac058baa5
      Type = Job
      Associated Work Request Id = c6cca56c-a1cc-421c-9ded-acf0e7cd9da2
      Done = false
      Name = OPERATION-EXECUTE_DR_PLAN
      Progress Message = DrPlan id: 6e797d8b-7245-4d49-8e68-bf67f2d53041::sw1. Successfully started job for DR Plan Execute for config_id 6e797d8b-7245-4d49-8e68-bf67f2d53041, plan_name sw1
      Run State = Active
      Transcript = Created job OPERATION
      Username = admin
      WorkItemIds 1 = id:e06881fc-ea57-4835-bb86-e1244d3787c3  type:WorkItem  name:
  4. Stellen Sie sicher, dass der Job erfolgreich abgeschlossen wird.

    PCA-ADMIN> show Job id=92b4acc2-2dff-492c-9ba2-0a2ac058baa5
    Data:
      Id = 92b4acc2-2dff-492c-9ba2-0a2ac058baa5
      Type = Job
      Associated Work Request Id = c6cca56c-a1cc-421c-9ded-acf0e7cd9da2
      Done = true
      Name = OPERATION-EXECUTE_DR_PLAN
      Progress Message = DrPlan id: 6e797d8b-7245-4d49-8e68-bf67f2d53041::sw1. DrPlan id: 6e797d8b-7245-4d49-8e68-bf67f2d53041::sw1. drexecuteplan succeeded for config [6e797d8b-7245-4d49-8e68-bf67f2d53041] Operation: [switchover] plan_name: [sw1]. Response: [Successfully completed checks for switchover for DR config_id 6e797d8b-7245-4d49-8e68-bf67f2d53041. Plan Execution Status: [precheck : pass , role_reversal_precheck : pass , stop_primary : norun , role_reversal : norun , start_standby : norun , cleanup_primary : norun , post_config : norun , ]]
      Run State = Succeeded
      Transcript = Created job OPERATION
      Username = admin
      WorkItemIds 1 = id:e06881fc-ea57-4835-bb86-e1244d3787c3  type:WorkItem  name:

    Nach erfolgreichem Abschluss wurden alle in der DR-Konfiguration enthaltenen Instanzen wiederhergestellt und werden auf der Standby-Appliance ausgeführt.

Service-Web-UI verwenden
  1. Öffnen Sie unter Disaster Recovery Service die Seite "DR-Konfigurationen". Klicken Sie in der Tabelle auf die Konfiguration, für die Sie ein Switchover ausführen möchten. Die Detailseite der DR-Konfiguration wird angezeigt.

  2. Klicken Sie im Abschnitt "Ressourcen" auf "Pläne".

  3. Öffnen Sie in der Spalte "Aktionen" das Schnellmenü (3 Punkte) für den Switchover-Plan Ihrer Wahl, und klicken Sie auf "Plan ausführen".

    Alternativ können Sie auf den DR-Plannamen klicken, um die zugehörige Detailseite anzuzeigen. Klicken Sie in der oberen rechten Ecke auf Plan ausführen.

  4. Wenn Sie dazu aufgefordert werden, wählen Sie, ob der vollständige Plan oder eine Teilmenge der Schritte im Modus Nur Prüfung ausgeführt werden soll.

    Wählen Sie "Bestätigen". Ein DR-Job wird gestartet. Nach erfolgreichem Abschluss wurden alle Schritte im Switchover-DR-Plan wie erwartet ausgeführt.

    Um den Fortschritt zu verfolgen, wählen Sie unter Disaster Recovery Service die Option Jobs aus. In der Tabelle "Jobs" wird der Status der einzelnen Jobs aufgeführt. Klicken Sie auf einen Datensatz in der Tabelle, um die Jobdetails anzuzeigen.

    Nach erfolgreichem Abschluss wurden alle in der DR-Konfiguration enthaltenen Instanzen wiederhergestellt und werden auf der Standby-Appliance ausgeführt.

Failover ausführen

Der native DR-Service bietet kein automatisches Failover. Ein Administrator muss bestätigen, dass die Primär-Appliance heruntergefahren ist, und den Failover-Plan von der Standby-Appliance ausführen. Ein Failover soll die Fortsetzung des Service ermöglichen, wenn das primäre System einen Ausfall aufweist.

Wenn eine Appliance heruntergefahren ist, meldet das Peer Rack einen Fehler mit einem Namen, der "peer connect" und die Rackseriennummer enthält. Mit der Service-CLI können Sie die Faultliste (list fault <parameters>) prüfen und die Details des Problems mit der Peerverbindung anzeigen. Beispiel:

PCA-ADMIN> show fault id=57701191-5764-480b-826c-38c4b1970dde
Data:
  Cause =  1742XC3024 : network is not in a CONNECTED state: CONNECTING
  Action = Please contact customer support for solution
  Health Exporter = peerconnect-checker
  Diagnosing Source = peer connect health checker
  Faulted Component Type = SOFTWARE
  Description = 1749XC302P-- 1742XC3024 : network is not in a CONNECTED state: CONNECTING
  Name = 1749XC302P--PCA-8000-UY--peerconnect
Service-CLI verwenden
  1. Suchen Sie die ID des Failover-DR-Plans, den Sie ausführen müssen. Verwenden Sie drGetConfigs, um die DR-Konfiguration zu suchen und die zugehörigen DR-Pläne mit drListPlan anzuzeigen.

  2. Führen Sie in der Standby-Appliance den Failover-DR-Plan mit dem Befehl drExecutePlan aus.

    Hinweis

    Um den Befehl im Nur-Check-Modus auszuführen, fügen Sie den Parameter checkOnly=True hinzu. Es werden nur die DR-Planschritte ausgeführt, die für den Nur-Check-Modus aktiviert sind.

    PCA-ADMIN> drExecutePlan planId=6e797d8b-7245-4d49-8e68-bf67f2d53041::fo1
    JobId: 49521287-c148-4791-9626-13190fce3d1d
    Data: DrPlan id: 6e797d8b-7245-4d49-8e68-bf67f2d53041::fo1. Successfully started job for DR Plan Execute for config_id 6e797d8b-7245-4d49-8e68-bf67f2d53041, plan_name fo1
  3. Mit der Job-ID können Sie den Status des gestarteten Vorgangs prüfen.

    PCA-ADMIN> show Job id=49521287-c148-4791-9626-13190fce3d1d
    Data:
      Id = 49521287-c148-4791-9626-13190fce3d1d
      Type = Job
      Associated Work Request Id = c8e3b554-a3ef-4e9b-a52c-c9a518f70974
      Done = false
      Name = OPERATION-EXECUTE_DR_PLAN
      Progress Message = DrPlan id: 6e797d8b-7245-4d49-8e68-bf67f2d53041::fo1. Successfully started job for DR Plan Execute for config_id 6e797d8b-7245-4d49-8e68-bf67f2d53041, plan_name fo1
      Run State = Active
      Transcript = Created job OPERATION
      Username = admin
      WorkItemIds 1 = id:d7a09483-ef2e-4e03-81bb-fed5ee661428  type:WorkItem  name:
  4. Stellen Sie sicher, dass der Job erfolgreich abgeschlossen wird.

    PCA-ADMIN> show Job id=49521287-c148-4791-9626-13190fce3d1d
    Data:
      Id = 49521287-c148-4791-9626-13190fce3d1d
      Type = Job
      Associated Work Request Id = c8e3b554-a3ef-4e9b-a52c-c9a518f70974
      Done = true
      Name = OPERATION-EXECUTE_DR_PLAN
      Progress Message = DrPlan id: 6e797d8b-7245-4d49-8e68-bf67f2d53041::fo1. DrPlan id: 6e797d8b-7245-4d49-8e68-bf67f2d53041::fo1. drexecuteplan succeeded for config [6e797d8b-7245-4d49-8e68-bf67f2d53041] Operation: [failover] plan_name: [fo1]. Response: [Successfully completed checks for failover for DR config_id 6e797d8b-7245-4d49-8e68-bf67f2d53041. Plan Execution Status: [precheck : pass , role_reversal_precheck : pass , role_reversal : pass , start_standby : pass , ]]
      Run State = Succeeded
      Transcript = Created job OPERATION
      Username = admin
      WorkItemIds 1 = id:d7a09483-ef2e-4e03-81bb-fed5ee661428  type:WorkItem  name:

    Nach erfolgreichem Abschluss wurden alle in der DR-Konfiguration enthaltenen Instanzen wiederhergestellt und werden auf der Standby-Appliance ausgeführt.

Service-Web-UI verwenden
  1. Öffnen Sie unter Disaster Recovery Service die Seite "DR-Konfigurationen". Klicken Sie in der Tabelle auf die Konfiguration, für die Sie ein Switchover ausführen möchten. Die Detailseite der DR-Konfiguration wird angezeigt.

  2. Klicken Sie im Abschnitt "Ressourcen" auf "Pläne".

  3. Öffnen Sie in der Spalte "Aktionen" das Schnellmenü (3 Punkte) für den Failover-Plan Ihrer Wahl, und klicken Sie auf "Plan ausführen".

    Alternativ können Sie auf den DR-Plannamen klicken, um die zugehörige Detailseite anzuzeigen. Klicken Sie in der oberen rechten Ecke auf Plan ausführen.

  4. Wenn Sie dazu aufgefordert werden, wählen Sie, ob der vollständige Plan oder eine Teilmenge der Schritte im Modus Nur Prüfung ausgeführt werden soll.

    Wählen Sie "Bestätigen". Ein DR-Job wird gestartet. Nach erfolgreichem Abschluss wurden alle Schritte im Switchover-DR-Plan wie erwartet ausgeführt.

    Um den Fortschritt zu verfolgen, wählen Sie unter Disaster Recovery Service die Option Jobs aus. In der Tabelle "Jobs" wird der Status der einzelnen Jobs aufgeführt. Klicken Sie auf einen Datensatz in der Tabelle, um die Jobdetails anzuzeigen.

    Nach erfolgreichem Abschluss wurden alle in der DR-Konfiguration enthaltenen Instanzen wiederhergestellt und werden auf der Standby-Appliance ausgeführt.

Postfailover-Vorgänge ausführen

Ein Postfailover wird nach einem Failover ausgeführt, wenn das System, bei dem ein Ausfall aufgetreten ist, wieder online gesetzt wird. Der Plan kann von einem der Peer-Systeme aus ausgeführt werden. Während des Postfailovers wird die DR-Konfiguration auf dem ausgefallenen primären System bereinigt. Das ursprüngliche Standby-System wird zur Primärdatenbank für die Ressourcen, die von der DR-Konfiguration abgedeckt werden. Dabei wird die ursprüngliche Primärdatenbank als neues Ziel für die DR-Datenreplikation verwendet.

Service-CLI verwenden
  1. Stellen Sie nach einem Failover sicher, dass die primäre Appliance wieder online und in einem fehlerfreien Zustand ist.

    Stellen Sie sicher, dass der Peering-Status aktiv ist und die Replikation aktiviert ist. Kein Rack sollte einen aktiven Fehler mit einem Namen melden, der "peer connect" enthält. (Prüfen Sie mit dem Service-CLI-Befehl list fault.)

  2. Suchen Sie die ID des Postfailover-DR-Plans, den Sie ausführen möchten. Verwenden Sie drGetConfigs, um die DR-Konfiguration zu suchen und die zugehörigen DR-Pläne mit drListPlan anzuzeigen.

  3. Führen Sie in der Primär- oder Standby-Appliance den Postfailover-DR-Plan mit dem Befehl drExecutePlan aus.

    Hinweis

    Für Postfailover-Vorgänge gilt der Modus "Nur prüfen" nicht.

    PCA-ADMIN> drExecutePlan planId=6e797d8b-7245-4d49-8e68-bf67f2d53041::pfo1
    JobId: 56d040ba-30a6-4bea-b924-78ebabed2626
    Data: DrPlan id: 6e797d8b-7245-4d49-8e68-bf67f2d53041::pfo1. Successfully started job for DR Plan Execute for config_id 6e797d8b-7245-4d49-8e68-bf67f2d53041, plan_name pfo1
  4. Mit der Job-ID können Sie den Status des gestarteten Vorgangs prüfen.

    PCA-ADMIN> show Job id=56d040ba-30a6-4bea-b924-78ebabed2626
    Data:
      Id = 56d040ba-30a6-4bea-b924-78ebabed2626
      Type = Job
      Associated Work Request Id = b4ad564b-e385-4688-94ff-11bf5267d72e
      Done = false
      Name = OPERATION-EXECUTE_DR_PLAN
      Progress Message = DrPlan id: 6e797d8b-7245-4d49-8e68-bf67f2d53041::pfo1. Successfully started job for DR Plan Execute for config_id 6e797d8b-7245-4d49-8e68-bf67f2d53041, plan_name pfo1
      Run State = Active
      Transcript = Created job OPERATION
      Username = admin
      WorkItemIds 1 = id:2e4db010-239e-41a1-aa0d-cb97167c64fc  type:WorkItem  name:
  5. Stellen Sie sicher, dass der Job erfolgreich abgeschlossen wird.

    PCA-ADMIN> show Job id=56d040ba-30a6-4bea-b924-78ebabed2626
    Data:
      Id = 56d040ba-30a6-4bea-b924-78ebabed2626
      Type = Job
      Associated Work Request Id = b4ad564b-e385-4688-94ff-11bf5267d72e
      Done = true
      Name = OPERATION-EXECUTE_DR_PLAN
      Progress Message = DrPlan id: 6e797d8b-7245-4d49-8e68-bf67f2d53041::pfo1. DrPlan id: 6e797d8b-7245-4d49-8e68-bf67f2d53041::pfo1. drexecuteplan succeeded for config [6e797d8b-7245-4d49-8e68-bf67f2d53041] Operation: [postfailover] plan_name: [pfo1]. Response: [Successfully completed checks for postfailover for DR config_id 6e797d8b-7245-4d49-8e68-bf67f2d53041. Plan Execution Status: [stop_primary : pass , cleanup_primary : pass , post_config : pass , ]]
      Run State = Succeeded
      Transcript = Created job OPERATION
      Username = admin
      WorkItemIds 1 = id:2e4db010-239e-41a1-aa0d-cb97167c64fc  type:WorkItem  name:

    Nach erfolgreichem Abschluss wurden alle Instanzen, die vom Switchover oder Failover betroffen sind, wiederhergestellt und werden auf der Appliance ausgeführt, in der sie zuvor gehostet wurden.

Service-Web-UI verwenden
  1. Stellen Sie nach einem Failover sicher, dass die primäre Appliance wieder online und in einem fehlerfreien Zustand ist.

    Stellen Sie sicher, dass der Peering-Status aktiv ist und die Replikation aktiviert ist. Kein Rack sollte einen aktiven Fehler mit einem Namen melden, der "peer connect" enthält. (Zeigen Sie aktive Fehler in der Service-CLI an.)

  2. Öffnen Sie unter Disaster Recovery Service die Seite "DR-Konfigurationen". Klicken Sie in der Tabelle auf die Konfiguration, für die Sie Postfailover-Vorgänge ausführen möchten. Die Detailseite der DR-Konfiguration wird angezeigt.

  3. Klicken Sie im Abschnitt "Ressourcen" auf "Pläne".

  4. Öffnen Sie in der Spalte "Aktionen" das Schnellmenü (3 Punkte) für den Postfailover-Plan Ihrer Wahl, und klicken Sie auf "Plan ausführen".

    Alternativ können Sie auf den DR-Plannamen klicken, um die zugehörige Detailseite anzuzeigen. Klicken Sie in der oberen rechten Ecke auf Plan ausführen.

  5. Wenn Sie dazu aufgefordert werden, klicken Sie auf "Bestätigen".

    Hinweis

    Für Postfailover-Vorgänge gilt der Modus "Nur prüfen" nicht.

    Ein DR-Job wird gestartet. Nach erfolgreichem Abschluss wurden alle Schritte im DR-Plan nach dem Failover wie erwartet ausgeführt.

    Um den Fortschritt zu verfolgen, wählen Sie unter Disaster Recovery Service die Option Jobs aus. In der Tabelle "Jobs" wird der Status der einzelnen Jobs aufgeführt. Klicken Sie auf einen Datensatz in der Tabelle, um die Jobdetails anzuzeigen.

    Wenn der Job erfolgreich abgeschlossen wurde, wurden alle Instanzen, die vom Switchover oder Failover betroffen sind, wiederhergestellt und werden auf der Appliance ausgeführt, in der sie zuvor gehostet wurden.