ストレージ・サーバーのレスキュー手順の使用

各ストレージ・サーバーはソフトウェアのコピーをUSBスティックに保管します。システム構成が変更されるときは常にサーバーがUSBスティックを更新します。このUSBスティックは、ハードウェア交換またはソフトウェア障害の後のサーバーのリカバリに使用できます。システムをリストアするのは、システム・ディスクに障害が発生した場合、オペレーティング・システムに破損ファイル・システムがある場合、または起動エリアがダメージを負っている場合です。ディスク、カード、CPU、メモリーなどを交換して、サーバーをリカバリすることができます。USBスティックを別のサーバーに挿入すると、そのサーバーで古いサーバーが複製されます。

1つのシステム・ディスクのみで障害が発生した場合、リカバリにCellCLIコマンドを使用します。両方のシステム・ディスクで同時に障害が発生するまれな事例の場合、ストレージ・サーバーのCELLBOOT USBフラッシュ・ドライブで提供されるレスキュー機能を使用します。

この項には次のトピックが含まれます:

ストレージ・サーバーのレスキュー前の最初のステップ

ストレージ・サーバーのレスキュー前に、そのサーバーに格納されているデータを保護するためのステップを踏む必要があります。このステップは、システムが通常の冗長性または高い冗長性のどちらで設定されているかによって異なります。

サーバーに通常の冗長性がある場合

通常の冗長性を使用している場合、サーバーにあるミラー・コピーは1つです。レスキュー手順の実行中にこのミラーでも障害が発生すると、リカバリできないデータの損失が発生する可能性があります。

ミラー・コピーの複製を作成することをお薦めします。

  1. ミラー・コピーのデータの完全なバックアップを作成します。

  2. ただちにミラー・コピー・サーバーをオフラインにします。これによって、レスキューを始める前の新たなデータの変更を防ぎます。

この手順により、レスキュー・プロセス中は、障害が発生したサーバーのグリッド・ディスクのすべてのデータおよびそのミラー・コピーにアクセスできなくなります。

Oracle ASMディスク修復タイマーのデフォルトの修復時間は、3.6時間です。この時間内にレスキュー手順を実行できないことがわかった場合、レスキュー手順を実行できるまで、Oracle ASMリバランス手順を使用してディスクをリバランスします。

関連項目:

タイマーのリセットの詳細は、『Oracle Exadata Storage Server Softwareユーザーズ・ガイド』を参照してください。

サーバーに高い冗長性がある場合

サーバーに高い冗長性のディスク・グループがあり、障害が発生したサーバーのすべてのグリッド・ディスクに対する複数のミラー・コピーがOracle ASMにあるような場合は、障害が発生したセルをオフラインにします。Oracle ASMのタイムアウト時間が過ぎると、破損したサーバーのグリッド・ディスクが自動的に削除され、ミラー・コピーを使用してデータのリバランスが開始されます。

デフォルトのタイムアウトは、2時間です。サーバーのレスキューに2時間以上かかる場合、Oracle ASMのレスキュー・セルのグリッド・ディスクを再作成する必要があります。

レスキュー手順について

レスキュー手順を使用する前に、次の点に注意してください。

  • レスキュー手順により、セルの一部またはすべてのディスクが書き換えられる可能性があります。この場合、リカバリできずにそれらのディスクのすべての内容を失うおそれがあります。レスキューを開始する前に、必ず適切な事前ステップを済ませておいてください。「サーバーに通常の冗長性がある場合」または「サーバーに高い冗長性がある場合」を参照してください。

  • この手順を使用する場合は十分に注意し、プロンプトを確認してください。一部またはすべてのディスクのデータを損失してもかまわない場合にOracleサポート・サービスの支援だけでレスキュー手順を使用することが理想的です。

  • レスキュー手順の実行中に明示的に選択しないかぎり、レスキュー手順により、データ・ディスクの内容またはシステム・ディスクのデータ・パーティションの内容は破棄されません。

  • レスキュー手順は、最後の正常な起動中にサーバー上に存在したパッチを含めて、ストレージ・サーバー・ソフトウェアを同じリリースにリストアします。

  • レスキュー手順は次の構成設定をリストアしません

    • アラート構成、SMTP情報、管理者の電子メール・アドレスなどのサーバー構成

    • ILOM構成。ただし、サーバー・ソフトウェアに障害が発生してもILOM構成は一般的に損われません。

  • リカバリ手順は次の構成設定をリストアします

  • レスキュー手順により、データ・ディスクまたはシステム・ディスクのデータ・パーティションの確認または再構築は行われません。グリッド・ディスクにデータの破損がある場合、このレスキュー手順は使用しないでください。かわりに、Oracle DatabaseおよびOracle ASMのレスキュー手順を使用してください。

レスキューが正常に完了したら、サーバーを再構成する必要があります。データを保存する場合は、セル・ディスクをインポートします。それ以外の場合は、新規のセル・ディスクおよびグリッド・ディスクを作成します。

関連項目:

CellCLIユーティリティを使用したセル、セル・ディスクおよびグリッド・ディスクの構成の詳細は、Oracle Exadata Storage Server Softwareユーザーズ・ガイドを参照してください

CELLBOOT USBフラッシュ・ドライブを使用したサーバーのレスキュー

注意:

データを損失しないように注意して、レスキュー手順に従います。

CELLBOOT USBフラッシュ・ドライブを使用してサーバーをレスキューするには、次のようにします。

  1. レスキューされるサーバーのOracle ILOMサービス・プロセッサ(SP)に接続します。HTTPSまたはSSHを使用できます。
  2. サーバーを起動します。スプラッシュ画面が表示されたらすぐに、キーボードの任意のキーを押します。スプラッシュ画面の表示は、5秒間のみです。
  3. ブート・オプションの表示リストで、最後のオプションのCELL_USB_BOOT_CELLBOOT_usb_in_rescue_modeを選択し、[Enter]を押します。
  4. レスキュー・オプションを選択して、レスキュー手順に進みます。
  5. レスキューの第一フェーズの最後で、シェルに入るオプションを選択します。システムを再起動しないでください
  6. レスキューのrootパスワードを使用してシェルにログインします。
  7. シェルからrebootコマンドを使用します。
  8. サーバーが再起動したら、スプラッシュ画面が表示される前に[F8]を押します。F8キーを押すと、起動デバイス選択メニューが開きます。
  9. 起動デバイスとしてRAIDコントローラを選択します。これにより、サーバーがハード・ディスクからブートされるようになります。

ノート:

機能が制限されたレスキュー・モードのLinuxログイン・シェルを入力できる追加オプションを使用できる場合があります。Oracleサポート・サービスから提供されたパスワードを使用してrootユーザーとしてシェルにログインして、サーバーの追加診断および修復を手動で実行できます。詳細は、Oracleサポート・サービスの担当者に連絡してください。

レスキューされたストレージ・サーバーの再構成

レスキューが成功した後、サーバーを構成する必要があります。データ・パーティションを維持した場合は、レスキュー手順の実行時にセル・ディスクが自動的にインポートされます。

  1. 交換したサーバーについては、セル・ディスクおよびグリッド・ディスクを再作成します。
  2. Oracle ASMインスタンスにログインし、次のコマンドを使用して各ディスク・グループのディスクをONLINEに設定します。
    SQL> ALTER DISKGROUP disk_group_name ONLINE DISKS IN FAILGROUP \
    cell_name WAIT; 
    
  3. ALTER CELLコマンドを使用して、セルを再構成します。次に、最も一般的なパラメータの例を示します。
    CellCLI> ALTER CELL
    smtpServer='my_mail.example.com', -
    smtpFromAddr='john.doe@example.com', -
    smtpFromPwd=email_address_password, -
    smtpToAddr='jane.smith@example.com', -
    notificationPolicy='critical,warning,clear', -
    notificationMethod='mail,snmp'
    
  4. I/Oリソース管理(IORM)プランを再作成します。
  5. メトリックしきい値を再作成します。

関連項目:

IORMプランおよびメトリックしきい値の詳細は、『Oracle Exadata Storage Server Softwareユーザーズ・ガイド』を参照してください

損傷したCELLBOOT USBフラッシュ・ドライブの再作成

CELLBOOT USBフラッシュ・ドライブの紛失または損傷が発生した場合、新しいドライブを作成できます。

CELLBOOTフラッシュ・ドライブを作成するには、次のようにします。

  1. rootユーザーとして、サーバーにログインします。
  2. 1GBから8GBの容量の新しいUSBフラッシュ・ドライブを取り付けます。
  3. システムから他のUSBフラッシュ・ドライブを取り外します。
  4. ディレクトリを変更します:
    cd /opt/oracle.SupportTools
    
  5. サーバー・ソフトウェアをフラッシュ・ドライブにコピーします。
    ./make_cellboot_usb -verbose -force