ストレージ・サーバーの保守

この項では、ストレージ・サーバーの保守を実行する方法について説明します。この付録には、次の項があります。

ノート:

既存のリカバリ・アプライアンスのバックアップをオンラインにしておく間は、古いストレージ・サーバーを削除して新しいストレージ・サーバーに置き換えることはできません。このような交換を行う場合は、リカバリ・アプライアンスの再イメージ化が必要です。(手間がかかります!)

ストレージ・サーバーの停止

ストレージ・サーバーの保守を実行する場合、サーバーの電源切断または再起動が必要になることがあります。ストレージ・サーバーを停止する前に、サーバーのオフラインによるOracle ASMディスク・グループおよびデータベース可用性への影響がないことを確認してください。データベース可用性の継続は、影響するディスク・グループで使用されるOracle ASM冗長性のレベルと、同じデータのミラー・コピーを含む他のストレージ・サーバーでのディスクの現在のステータスによって異なります。

注意:

  • リカバリ・アプライアンスで保守中のセルが完全に機能するようになる前に、別のセルのディスクに障害が発生した場合、二重のディスク障害が発生する可能性があります。リカバリ・アプライアンスがDELTAディスク・グループについてNORMALの冗長性でデプロイされており、このディスク障害が恒久的な場合、リカバリ・アプライアンス上のすべてのバックアップが失われます。

  • 保守中のセルが長時間オフラインでないことを確認してください。そうしないと、リバランス操作が発生し、操作の完了に十分な領域がないために問題が引き起こされます。デフォルトで、リバランス操作はセルがオフラインになってから24時間後に開始されます。

ストレージ・サーバーの電源を停止するには、次のようにします。

  1. rootとして、ストレージ・サーバーにログインします。
  2. (オプション)ストレージ・サーバーの再起動後にグリッド・ディスクがオフラインのままになるようにします。
    CellCLI> ALTER GRIDDISK ALL INACTIVE
    

    複数の再起動を行う場合、またはセルが再度アクティブになったときに制御するには、このコマンドを使用します。たとえば、サーバーを使用する前に、計画保守アクティビティが成功したことを検証できます。

  3. セル・サービスを停止します。
    CellCLI> ALTER CELL SHUTDOWN SERVICES ALL
    

    前述のコマンドでは、オフラインのディスクがないか、predictive failureステータスのディスクがないか、またはミラーにコピーする必要があるディスクがないかをチェックします。Oracle ASM冗長性が損なわれていない場合は、コマンドによりOracle ASMでグリッド・ディスクがオフラインに変更され、サービスが停止されます。

    次のエラーは、サービスの停止によって冗長性の問題が引き起こされ、ディスク・グループが強制的にマウント解除される可能性を示しています。

    Stopping the RS, CELLSRV, and MS services...
    The SHUTDOWN of ALL services was not successful.
    CELL-01548: Unable to shut down CELLSRV because disk group DATA, RECO may be
    forced to dismount due to reduced redundancy.
    Getting the state of CELLSRV services... running
    Getting the state of MS services... running
    Getting the state of RS services... running
    

    このエラーが発生した場合は、Oracle ASMディスク・グループの冗長性がリストアされます。すべてのディスクのステータスが正常のときはコマンドを再試行します。

  4. サーバーを停止します。「サーバーの電源切断」を参照してください。
  5. 保守作業が完了したら、サーバーの電源を投入します。サービスは自動的に開始されます。起動中、Oracle ASMですべてのグリッド・ディスクが自動的にオンラインになります。
  6. すべてのグリッド・ディスクがオンラインであることを確認します。
    CellCLI> LIST GRIDDISK ATTRIBUTES name, asmmodestatus
    

    すべてのグリッド・ディスクのasmmodestatusONLINEまたはUNUSEDになるまで待機します。

  7. ステップ2でグリッド・ディスクを非アクティブにした場合は、再度アクティブにします。
    CellCLI> ALTER GRIDDISK ALL ACTIVE
    

    ステップ2をスキップした場合は、グリッド・ディスクは自動的にアクティブになります。

関連項目:

My Oracle SupportのドキュメントID 1188080.1「ASMに影響を与えずにExadataのストレージ・セルを停止または再起動するステップ」

診断ISOを使用したネットワーク接続の有効化

正常に再起動できないストレージ・サーバーにアクセスするため、診断ISOの使用が必要になる場合があります。サーバーの起動後、ファイルをISOからサーバーにコピーすることで破損ファイルを置き換えます。

ISOは、すべてのリカバリ・アプライアンス・サーバー上の/opt/oracle.SupportTools/diagnostics.isoにあります。

注意:

USBドライブの使用など、他の再起動方法が失敗した後でのみ、診断ISOを使用してください。この手順を開始する前に、アドバイスとガイダンスを得るためOracle Supportに連絡してください。

診断ISOを使用するには、次のようにします。

  1. TelnetまたはpuTTYなどの、Webインタフェースまたはシリアル・コンソールのどちらかを使用して、サービス・プロセッサで1回のCD-ROMブートを有効にします。たとえば、シリアル・コンソールから次のコマンドを使用します。
    set boot_device=cdrom
    
  2. サービス・プロセッサ・インタフェースを使用して、diagnostics.isoのローカル・コピーをCD-ROMとしてマウントします。
  3. rebootコマンドを使用してサーバーを再起動します。
  4. rootユーザーとして、診断ISOのパスワードを使用してサーバーにログインします。
  5. pingを避けるには:
    alias ping="ping -c"
    
  6. /etc/networkという名前のディレクトリを作成します。
  7. /etc/network/if-pre-up.dという名前のディレクトリを作成します。
  8. 次の設定を/etc/network/interfacesファイルに追加して、サーバーの実際のIPアドレスおよびネットマスク、そしてゲートウェイのIPアドレスを入力します。
    iface eth0 inet static
    address IP address of server
    netmask netmask of server
    gateway gateway IP address of server
    
  9. eth0インタフェースを起動します。
    # ifup eth0
     

    警告メッセージは無視します。

  10. FTPまたはwgetコマンドを使用して、サーバーの修理に必要なファイルを取得します。