Sun Cluster 2.2 のシステム管理

第 5 章 電力損失 (停電) からの回復

この章では、さまざまな電力損失について説明し、システムを通常の状態に戻すための手順を示します。この章で説明する項目は次のとおりです。

Sun Cluster 構成の管理には、電力損失のような障害の処理も含まれます。電力損失が発生すると、Sun Cluster 構成全体が停止することもあれば、構成内の一部のコンポーネントが停止することもあります。Sun Cluster ノードの動作は、停電するコンポーネントによって異なります。以下の各節は、典型的な状況と回復方法を説明しています。

完全な電力損失からの回復

単一の電源を使用した Sun Cluster 構成では、停電が起きると多重ホストディスク拡張装置と共にすべての Sun Cluster ノードが停止します。すべてのノードで停電が起きると、構成全体が停止します。

完全な停電が起きた場合、クラスタハードウェアを動作状態に戻す試みとして、次の 2 つの方法を使用できます。

部分的な電力損失からの回復

Sun Cluster ノードと多重ホストディスク拡張装置が個別の電源を使用している場合は、停電によってコンポーネントが停止する可能性があります。発生する可能性の高い状況を次に示します。

1 つのノードの停電

ノードと多重ホストディスク拡張装置が個別の電源を使用している場合にノードの 1 つだけが停電すると、ほかのノードがその停電を検出し、テイクオーバーを開始します。

停電したノードは、電力が戻ると再起動します。クラスタは、scadmin startnode コマンドを使用して結合し直す必要があります。その後で、デフォルトの論理ホストの所有権を復元するために、haswitch(1M) コマンドを使用して手動でスイッチオーバーを行います。

多重ホストディスク拡張装置の停電

多重ホストディスク拡張装置の 1 台が停電すると、ボリューム管理ソフトウェアが影響を受けたディスクのエラーを検出し、それらをエラー状態にするアクションを実行します。ディスクがミラー化されていると、この停電は Sun Cluster の障害監視に検出されず、スイッチオーバーとテイクオーバーは発生しません。

多重ホストディスク拡張装置に電力が戻った時点で、第 11 章「SPARCstorage Array の管理」または第 12 章「Sun StorEdge MultiPack と Sun StorEdge D1000 の管理」で説明している作業を行なってください。

1 台のサーバーと 1 台の多重ホストディスク拡張ユニットの停電

Sun Cluster ノードの 1 つと多重ホストディスク拡張装置の 1 台が停電すると、二次ノードがすぐにテイクオーバーを開始します。

電力が戻った後で、ノードを再起動し、scadmin startnode コマンドを使用してそのノードを構成に加え直し、監視作業を開始する必要があります。手動のスイッチオーバーが構成されている場合は、haswitch(1M) コマンドを使用して、停電したノードにディスクセットの所有権を手動で戻してください。詳細は、「論理ホストのスイッチオーバー」を参照してください。

ディスクセットの所有権がデフォルトマスターに戻された後、エラーを報告した多重ホストディスクをすべてサービスの状態に戻す必要があります。この方法については、使用しているディスク拡張装置に関する章に示された作業方法を参照してください。


注 -

ノードは、多重ホストディスク拡張装置を再起動する前に再起動する場合があります。その場合、関連付けられたディスクにはアクセスできません。多重ホストディスク拡張装置が起動した後に、ノードを再起動してください。


システムへの電源投入

システムキャビネット、ノード、起動ディスクに電源を入れる方法は、使用しているキャビネットの種類と、ノードの AC 配電の状態によって異なります。

独立した電源から AC 電力を受けないディスクアレイの場合、システムキャビネットの電源投入時に電源が入ります。

Sun StorEdge MultiPack の個々の電源投入方法については、『Sun StorEdge MultiPack Service Manual』を参照してください。

システムキャビネットから AC 電力を受ける端末集配信装置は、キャビネットの電源投入時に電源が入ります。システムキャビネットからの配電がない場合は、個々に電源を入れる必要があります。