N1 Provisioning Server 3.1, Blades Edition 障害追跡

ファームの起動と移行の問題と解決策

以下の節では、ファームの起動の失敗のデバッグについて説明します。 ファームが正しく要求を完了できない場合、ファームにはエラー状態が設定されます。 エラー状態を判別するには、コマンド /opt/terraspring/sbin/farm -l を実行します。 コマンド出力の最後から 2 番目の列が、ファームのエラー状態を示します。

情報の提供だけを目的として、次の 2 つのエラー状態が設定されています。

ファームの起動時、またはファームがある状態から別の状態に移行する際には、次の問題が発生する可能性があります。 エラー状態にあるファームにファーム要求を再実行するには、farm コマンドに -f オプションを追加し、farm -af farm-id のようにします。 このオプションによりファームのエラーがクリアされ、ファーム要求が処理されます。

問題:

/opt/terraspring/sbin/farm -l コマンドを実行すると、ファーム状態が NEW/NEW_CONFIG/20 と表示される。 この値は、ファームの割り当てが不可能であったことを示しています。

対処方法:

ファームの割り当てに失敗するのは、ファームが特定の種類のリソースを、使用できるよりも多く要求した場合です。 ファームの割り当ての障害になっているリソースを確認するには、コマンド /opt/terraspring/sbin/rsck farm-id を実行します。 rsck により、ファームの割り当てに十分なリソースが使用できることが報告された後で、ファームの起動を再試行します。

問題:

起動のディスパッチ段階で、最終ブートのために、ファーム内のすべてのデバイスの電源がオンになっている。 ファームでディスパッチに失敗した場合は、「Control Center」ウィンドウにエラーメッセージが表示されます。 エラーの詳細は、デバッグのログファイル /var/adm/tspr.debug にあります。

対処方法:

次の 2 つの解決策のいずれかを実行します。

問題:

ファーム更新の失敗。 ファームで更新に失敗すると、「Control Center」ウィンドウにエラーメッセージが表示されます。 エラーの詳細は、デバッグのログファイル /var/adm/tspr.debug にあります。

対処方法:

ファーム更新の手順は、起動の手順に非常によく似ています。 ファームはまず ACTIVE 状態から UPDATE 状態に移行し、続いてこの状態から WIRED 状態と DISPATCHED 状態を経て ACTIVE 状態に戻ります。 UPDATE 状態への移行時には、ファームは新しく要求されたリソースの割り当てを試みます。 この移行時の失敗は、割り当て問題のデバッグと同じ方法でデバッグする必要があります。 ファームが UPDATE 状態に到達すると、ファームは WIRED、DISPATCHED、および ACTIVE 状態の順に移行します。 失敗をデバッグするには、前の 2 つの問題を参照してください。

問題:

ファームの STANDBY 状態で、削除したディスクの消去に失敗する。

対処方法:

消去するためのデバイスの設定の手順は、ディスクコピーのためのデバイスの準備と同じです。 この問題をデバッグするには、「ファームの配線の問題と解決策」の 3 番目の問題を参照してください。

問題:

ファームの STANDBY 状態で、デバイスを VLAN に移動できない。

対処方法:

この問題をデバッグするには、「ファームの配線の問題と解決策」の 1 番目の問題を参照してください。

問題:

ファームの STANDBY 状態で、デバイスの電源状態を変更できない。

対処方法:

「ファームの配線の問題と解決策」の 2 番目の問題で説明されているデバッグの方法を参照してください。

問題:

ディスクイメージのスナップショットが失敗する。 スナップショット要求が完了すると、ファームがエラー状態のままになる。

対処方法:

ディスクスナップショットの準備は、サーバーディスクへのディスクコピーの設定と同じように行います。 この問題をデバッグするには、「ファームの配線の問題と解決策」の 3番目の問題の指示に従います。

また、スナップショットプロセスは、スナップショットイメージを作成する前に、イメージサーバー上でスナップショットイメージのディスク容量を予約しようとします。 イメージサーバーで容量が上限近くまで使用されている場合、スナップショットプロセスが失敗する可能性があります。 この場合、サーバーから古いイメージを削除するか、別のストレージデバイスに古いイメージをバックアップします。 古いイメージを削除するには、次のように image コマンドを使用します。 /opt/terraspring/sbin/image -d image-id

問題:

ファーム停止に失敗した。 停止要求が完了すると、ファームがエラー状態のままになる。

対処方法:

ファーム停止の動作は STANDBY へのファームの移行とほぼ同じですが、削除するデバイスに対してスナップショットイメージが作成されないという例外があります。 停止に失敗したファームの障害追跡では、ファームの STANDBY のデバッグの指示に従います。

問題:

デバイスのフェイルオーバーをサポートするための、交換デバイスの割り当てが不可能であった。 「障害のあるデバイスの交換」の要求が完了すると、ファームがエラー状態のままになる。

対処方法:

障害のあるデバイスをバックアップデバイスと交換するには、バックアップデバイスが使用可能である必要があります。 フリープールに使用可能なデバイスが存在しない場合、割り当ての問題により、障害のあるデバイスの交換は失敗します。 交換デバイスが使用可能であることを確認するには、コマンド /opt/terraspring/sbin/device -LFr device-id を使用します。

問題:

デバイスのフェイルオーバーをサポートするための、交換デバイスのプロビジョニングが不可能であった。 「障害のあるデバイスの交換」の要求が完了すると、ファームがエラー状態のままになる。

対処方法:

交換デバイスのプロビジョニングは、最初のファームの起動とファームの更新時での、新しく割り当てられるデバイスのプロビジョニングと同じように行われます。 これらの問題をデバッグするには、「ファームの配線の問題と解決策」を参照してください。

問題:

コマンド /opt/terraspring/sbin/request -lf farm-id を実行する際に、要求はキューに入ったと表示されるが、処理されない。

対処方法:

次の項目を確認します。

問題:

障害のあるブレードが含まれるファームを停止できない。 ファーム停止とデバイス交換の両方の要求が失敗する。

対処方法:

コマンド device -sB blade-id を入力して、障害のあるブレードを FAILED としてマークします。 続いて、停止要求を再実行します。