以下の節では、ファームの起動の失敗のデバッグについて説明します。 ファームが正しく要求を完了できない場合、ファームにはエラー状態が設定されます。 エラー状態を判別するには、コマンド /opt/terraspring/sbin/farm -l を実行します。 コマンド出力の最後から 2 番目の列が、ファームのエラー状態を示します。
情報の提供だけを目的として、次の 2 つのエラー状態が設定されています。
エラー状態 0 は、ファームが正常であり、新しい要求を受け入れる準備ができていることを示します。
エラー状態 1000 は、ファームが移行状態にあることを示します。 このファームに関してファーム要求が現在処理中で、ファームがある状態から別の状態に移行しているところです。
ファームの起動時、またはファームがある状態から別の状態に移行する際には、次の問題が発生する可能性があります。 エラー状態にあるファームにファーム要求を再実行するには、farm コマンドに -f オプションを追加し、farm -af farm-id のようにします。 このオプションによりファームのエラーがクリアされ、ファーム要求が処理されます。
問題:/opt/terraspring/sbin/farm -l コマンドを実行すると、ファーム状態が NEW/NEW_CONFIG/20 と表示される。 この値は、ファームの割り当てが不可能であったことを示しています。
対処方法:ファームの割り当てに失敗するのは、ファームが特定の種類のリソースを、使用できるよりも多く要求した場合です。 ファームの割り当ての障害になっているリソースを確認するには、コマンド /opt/terraspring/sbin/rsck farm-id を実行します。 rsck により、ファームの割り当てに十分なリソースが使用できることが報告された後で、ファームの起動を再試行します。
問題:起動のディスパッチ段階で、最終ブートのために、ファーム内のすべてのデバイスの電源がオンになっている。 ファームでディスパッチに失敗した場合は、「Control Center」ウィンドウにエラーメッセージが表示されます。 エラーの詳細は、デバッグのログファイル /var/adm/tspr.debug にあります。
対処方法:次の 2 つの解決策のいずれかを実行します。
タイムアウト期間が終了する前に、デバイスが監視エージェントに対して報告を行わなかった場合。
リソースプールサーバーが正しくブートしていない可能性があります。 コンソール接続で、リソースプールサーバーのブートを監視します。 デバイスが正しくブートしない場合は、ネットワークの問題を重点的に調べる必要があります。 デバイスがブートに成功しても、そのデバイスがブートしたことを監視エージェントが認識できない場合は、リソースプールサーバーの監視エージェントのプロセスが正しく起動したかを確認します。 リソースプールサーバーでコマンド /usr/ucb/ps auxwww | grep java を実行します。 バックグラウンドで監視エージェントの Java プロセスが稼働中であることが確認できるはずです。 監視エージェントのプロセスをデバッグするには、/opt/terraspring/log/tspr.log のログファイルを調べます。
デバイスの電源をオンにしようとする際に問題が存在する可能性がある場合。 「ファームの配線の問題と解決策」の 2 番目の問題で説明されているデバッグの方法を参照してください。
ファーム更新の失敗。 ファームで更新に失敗すると、「Control Center」ウィンドウにエラーメッセージが表示されます。 エラーの詳細は、デバッグのログファイル /var/adm/tspr.debug にあります。
対処方法:ファーム更新の手順は、起動の手順に非常によく似ています。 ファームはまず ACTIVE 状態から UPDATE 状態に移行し、続いてこの状態から WIRED 状態と DISPATCHED 状態を経て ACTIVE 状態に戻ります。 UPDATE 状態への移行時には、ファームは新しく要求されたリソースの割り当てを試みます。 この移行時の失敗は、割り当て問題のデバッグと同じ方法でデバッグする必要があります。 ファームが UPDATE 状態に到達すると、ファームは WIRED、DISPATCHED、および ACTIVE 状態の順に移行します。 失敗をデバッグするには、前の 2 つの問題を参照してください。
問題:ファームの STANDBY 状態で、削除したディスクの消去に失敗する。
対処方法:消去するためのデバイスの設定の手順は、ディスクコピーのためのデバイスの準備と同じです。 この問題をデバッグするには、「ファームの配線の問題と解決策」の 3 番目の問題を参照してください。
問題:ファームの STANDBY 状態で、デバイスを VLAN に移動できない。
対処方法:この問題をデバッグするには、「ファームの配線の問題と解決策」の 1 番目の問題を参照してください。
問題:ファームの STANDBY 状態で、デバイスの電源状態を変更できない。
対処方法:「ファームの配線の問題と解決策」の 2 番目の問題で説明されているデバッグの方法を参照してください。
問題:ディスクイメージのスナップショットが失敗する。 スナップショット要求が完了すると、ファームがエラー状態のままになる。
対処方法:ディスクスナップショットの準備は、サーバーディスクへのディスクコピーの設定と同じように行います。 この問題をデバッグするには、「ファームの配線の問題と解決策」の 3番目の問題の指示に従います。
また、スナップショットプロセスは、スナップショットイメージを作成する前に、イメージサーバー上でスナップショットイメージのディスク容量を予約しようとします。 イメージサーバーで容量が上限近くまで使用されている場合、スナップショットプロセスが失敗する可能性があります。 この場合、サーバーから古いイメージを削除するか、別のストレージデバイスに古いイメージをバックアップします。 古いイメージを削除するには、次のように image コマンドを使用します。 /opt/terraspring/sbin/image -d image-id
問題:ファーム停止に失敗した。 停止要求が完了すると、ファームがエラー状態のままになる。
対処方法:ファーム停止の動作は STANDBY へのファームの移行とほぼ同じですが、削除するデバイスに対してスナップショットイメージが作成されないという例外があります。 停止に失敗したファームの障害追跡では、ファームの STANDBY のデバッグの指示に従います。
問題:デバイスのフェイルオーバーをサポートするための、交換デバイスの割り当てが不可能であった。 「障害のあるデバイスの交換」の要求が完了すると、ファームがエラー状態のままになる。
対処方法:障害のあるデバイスをバックアップデバイスと交換するには、バックアップデバイスが使用可能である必要があります。 フリープールに使用可能なデバイスが存在しない場合、割り当ての問題により、障害のあるデバイスの交換は失敗します。 交換デバイスが使用可能であることを確認するには、コマンド /opt/terraspring/sbin/device -LFr device-id を使用します。
問題:デバイスのフェイルオーバーをサポートするための、交換デバイスのプロビジョニングが不可能であった。 「障害のあるデバイスの交換」の要求が完了すると、ファームがエラー状態のままになる。
対処方法:交換デバイスのプロビジョニングは、最初のファームの起動とファームの更新時での、新しく割り当てられるデバイスのプロビジョニングと同じように行われます。 これらの問題をデバッグするには、「ファームの配線の問題と解決策」を参照してください。
問題:コマンド /opt/terraspring/sbin/request -lf farm-id を実行する際に、要求はキューに入ったと表示されるが、処理されない。
対処方法:次の項目を確認します。
ファームの状態をチェックし、ファームがエラー状態でないことを確認します。 次のコマンドを入力します。
# /opt/terraspring/sbin/farm -l farm-id |
ファームがエラー状態である場合は、ファーム要求は処理されません。 ファームが、キュー内のファーム要求を処理できる正常な状態であると確認できた場合は、次の手順を実行します。
コマンド /opt/terraspring/sbin/farm -pf farm-id を使用してエラー状態をクリアします。 このコマンドによりファームに ping が送信され、そのエラー状態がクリアされます。
コマンド /opt/terraspring/sbin/aps を入力して、セグメントマネージャ (sm) が稼働中であり、応答していることを確認します。
このファームに関して処理される次の要求は、QUEUED_BLOCKED としてマークされている要求以外のものである。
要求は先着順で処理され、また QUEUED_BLOCKED 要求は先に処理される必要があるため、ユーザーは処理されないファーム要求を発行している可能性があります。 この要求を除去するには、 ブロックされた要求のブロック解除と、ブロックされた要求の削除という、2 つの選択肢があります。 要求をブロック解除するには次のコマンドを入力します。
request -u request-id |
要求を削除するには次のコマンドを入力します。
request -d request-id |
ファームが DEACTIVATED 以外の状態である。
DEACTIVATED 状態のファームは、別の状態に移行できません。 ファームを停止すると、残された可能な唯一のファーム操作は、ファームの削除です。
セグメントマネージャのプロセスが活動中である。
上記のシナリオがいずれも該当しない場合は、セグメントマネージャのプロセスが応答しなくなっている可能性があります。 すべてのプロセスが正しく稼働中であることを確認するには、コマンド /opt/terraspring/sbin/aps を使用します。 プロセスが稼働中でない場合は、/etc/rc3.d/S99sm -start スクリプトを使用して、セグメントマネージャのプロセスを起動します。
障害のあるブレードが含まれるファームを停止できない。 ファーム停止とデバイス交換の両方の要求が失敗する。
対処方法:コマンド device -sB blade-id を入力して、障害のあるブレードを FAILED としてマークします。 続いて、停止要求を再実行します。