N1 Provisioning Server 3.1, Blades Edition システム管理ガイド

ファーム操作の障害追跡

次の表に、ファーム操作と関連する N1 Provisioning Server の障害追跡の問題を示します。 このリストはすべてを網羅してるわけではありません。 メッセージログファイルは、問題がファーム操作に関連しているかどうかを示しています。

表 7–2 ファーム操作の障害追跡

問題 

考えられる原因 

処置 

構成の例外 

ファームに対して Farm Markup Language (FML) が無効。 

解決方法は、http://sun.com/service/contacting/index.html を参照のこと。 

ダイナミックホスト構成プロトコル (DHCP) の例外 

ファームに対して DHCP 構成を作成できない。 

この問題は、コントロールプレーンサーバーのホスト名が決定できない場合に発生する可能性がある。 サーバーのネットワーク構成が正しいかを確認する。  

ドメインネームサービス (DNS) の例外 

ファームに対して DNS 構成を作成できない。 

この問題は、コントロールプレーンサーバーのホスト名が決定できない場合に発生する可能性がある。 サーバーのネットワーク構成が正しいかを確認する。  

また、データベース接続が失われている場合にもこの問題が発生する可能性がある。 コントロールプレーンデータベース (CPDB) が動作中であり、接続を受け入れていることを確認するには、farm -l などのコマンドを実行する。 適切な出力が表示されない場合は、CPDB は動作中ではない。

NoMoreResources の例外

ファームの割り当てに十分なリソースが使用できない。 

メッセージを確認して、どのリソースが使い果たされているかを調べる。 より多くのリソースをプロビジョニングするには、次のいずれかの方法を使用する。 

  • リソースを追加し、その情報をデータベースに追加する。

  • 既存のファームを停止してリソースを解放する。

  • ファームをフレックス構成でダウンさせ、必要なデバイスを解放する。 ファーム操作を再起動する。

I/O の例外 

ディスクの操作、監視の構成、ファイルへのアクセスなどのタスクの実行中に I/O エラーが発生した。 

例外がスローされた特定の場所に応じて、ネットワーク接続の確認など、例外に関するメッセージの一部として示されているはずである適切な処置を行う。 

SQL の例外 

データベースエラーが発生した。 

この問題は、データベース接続が失われた場合に発生する可能性がある。 CPDB が動作中であり、接続を受け入れていることを確認するには、farm -l などのコマンドを実行する。 適切な出力が表示されない場合は、CPDB は動作中ではない。

その他すべてのデータベースエラーの報告先は、http://sun.com/service/contacting/index.html。  

IllegalStateIllegalArgumentIllegalAccess など、SQL 以外の例外

内部エラー。 

解決方法は、http://sun.com/service/contacting/index.html を参照のこと。 

ファームの起動に失敗する。 

ログファイルを調べ、原因を指摘している可能性があるクリティカルエラーを確認する。 

受信したエラーメッセージの種類に応じて、適切な処置を行ってファームを起動する。 

使用できるサブネットが十分ではないため、割り当て時にファームの起動に失敗する。  

サブネットのサイズが大き過ぎる可能性がある。 

ファームの外部サブネットのサイズを選択することも可能。 現在はデータベース内に存在しないサイズを選択した場合は、subnet コマンドを実行してサブネットを追加する必要がある。

named が再起動できなかったため、ファームの配備に失敗する。

JVMTM ソフトウェアには、ホストルックアップにどのデータベースを使用するかを規定する、nsswitch.conf ファイルの構成がキャッシュされている。 セグメントマネージャの起動時に、DNS が nsswitch.conf ファイルのホストエントリの一部ではなかった場合、/etc/hosts ファイルを使用しても解決不可能なすべてのホストルックアップが失敗する。 エラーを説明している詳細メッセージについては、tspr.debug ログを参照のこと。

  1. /etc/nsswitch.conf ファイルのホストルックアップのエントリが次の形式であることを確認する。

    hosts: files dns

  2. 次のコマンドを実行してセグメントマネージャを再起動する。

    /opt/terraspring/sbin/sm -start

  3. ファームを再起動する。

サーバーがブートするが、DHCP を介して IP アドレスを取得できない。 

DHCP デーモンが動作していないか、サーバーのメディアアクセス制御 (MAC) アドレスが正しくない可能性がある。 

  1. データベース内の詳細情報がそのサーバーに対して正しいことを確認する。

    device -lv device-ID コマンドを実行して、MAC アドレスとスイッチポートを確認する。

  2. まず ps -ef |grep dhcp を実行してから tspr.debug ファイルを調べて DHCP メッセージが記録されているかを確認して、DHCP デーモンが動作中で要求に応答していることを確認する。

  3. スイッチへ接続し、ポートの接続を確保する。 スイッチに応じて、sh cam dyn port コマンドまたは sh.mac dyn コマンドを実行して、サーバーの正しい MAC アドレスが表示されていることを確認する。

  4. コントロールプレーンサーバー上の Ethernet インタフェースがスイッチ上で接続済みとして表示され、そのインタフェースが、ネイティブのバーチャル LAN (VLAN) が 1 である 802.1q 中継ポートとして動作していることを確認する。

コントロールプレーンサーバーは、ファームに対する DHCP 構成を作成できない。また、不明なホストを示すメッセージを受信する。 

コントロールプレーンサーバーのネットワーク構成が正しくない可能性がある。 

  1. コントロールプレーンサーバーのネットワーク構成を確認する。

  2. データベース接続と、DNS 構成が含まれるファイルシステムを確認する。

コントロールプレーンサーバーは、ファームに対する DNS 構成を作成できない。また、不明なホストを示すメッセージを受信する。 

コントロールプレーンサーバーのネットワーク構成が正しくない可能性がある。 

  1. コントロールプレーンサーバーのネットワーク構成を確認する。

  2. データベース接続と、DNS 構成が含まれるファイルシステムを確認する。

ファームの更新後、Control Center がファームを正しく表示しない。  

次の 2 つの原因が考えられる。 

  1. 更新要求が CPDB でまだ完了していない。 これには数分かかる場合がある。

  2. 更新要求が失敗した。

  1. 「Editor」ダイアログでファームを再構成し、更新要求を再実行する。

  2. コマンド行から farm -af farm ID コマンドを再実行する。 続いて、Control Center の「Editor」ダイアログからもう一度ファーム更新要求を実行する。

デバイスが動作中であり、ping が成功するにもかかわらず、デバイス交換要求が断続的に生成される。

Ethernet ポートの速度が正しい値に設定されていない可能性がある。 

Ethernet ポートの速度とデュプレックスの設定が、すべて (コントロールプレーンサーバー、スイッチ、およびデバイス) で同じ値に設定されていることを確認する。 

ファームのエラーステータスコード

各ファームには、ファームが現在異常な状態であるかどうかを示す、ファームと関連付けられたエラーステータスコードがあります。

要求の処理中、移行処理が正しく完了するたびにファームの内部状態は変化します。 ファームがある内部状態から別の内部状態に移行できないと、ファームの内部状態は変化せず、そのファームはエラー状態に設定されます。 エラーステータスコードの値は、失敗した内部状態の値です。

たとえば、ファームが状態 ALLOCATED (20) から状態 WIRED (30) への移行に失敗した場合、ファームの内部状態は ALLOCATED (20) のままで、ファームのエラーステータスコードは 30 に設定され、WIRED の状態に失敗したことを表します。 コードが 30 に設定される直前、コードは 1000 になり、要求が実行中であることを示します。

ファームのエラーが発生するたびに、システムログファイル /var/adm/messages ではクリティカルエラーメッセージが生成されます。


注意 – 注意 –

エラー状態が変化し、エラーステータスコードが 0 にクリアされるまで、ファームマネージャは追加のファーム要求を処理しません。