Sun Enterprise 10000 Dynamic Reconfiguration ユーザーマニュアル

付録 A DRのエラーメッセージ

この章では、DR 操作の実行中に発生する可能性のあるエラーメッセージの一覧を示します。このリストには、以下の表に示すエラーメッセージより一般的な Protocol Independent Module (PIM) 層のエラーは含まれません。

DR エラーメッセージはすべて、次のいずれかまたは両方に送られます。

この付録の利用方法

この付録を利用する前に、以下に示す検索のヒントをよく読んでください。

エラータイプ別リンク

SSP に関するエラー

以下のいずれかのリンクから、SSP に関するエラーメッセージを検索してください。

「プロトコルおよび通信エラーメッセージ」

「接続関連のエラーメッセージ」

「切断関連のエラーメッセージ」

「自動構成エラーメッセージ」

ドメインに関するエラー

以下のいずれかのリンクから、ドメインに関するエラーメッセージを検索してください。

「DR デーモン起動エラーメッセージ」

「記憶域割り当てエラーメッセージ」

「DR ドライバエラーメッセージ」

「PSM (Platform Specific Module) エラーメッセージ」

「DR の一般的なドメインエラーメッセージ」

「DR のドメインシステム調査エラーメッセージ」

「OpenBoot PROM エラーメッセージ」

「安全でないデバイスの照会エラーメッセージ」

「代替パス (AP) エラーメッセージ」

「DCS エラーメッセージ」

「DR ドライバエラーメッセージ」

「プラグインエラーメッセージ」

SSP エラーメッセージ

以下の節に SSP 関連のエラーメッセージを示します。

プロトコルおよび通信エラーメッセージ

プロトコルおよび通信エラーメッセージの一覧を以下に示します。これらのメッセージは、システムログと SSP アプリケーションのいずれかまたは両方に送信されます。

表 A-1 プロトコルおよび通信障害エラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

NGDR Error: abort_attach_board: invalid board number

RPC は、有効な数値範囲外のボード番号に対して DR 操作を実行しようとしました。DR アプリケーションは、RPC に送信する前にユーザーによる入力を詳細にフィルタ処理し、範囲外のボード番号があれば検出します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: abort_detach_board: invalid board number

RPC は、有効な数値範囲外のボード番号に対して DR 操作を実行しようとしました。DR アプリケーションは、RPC に送信する前に、ユーザーによる入力をフィルタ処理し、範囲外のボード番号があれば検出します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: attach_finished: invalid board number

RPC は、有効な数値範囲外のボード番号に対して DR 操作を実行しようとしました。DR アプリケーションは、RPC に送信する前にユーザーによる入力を詳細にフィルタ処理し、範囲外のボード番号があれば検出します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: complete_attach_board: invalid board number

RPC は、有効な数値範囲外のボード番号に対して DR 操作を実行しようとしました。DR アプリケーションは、RPC に送信する前にユーザーによる入力を詳細にフィルタ処理し、範囲外のボード番号があれば検出します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: cpu0_move_finished: invalid board number

RPC は、有効な数値範囲外のボード番号に対して DR 操作を実行しようとしました。DR アプリケーションは、RPC に送信する前にユーザーによる入力を詳細にフィルタ処理し、範囲外のボード番号があれば検出します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: detach_board: invalid board number

RPC は、有効な数値範囲外のボード番号に対して DR 操作を実行しようとしました。DR アプリケーションは、RPC に送信する前にユーザーによる入力を詳細にフィルタ処理し、範囲外のボード番号があれば検出します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: detach_finished: invalid board number

RPC は、有効な数値範囲外のボード番号に対して DR 操作を実行しようとしました。DR アプリケーションは、RPC に送信する前にユーザーによる入力を詳細にフィルタ処理し、範囲外のボード番号があれば検出します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: detachable_board: invalid board number

RPC は、有効な数値範囲外のボード番号に対して DR 操作を実行しようとしました。DR アプリケーションは、RPC に送信する前にユーザーによる入力を詳細にフィルタ処理し、範囲外のボード番号があれば検出します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: drain_board_resources: invalid board number

RPC は、有効な数値範囲外のボード番号に対して DR 操作を実行しようとしました。DR アプリケーションは、RPC に送信する前にユーザーによる入力を詳細にフィルタ処理し、範囲外のボード番号があれば検出します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: get_board_config: invalid board number

RPC は、有効な数値範囲外のボード番号に対して DR 操作を実行しようとしました。DR アプリケーションは、RPC に送信する前にユーザーによる入力を詳細にフィルタ処理し、範囲外のボード番号があれば検出します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: get_board_state: invalid board number

RPC は、有効な数値範囲外のボード番号に対して DR 操作を実行しようとしました。DR アプリケーションは、RPC に送信する前にユーザーによる入力を詳細にフィルタ処理し、範囲外のボード番号があれば検出します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: get_cpu_info: invalid board number

RPC は、有効な数値範囲外のボード番号に対して DR 操作を実行しようとしました。DR アプリケーションは、RPC に送信する前にユーザーによる入力を詳細にフィルタ処理し、範囲外のボード番号があれば検出します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: get_obp_board_config: invalid board number

RPC は、有効な数値範囲外のボード番号に対して DR 操作を実行しようとしました。DR アプリケーションは、RPC に送信する前にユーザーによる入力を詳細にフィルタ処理し、範囲外のボード番号があれば検出します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: initiate_attach_board: invalid board number

RPC は、有効な数値範囲外のボード番号に対して DR 操作を実行しようとしました。DR アプリケーションは、RPC に送信する前にユーザーによる入力を詳細にフィルタ処理し、範囲外のボード番号があれば検出します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: initiate_attach_board: invalid cpu number

RPC は、ボード上に存在しない CPU を含むボードの接続を開始しようとしました。DR アプリケーションは、RPC に送信する前にユーザーによる入力を詳細にフィルタ処理し、無効な CPU 番号を捕捉します。このため、このエラーは、SSP 上、または SSP へのネットワーク接続上で機能が停止したことを意味します。または、SSP アプリケーションと DR デーモン間に非互換性の問題があることを意味します。 

SSP ネットワーク接続や SSP および DR アプリケーションをチェックし、これらが適正に動作していることを確認します。 

NGDR Error: Unauthorized RPC call . . . Not owner

DR デーモンは、認証の失敗した RPC を受け取りました。 

システムログをチェックして、このエラーに関する詳細情報を取得します。また、バージョン番号が SSP および DR デーモンに対して一致すること、および SSP ユーザーとネットワークサービスが適切に構成されていることを確認します。 

接続関連のエラーメッセージ

接続関連の障害エラーの一覧を以下に示します。これらのエラーは、システムログと SSP アプリケーションのいずれかまたは両方に送信されます。

表 A-2 接続関連の障害エラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

NGDR Error: abort_attach_board: invalid board state

ボードが Init Attach 状態にないため、Attach 操作を終了できませんでした。この操作は、ドメイン内で構成が行われるまで待機します。 

Attach 操作を終了するには、ボードが Init Attach 状態になるまで待ってください。 

NGDR Error: attach_finished: invalid board state

接続操作中に通信プロトコル違反がありました。ボードが SSP からの Attach 操作の確認を待機中であるとする SSP に対して、DR ドライバおよびデーモンの認識が異なります。 

現在の DR アプリケーションを終了してから再起動し、操作を再度実行します。引き続きエラーが発生する場合は、DR デーモンを停止してから再起動します。復元するために、ドメインの再起動が必要な場合もあります。 

NGDR Error: Cannot abort attach. Board ineligible for further DR operations.

abort コマンド発行後にボードの状態が FATAL になったため、終了操作が失敗し、ボードがシステムから認識されなくなりました。 

ドメインを再起動します。 

dr_attach: failure executing A3000 hot_add script . . . error message

DR Attach 操作後に、Sun StoreEdge? A3000 hot_add スクリプトが直接実行されました。スクリプトは存在するが実行できない場合は、エラーメッセージにその理由が表示されます。

A3000 デバイスを現在使用しておらず、将来使用する予定がない場合は、スクリプトが実行されないよう、その名前を変更します。 

initiate_attach_board: already init-attached

すでに接続の開始されたボードへの接続を開始しようとしました。 

Complete Attach ウィンドウで、接続プロセスを続行します。 

NGDR Error: complete_attach_board: invalid board state

不適切なボードに対して Attach 操作を開始しようとしました。ボードは、ドメインへの接続が可能な Init Attach 状態にはありません。 

Attach 操作を終了するには、ボードが Init Attach 状態になるまで待ってください。 

NGDR Error: initiate_attach_board: invalid board state

不適切なボードに対して Attach 操作を開始しようとしました。ボードは、ドメインへの接続が可能な PRESENT 状態にはありません。 

Attach 操作を終了するには、ボードが Init Attach 状態になるまで待ってください。 

NGDR Error: Some devices not attached. Examine the host syslog for details . . . errno_description

いくつかのデバイスが、ドメイン内に構成されませんでした。 

システムログを参照して、ドメイン内に構成されなかったデバイスおよびその理由を調べます。ボード上のデバイスの中には、オペレーティング環境または DR 機能がサポートしないものもあります。サポートされないデバイスが存在する場合は、そのことを記録しておき、以降のシステム運用の参考にしてください。 

切断関連のエラーメッセージ

切断関連のエラーメッセージの一覧を以下に示します。これらのメッセージは、システムログと SSP アプリケーションのいずれかまたは両方に送信されます。

表 A-3 切断関連障害のエラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

NGDR Error: Cannot detach board board_number. It has interface_name interfaces configured.

ドメインの操作に重要な意味を持つ 1 つ以上のネットワークインタフェースがボードに接続されているため、ボードを切断することはできません。ネットワークインタフェースは、プライマリ、SSP、AP、PBF インタフェースの任意の組み合わせが可能です。 

ifconfig(1M) コマンドを使って、インタフェースの役割を判別します。構成されたインタフェースがプライマリネットワークまたは SSP である場合は、手動で代替インタフェースに切り替えます (代替インタフェースが存在する場合)。プライマリおよび SSP 以外のインタフェースの場合は、そのままにしておくことで、Detach 操作が可能になる場合があります。操作が成功しない場合は、ドメインを停止し、インタフェースを別のボードに移動する必要があります。

NGDR Error: cpu0_move_finished: invalid board state

CPU の有効性に関係する通信プロトコル違反が発生しました。SSP の場合、CPU はボードから取りはずされます。DR ドライバの場合は、移動はボードに対する無効の操作です。 

なし 

ifconfig down failed.

ifconfig(1M) コマンドが、ネットワークインタフェースの停止に失敗しました。ifconfig(1M) コマンドは、ボードの切断前にネットワークインタフェースを使用中止および停止します。ボード上のネットワークインタフェースのいずれかが使用中である場合は、手動による操作が必要になります。

ドメインにログインし、可能であれば ifconfig(1M) コマンドを down オプションを付けて実行し、ボード上のインタフェースを手動で停止します。コマンドの手動実行により、障害に関する詳細な情報を取得できる場合があります。

ifconfig unplumb failed.

ifconfig(1M) コマンドが、ネットワークインタフェースの使用中止を設定できませんでした。ifconfig(1M) コマンドは、ボードの切断前にネットワークインタフェースを使用中止および停止します。ボード上のネットワークインタフェースのいずれかが使用中である場合は、手動による操作が必要になります。

ドメインにログインし、可能であれば ifconfig(1M) コマンドを unplumb オプションを付けて実行し、インタフェースを手動で使用中止にします。コマンドの手動実行により、障害に関する詳細な情報を取得できる場合があります。

Warning: Error return from /opt/SUNWconn/bin/nf_snmd_kill (return_value)

コマンドは失敗しました。いくつかのデーモンがネットワーク接続をオープンしたままになっています。これらのデーモンを停止してから、デーモンが制御するデバイスを切断する必要があります。 

return_value を分析して kill(1) コマンドが失敗した原因を突き止め、問題を訂正します。必要に応じて、ps(1) コマンドを使ってデーモンの PID 番号を取得します。kill(1) コマンドを使ってデーモンを手動で停止します。

Warning: Error return from /opt/SUNWconn/bin/pf_snmd_kill (return_value)

kill(1) コマンドが失敗しました。ネットワークデバイスの制御に使用されるデーモンがインタフェースをオープンしたままにするため、デーモンを停止してからデバイスを切断する必要があります。

return_value を分析して kill コマンドが失敗した原因を突き止め、問題を訂正します。必要に応じて、ps(1) コマンドを使ってデーモンの PID 番号を取得します。kill(1) コマンドを使ってデーモンを手動で停止します。

NGDR Error: abort_detach: board already drained

DR デーモンによる切り離し操作の終了中に、ioctl() の取り消しに失敗しました。このため、ボードは、メモリーがすでに開放されてしまったことを示す非参照状態にあるとレポートされました。

このエラーを復旧するには、まずボードを完全に切断する必要があります。ボードの切断が成功してから、DR 操作を再度実行してください。 

NGDR Error: abort_detach_board: invalid board state

ボードの有効性に影響する通信プロトコル違反が発生しました。SSP に関しては、ボードはドメインの一部で、その資源はすでに開放されたか、または開放されつつあります。このため、SSP は abort コマンドを発行して切り離し操作を停止します。ただし、DR ドライバおよびデーモンに関しては、ボードはドメインの一部ではありません。 

DR アプリケーションを終了してから、再起動します。 

NGDR Error: board configuration query failed.

DR デーモンが、ボード構成の有効性の確認に失敗しました。 

DR デーモンと DR ドライバのいずれかまたは両方を停止してから再起動します。このエラーが引き続き発生する場合は、DR デーモンを停止してから、modinfo(1M)、modload(1M)、および modunload(1M) コマンドをドライバに対して実行します。また、ps(1) コマンドを使って DR デーモンのサイズを確認します。DR デーモンのサイズが 300 〜 400 KB の範囲内にない場合は、システムログから可能な限り多くの情報を取得して、このエラーについて報告してください。

NGDR Error: Cannot abort detach. Board detached from OS (detach completed).

このメッセージは、切り離し操作が完了したことを示します。これは、エラーメッセージ DR Error: abort_detach: board already drained に対して表示されるメッセージに続いて表示されます。

メッセージ DR Error: abort_detach: board already drained を参照してください。

NGDR Error: couldn't query cpu configuration

完全な切り離し操作の開始直前に、DR デーモンが CPU 構成を確認できなかったために、完全な切り離し操作が失敗しました。ボードの切断後、DR デーモンは CPU 構成に関する情報を参照して、ボード上の各 CPU の utmp および wtmp エントリを更新します。完全な接続操作は更新に依存しませんが、CPU 構成の照会機構が破壊された場合は、深刻な問題があります。切り離し操作を続行すべきではありません。

DR デーモンと DR ドライバのいずれかまたは両方を停止してから再起動します。また、ps(1) コマンドを使って DR デーモンのサイズを確認します。DR デーモンのサイズが 300 〜 400 KB の範囲内にあれば、システムログから可能な限り多くの情報を取得して、このエラーについて報告してください。

NGDR Error: detach_board: invalid board state

ボードの有効性に影響する通信プロトコル違反が発生しました。SSP に関しては、ボードはドメインの一部で、その資源はすでに開放されています。このため、SSP は切り離し操作を終了しようとします。ただし、DR ドライバおよびデーモンに関しては、ボードはドメインの一部ではありません。 

dr_cmd_board_states コマンドを使ってボードの状態を検査し、問題の原因を判定します。ドレインと完全な切り離し操作のいずれかまたは両方を再度実行し、回復可能なエラーかどうかを判定します。DR デーモンおよびドライバを停止してから起動します。

NGDR Error: detach_board: invalid board state

ボード状態の適切なシーケンスをたどることが行われていません。これは、ボードがエラー状態に入ったか、イベントのドレイン - 切断シーケンス内での初期障害が適切にレポートされなかったことを意味します。 

dr_cmd_board_states(1M) コマンドを使ってボードの状態を検査し、問題の原因を判定します。ドレインと完全な切り離し操作のいずれかまたは両方を再度実行し、回復可能なエラーかどうかを判定します。DR デーモンおよびドライバを停止してから起動します。

NGDR Error: detach_finished: invalid board state

ボードの有効性に影響する通信プロトコル違反が発生しました。SSP に関しては、ボードはすでに切断されています。ただし、DR ドライバおよびデーモンに関しては、ボードはドメインの一部ではありません。 

dr_cmd_board_states(1M) コマンドを使ってボードの状態を検査し、問題の原因を判定します。ドレインと完全な切り離し操作のいずれかまたは両方を再度実行し、回復可能なエラーかどうかを判定します。DR デーモンおよびドライバを停止してから起動します。

NGDR Error: detachable_board: invalid board state

ボードの有効性に影響する通信プロトコル違反が発生しました。SSP に関しては、ボードはドメインの一部です。このため、SSP は資源を開放しようとします。ただし、DR ドライバおよびデーモンに関しては、ボードはドメインの一部ではありません。 

dr_cmd_board_states(1M) コマンドを使ってボードの状態を検査し、問題の原因を判定します。ドレインと完全な切り離し操作のいずれかまたは両方を再度実行し、回復可能なエラーかどうかを判定します。DR デーモンおよびドライバを停止してから起動します。

NGDR Error: detaching board would leave no online CPUs

ボード切断後にオンライン状態の CPU が存在しなくなるため、切り離し操作が失敗しました。 

ドメイン内の他のボード上でより多くの CPU をオンラインにするか、オンラインの CPU を保持するより多くのボードをドメインに追加し、ボードの切断後にも十分なオンラインの CPU がドメインに存在するようにします。 

NGDR Error: drain_board_resources: invalid board state

ボードの有効性に影響する通信プロトコル違反が発生しました。SSP に関しては、ボードはドメインの一部であるため、SSP は資源を開放しようとします。ただし、DR ドライバおよびデーモンに関しては、ボードはドメインの一部ではありません。 

dr_cmd_board_states(1M) コマンドを使ってボードの状態を検査し、問題の原因を判定します。ドレインと完全な切り離し操作のいずれかまたは両方を再度実行し、回復可能なエラーかどうかを判定します。DR デーモンおよびドライバを停止してから起動します。

NGDR Error: Remaining system memory (memory_size mb) below minimum threshold (minimum_memory_size mb) . . . .Not enough space

切断中のボードに対してメモリーを提供するには、ドメインが十分なメモリーを保持する必要があります。ドメインがボードの切断に必要なメモリーを保持していないために、切断操作が失敗しました。 

必要なだけ多くのボードを接続して、ドメイン内のメモリーが切断中のボード上でメモリーを保持するようにします。 

NGDR Error: Some devices not re-attached. Examine the host syslog for details . . . errno_description

切り離しの強制終了中に、デバイスをオペレーティング環境に再接続できませんでした。DR デーモンが、ボード上の 1 つ以上のデバイスのデバイスドライバと通信を試みている間にエラーが発生しました。 

システムログをチェックして再接続されなかったデバイスを特定します。可能であれば、問題を訂正してから、再び complete_attach(1M) コマンドを実行してボードを完全に構成します。このアクションが失敗した場合は、未サポートのデバイスにより障害が引き起こされたと考えられるため、ドメインを再起動するまでこの問題を解決することはできません。

NGDR Error: sysconf failed (_SC_NPROCESSORS_ONLN) . . . errno_description

sysconf(3c) システムコールが、ドメイン内でオンライン状態にある CPU の合計数を返すことに失敗しました。このため、ボードの切断後に、ドメインがオンラインの CPU を保持するかどうかを DR デーモンが判断できません。

このエラーの詳細は、sysconf(3c) のマニュアルページを参照してください。参照した情報および errno_description を使ってエラーの診断および解決を行います。エラーの解決後に DR 操作を再実行します。修正されたことを明確に識別できない場合は、DR デーモンを停止してから再起動し、DR 操作を再実行してください。

自動構成エラーメッセージ

自動構成エラーメッセージの一覧を以下に示します。これらのメッセージは、システムログと SSP アプリケーションのいずれかまたは両方に送信されます。

表 A-4 自動構成エラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

NGDR Error: Complete pending DR operation prior to running autoconfig . . . Invalid argument

DR 操作が保留状態にあったために、autoconfig(1M) コマンドが失敗しました (つまり、autoconfig(1M) コマンドを実行してオペレーティング環境を再構成する前に、ボードが完全に切り離しまたは接続されていませんでした)。

dr_cmd_board_states(1M) コマンドを使用して、ボードの状態を判定します。autoconfig(1M) コマンドを使ってオペレーティング環境を再構成する前に、保留中の操作を終了させるか完了するかを決定します。

NGDR Error: Could not get /tmp/AdDrEm.lck lock . . . errno_description

DR デーモンは、オペレーティング環境を再構成する際に必要とされるロックの取得に失敗しました。 

エラーメッセージとともに送信される追加の errno_description とエラー番号のいずれかまたは両方をチェックして、ロックを取得できなかった理由を識別します。

NGDR Error: Could not unlock /tmp/AdDrEm.lck lock . . . errno_description

DR デーモンがロックを解除できませんでした。 

エラーメッセージとともに送信される追加の errno_description とエラー番号のいずれかまたは両方をチェックして、ロックが解除されなかった理由を識別します。

NGDR Error: devlinks cmd failed. . . error descriptions

devlinks(1M) コマンドが、オペレーティング環境の再構成に失敗しました。

エラーメッセージとともに送信される追加の error descriptions とエラー番号のいずれかまたは両方をチェックして、コマンドが失敗した理由を判定します。ドメイン上で、コマンドを手動で実行します。

NGDR Error: disks cmd failed . . . error descriptions

disks(1M) コマンドが、オペレーティング環境の再構成に失敗しました。

エラーメッセージとともに送信される追加の error descriptions とエラー番号のいずれかまたは両方をチェックして、コマンドが失敗した理由を判定します。ドメイン上で、コマンドを手動で実行します。

NGDR Error: drvconfig cmd failed. . . error description

drvconfig(1M) コマンドが、オペレーティング環境の再構成に失敗しました。

エラーメッセージとともに送信される追加の error description とエラー番号のいずれかまたは両方をチェックして、コマンドが失敗した理由を判定します。ドメイン上で、コマンドを手動で実行します。

NGDR Error: ports cmd failed . . . error description

ports(1M) コマンドが、オペレーティング環境の再構成に失敗しました。

エラーメッセージとともに送信される追加の error description とエラー番号のいずれかまたは両方をチェックして、コマンドが失敗した理由を判定します。ドメイン上で、コマンドを手動で実行します。

NGDR Error: sync cmd failed . . . error description

sync(1M) コマンドが、オペレーティング環境の再構成に失敗しました。

エラーメッセージとともに送信される追加の error description とエラー番号のいずれかまたは両方をチェックして、コマンドが失敗した理由を判定します。ドメイン上で、コマンドを手動で実行します。

NGDR Error: tapes cmd failed . . . error descriptions

tapes(1M) コマンドが、オペレーティング環境の再構成に失敗しました。

エラーメッセージとともに送信される追加の error description とエラー番号のいずれかまたは両方をチェックして、コマンドが失敗した理由を判定します。ドメイン上で、コマンドを手動で実行します。

ドメインエラーメッセージ

DR デーモン起動エラーメッセージ

DR デーモン起動エラーの一覧を以下に示します。これらのメッセージはドメインコンソールウィンドウにだけ送信されます。

表 A-5 DR デーモン起動エラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

Cannot create server handle

DR デーモンは RPC サーバーを起動できませんでした。このメッセージが表示されるのは、ドメイン上でネットワークサービスを適切に構成せずに DR デーモンを手動で実行する場合だけです。通常、ネットワークサービスは、SSP から着信した RPC に応答して DR デーモンを生成します。 

ドメイン上で、inetd.conf の DR デーモン用のエントリを修正します。

Cannot fork: descriptive message

DR デーモンは、RPC サーバーの実行元プロセスをフォークできませんでした。 

説明型エラーメッセージは、erro_value に対応し、DR デーモンが RPC サーバーをフォークできなかった理由を知るためのヒントを提供します。資源の限界とシステムの負荷をチェックして、このエラーを修正する方法を見つけます。

Permission denied

root 以外のユーザーが DR デーモンを実行しようとしました。 

システムを完全に調査したり、ドライバにアクセスしてボードの切断および接続を実行するために DR デーモンはすべてのルート権限を必要とするため、DR デーモンを実行できるのはスーパーユーザー (root) だけです。 

Unable to register (300326, 4)

DR デーモンが、ドメイン内のネットワークサービスに適切に登録されないまま実行されました。最初の数字は DR デーモン用に登録される RPC 番号を表します。2 番目の数字は DR デーモンが使用する RPC バージョンを表します。 

ドメイン上で、inetd.conf の DR デーモン用のエントリを修正します。

Unable to create (300326, 4) for netpath

DR デーモンが、ドメイン内のネットワークサービスに適切に登録されないまま実行されました。最初の数字は DR デーモン用に登録される RPC 番号を表します。2 番目の数字は DR デーモンが使用する RPC バージョンを表します。 

ドメイン上で、inetd.conf の DR デーモン用のエントリを修正します。

DR ドライバエラーメッセージ

システムログおよび SSP アプリケーションに送信される DR ドライバ障害のリストを以下に示します。一般に、何がシステムログに送信され、何が SSP に送信されるかについては、デーモンおよび PSM エラーの説明を参照してください。


注 -

すべての DR ドライバ障害メッセージは、表に示す 3 つの推定される原因と関連があります。このため、どの障害メッセージの場合にも、対処方法は 1 つです。


表 A-6 DR ドライバエラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

DR: Error: initiate_attach: ioctl failed

 

DR: Error: complete_attach: ioctl failed

 

DR: Error: abort_attach: ioctl failed

 

DR: Error: get_cpu_info: ioctl failed

 

DR: Error: get_mem_config: ioctl failed

ioctl() 障害 (つまり、DR デーモンが DR ドライバの使用時に検出した障害) は、次の異なる 3 つのレベルで発生します。

 

最初のレベルは、DR デーモンと DR ドライバの対話が適切に行われない場合に、DR デーモン内でエラーが発生します。DR ドライバが見つからない場合は、/devices/pseudo ディレクトリに DR ドライバが存在しないか、ファイルのアクセス権が正しく設定されていないことが考えられます。また、DR デーモンがメモリーの破壊または資源の制限を検出する場合もあります。ioctl() 障害メッセージに続き、Daemon (errno #error_number): error description の形式のメッセージが表示されます。

ioctl() 障害のコンテキスト (メッセージ内で、ioctl() の失敗部分の前にどの関数が実行されたか) は、エラーメッセージのテキストとともに、障害の対象を指し示します。エラー番号を使って ioctl(2) のマニュアルページの情報をチェックして、原因を識別します。該当するエラー番号に関する参照情報が ioctl(2) のマニュアルページに存在しない場合は、/usr/include/errno.h ヘッダファイルを使用することもできます。

DR: Error: get_mem_cost: ioctl failed

 

DR: Error: get_mem_drain: ioctl failed

 

DR: Error: update_attach: ioctl failed

 

DR: Error: ioctl failed, error draining resources

 

DR: Error: detach_board: UNCONFIGURE ioctl failed

 

DR: Error: detach_board: DISCONNECT ioctl failed

 

DR: Error: abort_detach: CANCEL ioctl failed

 

DR: Error: abort_detach: CONFIGURE ioctl failed

 

DR: Error: get_dr_state: ioctl failed

 

DR: Error: get_dr_status: ioctl failed

第 2 レベルは、DR ドライバのプラットフォーム非依存モジュール (PIM) 層内で発生します。ioctl() 障害は、使用中の資源、障害の発生したシステムボード上の I/O デバイス、または PIM とプラットフォーム固有モジュール (PSM) 層との間で不正な通信が行われたことを示します。ioctl 障害メッセージに続いて、PIM メッセージが、PIM (error #errornumber): errno_description の形式で表示されます。

 

第 3 レベルは、PSM 層内で発生します。ioctl() 障害は、使用中の資源、障害の発生したシステムボード上の I/O デバイス、メモリー切断障害、CPU 切断障害、または PSM ドライバの遭遇した内部障害を意味します。通常、エラーの説明には、障害の発生した特定の物理デバイス名、またはメモリーや CPU 切断障害の詳細な説明が含まれます。ioctl() 障害メッセージに続き、PSM メッセージが PSM (error #errornumber): errno_description の形式で表示されます。

 

PSM 層で発生した障害の場合は、対応する errno 値は存在しません。PSM 障害メッセージはエラー番号を使用します。エラー番号に関する説明は、/usr/include/sys/sfdr.h ヘッダファイルを参照してください。

 

ioctl() 障害のコンテキスト (メッセージ内で、ioctl() の失敗部分の前にどの関数が実行されたか) は、エラーメッセージのテキストとともに、障害の対象を指し示します。エラー番号を使って ioctl(2) のマニュアルページの情報をチェックして、原因を識別します。該当するエラー番号に関する参照情報が ioctl(2) のマニュアルページに存在しない場合は、/usr/include/errno.h ヘッダファイルを使用することもできます。

記憶域割り当てエラーメッセージ

システムログおよび SSP アプリケーションに送信される記憶域割り当てエラーメッセージの一覧を以下に示します。この一覧に示す各エラーメッセージには、原因となる 2 種類のエラー (ENOMEM または EAGAIN) が存在しますが、ここではその一方だけについて説明します。すべての ENOMEM エラーの対処方法は、EAGAIN エラーの場合と同様です。

表 A-7 記憶域割り当てエラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

NGDR Error: malloc failed (add notnet ap info) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (alias_namelen) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (AP ctlr_t array) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (ap_controller) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (board_cpu_config_t) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (board_mem_config_t) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (board_mem_cost_t) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (board_mem_drain_t) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (dr_io) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (leaf array) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (leaf) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (net_leaf_array) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (sbus_cntrl_t) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (sbus_config) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (sbus_device_t) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (sbus_usage_t) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。デーモンをいったん停止して、再起動する必要があります。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (struct devnm) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (swap name entries) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (swaptbl) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

NGDR Error: malloc failed (unsafe_devs) errno_description

システム情報の照会中に、要求された情報を返す構造体に対し、DR デーモンが十分な記憶域を割り当てることができませんでした。DR デーモンが資源の制限を検出した可能性があります。DR デーモンが記憶域を割り当てることができない場合は、動作を続行することはできません。通常、errno_description には ENOMEM または EAGAIN エラーが記述されます。

まず、ps(1) コマンドを使ってデーモンのサイズを調べます。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、メモリーリークが発生している可能性があります。メモリーリークが発生している場合は、この問題を報告してください。ENOMEM エラーは、DR デーモンが回復不可能な状態にあることを意味します。EAGAIN エラーは、問題が一時的であることを意味します。操作を再度実行することで成功する場合もあれば、デーモンの停止および再起動が必要な場合もあります。

PSM (Platform Specific Module) エラーメッセージ

システムログおよび SSP アプリケーションに送信される PSM エラーメッセージの一覧を以下に示します。

表 A-8 PSM エラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

1 SFDR_ERR_INTERNAL

内部ドライバに問題が発見されました。 

なし 

2 SFDR_ERR_SUSPEND

デバイスの保存停止に失敗しました。 

なし 

3 SFDR_ERR_RESUME

保存停止したデバイスの復元再開に失敗しました。 

なし 

4 SFDR_ERR_UNSAFE

停止している安全ではないデバイスを参照したため、オペレーティングシステムの休止に失敗しました。 

ドメイン内にある安全でないデバイスの入出力の使用法を確認し、安全でないデバイスを手動で停止します。 

5 SFDR_ERR_UTHREAD

ユーザースレッドを停止できませんでした。 

操作を再試行します。エラーが続く場合は、 kill(1) コマンドを使ってプロセスの停止を試みます。

6 SFDR_ERR_RTTHREAD

リアルタイムスレッドを停止できませんでした。 

操作を再試行します。エラーが続く場合は、 kill(1) コマンドを使ってプロセスの停止を試みます。

7 SFDR_ERR_KTHREAD

カーネルスレッドを停止できませんでした。 

操作を再試行します。エラーが続く場合は、 kill(1) コマンドを使ってプロセスの停止を試みます。

8 SFDR_ERR_OSFAILURE

カーネルは、DR ドライバ用の DR 操作を適切に処理していません。 

なし 

9 SFDR_ERR_OUTSTANDING

以前の DR ドレイン操作に起因するエラーが DR ステータスコマンド経由で報告されていないため、ioctl() が失敗しました。

操作を再度実行します。 

11 SFDR_ERR_CONFIG

現在のシステム構成では、DR 操作を実行できません。 

/etc/system ファイルをチェックして、メモリー切断を可能にします。

12 SFDR_ERR_NOMEM

メモリーが不足しています。 

なし 

13 SFDR_ERR_PROTO

プロトコル障害 

なし 

14 SFDR_ERR_BUSY

デバイスは使用中です。 

デバイスの I/O 使用状況をチェックして、このエラーの原因 (たとえば、マウントされたファイルシステムまたは AP デバイスへの最後のパス) を判定します。可能であれば、手動でシステムを調整してこのエラーを訂正します (たとえば、ファイルシステムのマウント解除)。エラーの原因が明確でない場合は、購入先にお問い合わせください。 

15 SFDR_ERR_NODEV

デバイスが存在しません。 

なし 

16 SFDR_ERR_INVAL

無効な引数と操作のいずれかまたは両方 

なし 

17 SFDR_ERR_STATE

無効なボード状態 (遷移) 

なし 

18 SFDR_ERR_PROBE

ボード用の OBP ノードのプローブに失敗しました。 

なし 

19 SFDR_ERR_DEPROBE

ボード用の OBP ノードのデプローブに失敗しました。 

なし 

20 SFDR_ERR_HW_INTERCONNECT

相互接続ハードウェアが失敗しました。 

なし 

21 SFDR_ERR_OFFLINE

CPU をオフラインにすることに失敗しました。 

なし 

22 SFDR_ERR_ONLINE

CPU をオンラインにすることに失敗しました。 

なし 

23 SFDR_ERR_CPUSTART

CPU の開始に失敗しました。 

なし 

24 SFDR_ERR_CPUSTOP

CPU の停止に失敗しました。 

なし 

25 SFDR_ERR_JUGGLE_BOOTPROC

クロック信号 CPU の移動に失敗しました。 

なし 

26 SFDR_ERR_CANCEL

RELEASE 操作の取消しに失敗しました。 

ドレイン操作の完了後に Abort Detach 操作を再実行します。 

DR の一般的なドメインエラーメッセージ

一般的な障害エラーメッセージの一覧を以下に示します。これらのメッセージは、システムログと SSP アプリケーションのいずれかまたは両方に送信されます。

表 A-9 DR の一般的なドメイン障害エラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

NGDR Error: Cannot fork() process . . . errno_description

DR デーモンは、プロセスをフォークしてコマンドを実行することができませんでした。このエラーメッセージまたは障害の発生したコマンドに関するエラーメッセージに先立ち、「running command」形式のメッセージがシステムログに記録されます。 

errno_description には、実行しようとしたコマンドを修正する上でのヒントが含まれています。また、該当するコマンドのマニュアルページをチェックします。マニュアルページには、発生したエラーに関する説明が含まれている場合があります。

DR Error: command has continued

DR デーモンが外部コマンドを実行中に、外部コマンドの 1 つが失敗または異常終了しました。DR は外部コマンド (例、drvconf) を実行し、ソフトウェアサブシステムを構成します。

ドメインでプログラムを手動実行します。コマンドが再度失敗する場合は、そのコマンドのマニュアルページを参照してください。マニュアルページにエラーに関する説明が含まれている場合があります。 

DR Error: command stopped by signal signal_number

DR デーモンが外部コマンドを実行中に、外部コマンドの 1 つが失敗または異常終了しました。DR は外部コマンド (例、drvconf) を実行し、ソフトウェアサブシステムを構成します。

ドメインでプログラムを手動実行します。コマンドが再度失敗する場合は、そのコマンドのマニュアルページを参照してください。マニュアルページにエラーに関する説明が含まれている場合があります。 

DR Error: command terminated due to signal signal_number

DR デーモンが外部コマンドを実行中に、外部コマンドの 1 つが失敗または異常終了しました。DR は外部コマンド (例、drvconf) を実行し、ソフトウェアサブシステムを構成します。

ドメインでプログラムを手動実行します。コマンドが再度失敗する場合は、そのコマンドのマニュアルページを参照してください。マニュアルページにエラーに関する説明が含まれている場合があります。 

DR Error: command terminated due to signal signal_number. Core dumped.

DR デーモンが外部コマンドを実行中に、外部コマンドの 1 つが失敗または異常終了しました。DR は外部コマンド (例、drvconf) を実行し、ソフトウェアサブシステムを構成します。

ドメインでプログラムを手動実行します。コマンドが再度失敗する場合は、そのコマンドのマニュアルページを参照してください。マニュアルページにエラーに関する説明が含まれている場合があります。 

NGDR Error: dr_issue_ioctl: failed closing driver . . . errno_description

DR デーモンによる DR ドライバのエントリポイントのクローズ中に障害が発生しました。この障害の詳細は、エラーメッセージを参照してください。 

close(2) のマニュアルページおよび errno_description を参照して、このエラーの原因および解決方法を識別します。

Cannot exec command (errno = errno_value).

DR デーモンは、外部コマンドを実行できませんでした。この障害の詳細は、エラーメッセージを参照してください。 

システムログをチェックして、失敗したコマンドを特定します。特定の errno_value の詳細は、exec(2) のマニュアルページを参照してください。参照した情報を使ってエラーを解決します。

dr_get_sysbrd_info: NULL parameter

スロットからメモリーへのアドレスマッピングの照会中に、無効なポインタが DR デーモンに渡されました。原因は、RPC が不正な値を渡したか、または DR デーモンが無効なパラメタで自らを呼び出したかのいずれかです。 

この問題に関する情報をシステムログからできる限り収集し、障害の原因を識別します。DR デーモンと SSP アプリケーションを停止してから再起動してみます。エラーが続く場合は、購入先にお問い合わせください。 

update_cpu_info: bad board number

DR デーモン内で問題が発生し、不正な値で内部ルーチンが呼び出されました。 

この問題に関する情報をシステムログからできる限り収集し、障害の原因を識別します。エラーが続く場合は、デーモンを停止し、再起動することが必要な場合があります。 

WARNING: Failed to update board board_number's modification time [non-fatal].

ボードの変更時間の更新に失敗しました。ボードの変更後 (たとえば、メモリーや CPU の追加) に OBP によるプローブまたはデプローブが実行され、OBP による他のプログラムに対する変更通知が可能になります。その後、変更時間が更新されます。 

これは、重大なエラーではありません。 

OpenBoot PROM エラーメッセージ

OpenBootTM PROM (OBP) エラーメッセージの一覧を以下に示します。これらのメッセージは、システムログと SSP アプリケーションのいずれかまたは両方に送信されます。

表 A-10 OpenBoot PROM エラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

cpu unit without upa-portid [non-fatal]

このメッセージは、OBP 構造内に、破壊された値または不正な値が発見されたことを示しています。これは、OBP Configuration ウィンドウ内の情報が正確ではないことを意味します。 

これは重大なエラーではありません。このエラーが続く場合は、ドメインを再起動してください。再起動後もエラーが表示される場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。 

OBP_info: bad child units [non-fatal]

このメッセージは、OBP 構造内に、破壊された値または不正な値が発見されたことを示しています。これは、OBP Configuration ウィンドウ内の情報が正確ではないことを意味します。 

これは重大なエラーではありません。このエラーが続く場合は、ドメインを再起動してください。再起動後もエラーが表示される場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。 

obp_info: bad slot number [non-fatal]

このメッセージは、OBP 構造内に、破壊された値または不正な値が発見されたことを示しています。これは、OBP Configuration ウィンドウ内の情報が正確ではないことを意味します。 

これは重大なエラーではありません。このエラーが続く場合は、ドメインを再起動してください。再起動後もエラーが表示される場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。 

obp_info: missing sbus name [non-fatal]

このメッセージは、OBP 構造内に、破壊された値または不正な値が発見されたことを示しています。これは、OBP Configuration ウィンドウ内の情報が正確ではないことを意味します。 

これは重大なエラーではありません。このエラーが続く場合は、ドメインを再起動してください。再起動後もエラーが表示される場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。 

obp_info: missing slot number [non-fatal]

このメッセージは、OBP 構造内に、破壊された値または不正な値が発見されたことを示しています。これは、OBP Configuration ウィンドウ内の情報が正確ではないことを意味します。 

これは重大なエラーではありません。このエラーが続く場合は、ドメインを再起動してください。再起動後もエラーが表示される場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。 

sbus node without upa-portid [non-fatal]

このメッセージは、OBP 構造内に、破壊された値または不正な値が発見されたことを示しています。これは、OBP Configuration ウィンドウ内の情報が正確ではないことを意味します。 

これは重大なエラーではありません。このエラーが続く場合は、ドメインを再起動してください。再起動後もエラーが表示される場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。 

sysio_num out of range [non-fatal]

このメッセージは、OBP 構造内に、破壊された値または不正な値が発見されたことを示しています。これは、OBP Configuration ウィンドウ内の情報が正確ではないことを意味します。 

これは重大なエラーではありません。このエラーが続く場合は、ドメインを再起動してください。再起動後もエラーが表示される場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。 

NGDR Error: cannot open /dev/openprom. . . errno_description

DR デーモンは、ドメインの OBP 情報のエントリポイントをオープンできませんでした。これは、OBP Configuration ウィンドウに何も情報が表示されないことを意味します。これは重大なエラーではありません。 

open(2) のマニュアルページおよび errno_description を参照して、このエラーの原因を特定します。DR デーモンが資源の制限を検出した可能性があります。その場合は、デーモンを停止してから再起動します。また、DR デーモンのサイズもチェックします。DR デーモンは 300 〜 400 KB のメモリーを使用します。デーモンのサイズがこの範囲内にない場合は、デーモンを停止してから再起動してください。ドメインでこのエラーが引き続き表示される場合、またメモリーリークの兆候が見られる場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。

NGDR Error: close error on /dev/openprom

DR デーモンが、OBP ドライバのエントリポイントのクローズに失敗しました。 

このエラーメッセージの前に表示されたエラーメッセージを使って、エラーの原因を特定します。可能ならエラーを訂正します。 

NGDR Error: dev/openprom busy. Cannot open.

ドメイン OBP 情報のエントリポイントが使用中です。これは、OBP Configuration ウィンドウに何も情報が表示されないことを意味します。これは、致命的なエラーではありません。 

操作を再実行します。ps(1M) コマンドを使って、エントリポイントをオープンしているプロセスをチェックします。エントリポイントをオープンしているプロセスをすべて停止します。

NGDR Error: get_obp_board_config: invalid board state

SSP アプリケーションがボードの OBP 情報を照会しようとした際、通信プロトコルがボードの有効性に問題があることを報告しました。SSP に関しては、ボードはドメインの一部であるため、SSP はボード資源を空にしようとします。ただし、DR ドライバおよびデーモンにとっては、ボードはドメインの一部ではありません。 

なし 

NGDR Error: OBP config: too many CPUs

DR デーモンが検出した、OBP 構造内のシステムボードに属する CPU の数が多すぎます。OBP に関しては、ボードが保持する CPU の数が限界 (たとえば、5 以上) を上回っています。 

OBP が適切に動作していることを確認します。適切に動作していない場合は、ドメインを再起動してください。 

NGDR Error: OPROMCHILD. . . errno_description

OBP ドライバのエントリポイントで実行された ioctr()、特に、デバイスツリー内の子 OBP ノードを越えるときに使用された ioctr() が失敗しました。これは、OBP Configuration ウィンドウ内での情報表示が完了しないことを意味します。

このエラーメッセージとともに表示される errno_value または errno_description を使って、エラーの原因を特定します。可能ならエラーを訂正します。

NGDR Error: OPROMGETPROP. . . errno_description

OBP ドライバのエントリポイントで実行された ioctl()、特に、OBP プロパティの取得に使用される ioctl() が失敗しました。これは、OBP Configuration ウィンドウ内での情報表示が完了しないことを意味します。

このエラーメッセージとともに表示される ioctl(2) マニュアルページと errno_description を使って、エラーの原因を特定します。可能ならエラーを訂正します。

NGDR Error: OPROMNEXT. . . errno_description

OBP ドライバのエントリポイントで実行された ioctr()、特に、デバイスツリー内の子 OBP ノードを越えるときに使用された ioctr() が失敗しました。これは、OBP Configuration ウィンドウ内での情報表示が完了しないことを意味します。

このエラーメッセージとともに表示される ioctl(2) マニュアルページと errno_description を使って、エラーの原因を特定します。可能ならエラーを訂正します。

NGDR Error: System architecture does not support this option of this command.

DR デーモンがドメインの OBP ツリー内でノードを越えたときに、未サポートのオプションが DR デーモンに渡されました。これは、OBP Congiruration ウィンドウ内の情報の一部が不正確になることを意味します。これは、重大なエラーではありません。 

なし 

DR のドメインシステム調査エラーメッセージ

システム調査エラーメッセージの一覧を以下に示します。これらのメッセージは、システムログと SSP アプリケーションのいずれかまたは両方に送信されます。

表 A-11 DR のドメインシステム調査エラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

Cannot open /etc/driver_aliases; dr_daemon may not operate correctly without driver alias mappings . . . errno_description

DR デーモンが、ドメイン内のデバイスの切断可能性および使用法について不正な決定をしました。これは、致命的なエラーではありません。 

errno_description を参照して、エラーの原因を分析し、エラーの訂正を試みます。オープンしようとしたファイルへの不正なアクセス権または何らかの資源の制限を検出します。エラーを訂正した後に、DR デーモンを停止し、その後再起動して、ドライバエイリアスマッピングの読み取りを再度試みます。

Cannot open mnttab (errno=errno_value)

mnttab ファイルを開いてどのファイルシステムがマウントされたかを検査できない場合は、DR デーモンは切断可能性テストを通過させることはできません。テストが停止しない場合は、マウントされたファイルシステムをドメインから切断できます。

errno_value を使ってこのエラーの原因を分析し、エラーの訂正を試みます。DR デーモンが資源の制限を検出した可能性があります。その場合は、デーモンを停止してから再起動します。また、DR デーモンのサイズもチェックします。DR デーモンのサイズは 300 〜 400 KB の範囲内になければなりません。範囲外の場合は、デーモンを停止してから再起動します。

Cannot open socket (errno=errno_value)

 

このエラーメッセージは、システムログだけに送信されます。 

DR デーモンは、ネットワークデバイスをオープンできませんでした。使用状況をテストするため、すべてのネットワークデバイスがオープンされます。 

errno_value を使ってこのエラーの原因を特定します。DR デーモンが資源の制限を検出した可能性があります。その場合は、デーモンを停止してから再起動します。また、DR デーモンのサイズもチェックします。DR デーモンのサイズは 300 〜 400 KB の範囲内になければなりません。400 KB を超えている場合は、デーモンを停止してから再起動します。ドメインでこのエラーが引き続き表示される場合、またメモリーリークの兆候が見られる場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。

get_cpu_bindings: can't access /proc filesystem [non-fatal].

/proc ファイルシステムを開くことができませんでした。DR デーモンがドメインを調査して、ボードの CPU 情報を判定する際に、/proc ファイルシステムを検査して、どの PID が (存在する場合) ボード上の CPU に結合されているかを判定します。結合プロセスは、ボードの切断可能性にマイナスの影響を与えます。プロセスが CPU に結合されている場合は、完全な切り離し操作は失敗します。

/proc ファイルシステムにアクセスできない理由をチェックします。ドメイン内でプロセスバインディングおよびプロセッサセット管理プログラム、またはプロセッサ管理プログラムを使用して、ボードの CPU 情報を手動で判定できます。

get_mem_config: couldn't determine total system memory size; only 1 board counted [non-fatal].

DR デーモンによる総メモリー容量の計算時にレポートできたのは、選択されたボード上のメモリー容量だけでした。これは、drshow board_number mem コマンドによりレポートされたシステムメモリーフィールドの値が不正確であることを意味します。値が不正確になると、切り離し操作時のボードの適正にマイナスの影響を与えます。総メモリー容量を計算できない場合、ドメインからボードを削除することによる影響も予測できません。

DR デーモンおよびドライバを停止してから再起動します。この問題に関する情報をシステムログからできる限り収集し、報告してください。時間の経過とともにメモリーリークが発生した可能性もあります。ps(1) コマンドを使って DR デーモンのサイズをチェックしてください。サイズは 300 〜 400 KB の範囲内であるはずです。DR デーモンのサイズがこの範囲内にない場合は、DR デーモンおよびドライバを停止してから再起動してください。

get_net_config_info: interface_name no address (errno=errno_value)

ifconfig(1M) コマンドを使って構成されたネットワークインタフェース情報の取得中に、DR デーモンが障害を検出しました。

errno_value を使ってこのエラーの原因を特定し、エラーを訂正します。

getmntent returned error

マウントポイントエントリを適切に検出できなかったために、getmntent(3c) システムコールが失敗しました。原因として、マウントされたファイルシステムがドメインから切断されたことが考えられます。

mnttab ファイルの破損の可能性があります。ファイルが破損している場合は修復します。また、DR デーモンが資源の制限を検出した可能性があります。その場合は、デーモンを停止してから再起動します。DR デーモンのサイズもチェックします。DR デーモンのサイズは 300 〜 400 KB の範囲内になければなりません。範囲外の場合は、デーモンを停止してから再起動します。ドメインでこのエラーが引き続き表示される場合、またメモリーリークの兆候が見られる場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。

Host addr for interface_name not found (h_errno=errno_value)

アクティブな各ネットワークデバイスのテストに必要なファイルが存在しないか、壊れています。ネットワークデバイスの検査の際、アクティブな各ネットワークデバイスが、ドメイン用の主ネットワークインタフェースであるかどうかの判定テストが行われます。どのアクティブネットワークデバイスがドメインの主ネットワークインタフェースであるかを判定できない場合は、DR デーモンは切り離し可能性テストを通過させません。 

errno_value を使ってファイルが存在するかどうか、またはファイルが壊れているかどうかを判定し、必要に応じてエラーを訂正します。ファイルの名前は、/etc/hostname.interface_nameinterface_name にはエラーメッセージに表示されたインタフェース名が当てはまります。

Host address field for interface_name is null!!

主インタフェース (interface_name) の IP アドレス が正しく設定されていません。ネットワークデバイスの検査の際、アクティブな各ネットワークデバイスが、ドメイン用の主ネットワークインタフェースであるかどうかの判定テストが行われます。どのアクティブネットワークデバイスがドメインの主ネットワークインタフェースであるかを判定できない場合は、DR デーモンは切り離し可能性テストを通過させません。

ドメインのネットワーク設定を再構成します。ネットワークデバイスを構成するために、ドメインの再起動が必要な場合もあります。 

Host address for interface_name must be internet address.

アクティブな各ネットワークデバイスのテストに必要なファイルの値またはネットワークアドレスが正しくない可能性があります。ネットワークデバイスの検査の際、アクティブな各ネットワークデバイスが、ドメイン用の主ネットワークインタフェースであるかどうかの判定テストが行われます。どのアクティブネットワークデバイスがドメインの主ネットワークインタフェースであるかを判定できない場合は、DR デーモンは切り離し可能性テストを通過させません。 

主ネットワークインタフェースのホスト名ファイルに、適切な形式 (つまり、xxx.xxx.xxx.xxx) で IP アドレスが含まれていることを確認します。ファイル名は、/etc/hostname.interface_nameinterface_name にはエラーメッセージに表示されたインタフェース名が当てはまります。

I/O bus device tree not built.

このエラーメッセージは、libdevinfo API がシステムボード用のデバイスツリーの構築に失敗したことを示す NGDR Error: device tree not built エラーメッセージに関する追加情報として表示されます。

NGDR Error: device tree not built エラーメッセージを参照してください。

minor_walk: failed to build net leaf.

このエラーメッセージは、libdevinfo API がシステムボード用のデバイスツリーの構築に失敗したことを示す NGDR Error: device tree not built エラーメッセージに関する追加情報として表示されます。このメッセージは、libdevinfo API が非ネットワーク用ノードのマイナーデバイスの検索を開始したことを示します。

NGDR Error: device tree not built エラーメッセージを参照してください。

minor_walk: failed to build non-net leaf.

このエラーメッセージは、device tree not built エラーメッセージに関する追加情報として表示され、libdevinfo API が非ネットワーク用ノードのマイナーデバイスの検索を開始したことを示します。

NGDR Error: I/O bus device tree not built エラーメッセージを参照してください。

Partition partition_name does not have parent.

デバイスツリーに親デバイス (パーティションが属するディスクなど) を持たないディスクパーティションが含まれるためにエラーが発生しました。 

デバイスが不良であるか、または再起動が必要です。このエラーが引き続き表示される場合は、この問題に関する情報をシステムログからできる限り収集し、購入先にお問い合わせください。 

Recursive symlink found `symbolic_link_name'. Please remove it.

DR デーモンが /dev および /devices ディレクトリを移動した際に、シンボリックリンクを検出しました。その中に、再帰ループを形成するシンボリックリンクが存在します。DR デーモンがこれらのディレクトリのどれかにシンボリックリンクを発見すると、切り離し可能性テストを通過させません。

シンボリックリンクを削除して、テストを再度実行します。 

swapctl SC_GETNSWP failed (errno=errno_value)

swapctl(2) システムコールが失敗しました。このシステムコールは、スワップ空間として使用中のディスクパーティションの識別に使用されます。スワップパーティションの使用を識別できない場合は、DR デーモンは切断可能性テストを通過させません。

errno_value を使ってこのエラーの原因を分析します。swapctl(2) のマニュアルページおよび errno_value を使ってコマンドが失敗した原因を特定します。DR デーモンが資源の制限を検出した可能性があります。その場合は、デーモンを停止してから再起動します。また、DR デーモンのサイズもチェックします。DR デーモンのサイズは 300 〜 400 KB の範囲内になければなりません。範囲外の場合は、デーモンを停止してから再起動します。ドメインでこのエラーが引き続き表示される場合、またメモリーリークの兆候が見られる場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。

Unable to find cwd errno_value

DR デーモンが、現在の作業用ディレクトリを保存できませんでした。デーモンは、/dev および /devices ディレクトリ内に移動して、デバイスドライバに対応する実際のパス名を作成します。

getcmd(3c) のマニュアルページおよび errno_value を参照して、このエラーの原因を特定し、エラーを訂正します。

Unable to get swap entries (errno=errno_value)

swapctl(2) システムコールが失敗しました。このシステムコールは、スワップ空間として使用中のディスクパーティションの識別に使用されます。スワップパーティションの使用を識別できない場合は、DR デーモンは切断可能性テストを通過させません。

swapctl(2) のマニュアルページと errno_value を使ってこのエラーの原因を分析し、訂正を試みます。DR デーモンが資源の制限を検出した可能性があります。その場合は、デーモンを停止してから再起動します。また、DR デーモンのサイズもチェックします。DR デーモンのサイズは 300 〜 400 KB の範囲内になければなりません。範囲外の場合は、デーモンを停止してから再起動します。このエラーが引き続き表示される場合、またメモリーリークの兆候が見られる場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。

Unable to lstat devlink_file errno_value

lstat(2) システムコールが devlink_file にアクセスした際に障害が発生しました。devlink には /dev ディレクトリ内のシンボリックリンク名が当てはまります。

lstat(2) のマニュアルページと errno_value を使ってこのエラーの原因を分析します。DR デーモンが資源の制限を検出した可能性があります。その場合は、デーモンを停止してから再起動します。また、DR デーモンのサイズもチェックします。DR デーモンのサイズは 300 〜 400 KB の範囲内になければなりません。範囲外の場合は、デーモンを停止してから再起動します。ドメインでこのエラーが引き続き表示される場合、またメモリーリークの兆候が見られる場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。

Unable to open hostname_file (errno=errno_value)

アクティブな各ネットワークデバイスのテストに必要な情報を取得できません。ネットワークデバイスの検査の際、アクティブな各ネットワークデバイスが、ドメイン用の主ネットワークインタフェースであるかどうかの判定テストが行われます。どのアクティブネットワークデバイスがドメインの主ネットワークインタフェースであるかを判定できない場合は、DR デーモンは切断可能性テストを通過させません。 

open(2) のマニュアルページおよび errno_value を参照して、このエラーの原因を分析し、エラーの訂正を試みます。不正なファイルのアクセス権または存在しないファイルを見つけます。hostname_file 値は、/etc/hostname.ifname という名前のファイルで構成されています。ifname には、デバイス名 (hme0le0 など) が当てはまります。

Unable to read host name from hostname_file

アクティブな各ネットワークデバイスのテストに必要なファイルを読み取れません。ネットワークデバイスの検査の際、アクティブな各ネットワークデバイスが、ドメイン用の主ネットワークインタフェースであるかどうかの判定テストが行われます。どのアクティブネットワークデバイスがドメインの主ネットワークインタフェースであるかを判定できない場合は、DR デーモンは切断可能性テストを通過させません。 

ファイルのアクセス権が適切であること、およびファイルが壊れていないことを確認します。 

Unable to readlink devlink_file errno_value

readlink(2) システムコールが devlink_file にアクセスした際に障害が発生しました。devlink には /dev ディレクトリ内のシンボリックリンク名が当てはまります。

readlink(2) のマニュアルページと errno_value を使ってこのエラーの原因を特定します。DR デーモンが資源の制限を検出した可能性があります。その場合は、デーモンを停止してから再起動します。また、DR デーモンのサイズもチェックします。DR デーモンのサイズは 300 〜 400 KB の範囲内になければなりません。範囲外の場合は、デーモンを停止してから再起動します。ドメインでこのエラーが引き続き表示される場合、またメモリーリークの兆候が見られる場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。

Unable to restore cwd errno_value

DR デーモンは、/dev または /devices ディレクトリへの移動後に、元のディレクトリに戻ることができませんでした。DR デーモンは、デバイスドライバと他のドライバとの関連を調べるために、/dev および /devices ディレクトリに移動します。

ドメインに関しては、このエラーは問題にはなりません。ただし、errno_value を使用してエラーの原因を識別する必要があります。

Unable to set cwd errno_value

DR デーモンは、/dev および /devices ディレクトリに移動できませんでした。デーモンは、これらの ディレクトリ内に移動して、デバイスドライバに対応する実際のパス名を作成します。

chdir(2) のマニュアルページおよび errno_value を参照して、このエラーの原因を特定してから、エラーを訂正します。

unknown node type

デバイスツリーが、不正な仕方で構築されました。いくつかの関数が、libdevinfo API を使ってシステムボードのデバイスツリーを作成し、/dev および /devices ディレクトリを検索します。ツリーは、構築後に rpc_info() 関数に渡されます。この関数は、ツリーの構築および検証を行った後、RPC から返すことのできる構造にツリーを変換します。

DR デーモンのサイズをチェックします。DR デーモンのサイズは 300 〜 400 KB の範囲内になければなりません。範囲外の場合は、デーモンを停止してから再起動します。ドメインでこのエラーが引き続き表示される場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。 

utssys failed (errno_value) for mount_point

utssys() システムコールが失敗しました。このシステムコールは、マウントされたパーティションの使用状況を識別するために使用されます。マウントされたパーティションの使用を識別できない場合は、DR デーモンは切断可能性テストを通過させません。

errno_value を使ってこのエラーの原因を分析し、訂正を試みます。DR デーモンが資源の制限を検出した可能性があります。その場合は、デーモンを停止してから再起動します。また、DR デーモンのサイズもチェックします。DR デーモンのサイズは 300 〜 400 KB の範囲内になければなりません。範囲外の場合は、デーモンを停止してから再起動します。ドメインでこのエラーが引き続き表示される場合、またメモリーリークの兆候が見られる場合は、エラーに関する情報をできる限り収集し、購入先にお問い合わせください。

walk_dir: dirlist buffer overflow.

DR デーモンが /dev および /devices ディレクトリを移動した際に、検出したディレクトリの数が多すぎたため、バッファオーバーフローが発生しました。このメッセージが表示された場合は、再帰的シンボリックリンクに対する検出機能または保護機能は無効になります。

/dev および /devices ディレクトリをチェックして、再帰的シンボリックリンクを検索します。検出されたすべての再帰的シンボリックリンクを削除します。

walk_dir: tpath buffer overflow. target_path, device_name

DR デーモンは、target_path に別のディレクトリを追加できませんでした。デーモンは /dev および /devices ディレクトリを移動してデバイス名のリンクを検出し、ターゲットパスに追加します。デーモンがこの制限に遭遇すると、バッファオーバーフローのためにこれ以上ディレクトリを調査できなくなります。デーモンが検索を中止すると、いくつかのデバイスはドメインデバイスツリーのビュー (DR デーモンおよび SSP) に表示されません。このエラーの発生により、AP デバイスの不正な自動スイッチ機能が動作する場合もあります。

ターゲットパスに追加されないデバイスの場合は、構成を手動で解除し、ドメイン内の他のボードに切り替える必要があります。また、デバイスをオープンしているデーモンを停止する必要もあります。 

WARNING: cannot check for cvc/ssp interface.

アクティブな各ネットワークデバイスのテストに必要な情報を取得できません。ネットワークデバイスの検査の際、アクティブな各ネットワークデバイスが、ドメインの SSP ネットワークインタフェースに対応するかどうかの判定テストが行われます。SSP ネットワークインタフェースとの対応が特定できない場合は、DR デーモンは切断可能性テストを通過させません。 切断操作中にネットワークが SSP ネットワークインタフェースを失うと、ドメイン内での DR 操作、および netcon(1M) セッションは無効になります。

問題があると考えられるインタフェースから、他のボード上の冗長なネットワーク接続に切り替えます。このエラーから回復するために、ドメインの再起動が必要な場合もあります。 

WARNING: Cannot check for primary interface

アクティブな各ネットワークデバイスのテストに必要な情報を取得できません。ネットワークデバイスの検査の際、アクティブな各ネットワークデバイスが、ドメイン用の主ネットワークインタフェースであるかどうかの判定テストが行われます。どのアクティブネットワークデバイスがドメインの主ネットワークインタフェースであるかを判定できない場合は、DR デーモンは切断可能性テストを通過させません。 

主ネットワークインタフェースを担当するボードを識別し、そのボードをドメインに再接続します。または、インタフェースを、ドメイン内の他のボード上の冗長なネットワーク接続に切り替えます。このエラーから回復するために、ドメインの再起動が必要な場合もあります。 

WARNING: Cannot determine if interface_name_instance is cvc/ssp interface. SIOCGIFNETMASK errno=errno_value

アクティブなネットワークインタフェースが SSP 接続であるかどうかを判定するテストに必要な情報を取得できません。どのアクティブネットワークデバイスがドメインの SSP 接続であるかを判定できない場合は、DR デーモンは切断可能性テストを通過させません。DR Detach 操作中にネットワークが SSP 接続を失うと、ドメイン内での DR 操作、および netcon(1M) セッションは無効になります。

ネットワークインタフェース (interface_name) を別のボードに切り替えます。このエラーを訂正できない場合は、ドメインを再起動してください。

WARNING: cannot stat device_name errno=errno_value

stat(2) システムコールが、システムデバイスツリー内のデバイス用の /dev エントリポイントにアクセスできません。

stat(2) のマニュアルページおよび errno_value を参照して、ファイル device_name へアクセスできない原因を調べます。

NGDR Error: Bad page size from sysconf . . . errno_description

sysconf(3c) システムコールが、不正なシステムページサイズの値を返しました。これは、システムコールが壊れているか、必要な機能を備えていないかのいずれかであることを意味します。また、このエラーには、不正なメモリーサイズのレポートにより、メモリー情報の照会や切断可能性テストが失敗する理由も説明します。

sysconf(3c) のマニュアルページおよび errno_value を参照して、エラーの原因を突き止めます。

NGDR Error: device tree not built.

libdevinfo API が、システムボード用デバイスツリーの構築に失敗しました。このエラーの詳細情報は、エラーメッセージを参照してください。

ドメインに含まれるのが適切なバージョンの libdevinfo API であること、また DR デーモンのライブラリ、ドメインのオペレーティング環境、または DR デーモン自体の間にバージョンの不整合が存在しないことも確認します。原因が不明な場合は、購入先にお問い合わせください。

NGDR Error: dr_get_partn_cpus: failed to get cpu partition info . . . errno_description

DR デーモンは、pset_info(2) 関数の実行を試みましたが、関数は失敗しました。DR デーモンは、この関数を使ってプロセッサセットおよびパーティション情報を取得し、CPU Configuration ウィンドウに送信します。

pset_info(2) のマニュアルページおよび errno_description を参照して、エラーの原因を識別し、訂正します。

NGDR Error: dr_page_to_kb: page size smaller than a KB

数値演算エラーが発生したか、メモリー計算で不正なメモリー値が使用されました。 

ハードウェアに障害のある可能性があるので、購入先にご連絡ください。 

NGDR Error: get_board_config: invalid board state

ボードの有効性に影響する通信プロトコル違反が発生しました。SSP に関しては、ボードはドメインの一部です。ただし、DR ドライバおよびデーモンに関しては、ボードはドメインの一部ではありません。 

DR アプリケーションを停止してから起動し、操作を再実行します。エラーが引き続き発生する場合は、kill(1M) コマンドを使って DR デーモンを停止してから起動し、DR 操作を再実行します。

NGDR Error: get_board_config: invalid flag

DR デーモンによるボード構成の確認時に、SSP が無効または未サポートのフラグを DR デーモンに渡しました。 

SSP と DR デーモンで、バージョン番号が一致することを確認します。また、ps(1) コマンドを使ってデーモンのサイズも確認します。通常、デーモンは約 300 〜 400 KB のメモリーを使用します。デーモンのサイズがこの値よりもはるかに大きい場合は、デーモン内で内部エラーが発生した可能性があります。このエラーから回復するために、DR デーモンの停止および再起動が必要な場合があります。

NGDR Error: libdevinfo failed.

libdevinfo API のオープンに使用する初期ルーチンが失敗したため、DR デーモンはボード用のデバイスツリーを調査できませんでした。libdevinfo は、ボードの dev-info ノードツリーを、DR デーモンのドメインデバイス調査およびその使用状況の一部として構築します。このツリーは、ボード I/O デバイスの切断可能性をテストする際、AP および DR 操作により必要とされます。このツリーはまた、ユーザーに対し、どのシステムボードにどのデバイスが存在するかを知らせる目的でも使用されます。

ドメインに含まれるのが適切なバージョンの libdevinfo であること、また DR デーモンのライブラリ、ドメインのオペレーティング環境、または DR デーモン自体の間にバージョンの不整合が存在しないことも確認します。原因が不明な場合は、購入先にお問い合わせください。

get_cpu_info: cpu state info is incomplete [non-fatal].

DR デーモンが、CPU の状態情報 (オンラインまたはオフライン) を収集できませんでした。このため、CPU Configuration ウィンドウ内の各 CPU に関する情報は、正確ではありません。 

なし 

NGDR Error: build_rpc_info: bad slot number

デバイスツリーは構築されましたが正しくありません。いくつかの関数は、/dev/devices ディレクトリを検索し、かつ libdevinfo API を使用して、システムボードのデバイスツリーを作成します。ツリーを構築すると、メッセージが build_rpc_info() 関数に渡されます。この関数は、DR デーモンのデバイスツリーを RPC から復帰可能な構造に変換する際、ツリーを検証します。

ps(1) コマンドを使って、DR デーモンのサイズをチェックします。通常、デーモンは 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、デーモン内で内部エラーが発生した可能性があります。このエラーから回復するために、DR デーモンの停止および再起動が必要な場合があります。エラーに関する情報をできる限り収集し、購入先にお問い合わせください。

NGDR Error: build_rpc_info: device address format error

デバイスツリーは構築されましたが正しくありません。いくつかの関数は、/dev/devices ディレクトリを検索し、かつ libdevinfo API を使用して、システムボードのデバイスツリーを作成します。ツリーを構築すると、メッセージが build_rpc_info() 関数に渡されます。この関数は、DR デーモンのデバイスツリーを RPC から復帰可能な構造に変換する際、ツリーを検証します。

ps(1) コマンドを使って、DR デーモンのサイズをチェックします。通常、デーモンは 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、デーモン内で内部エラーが発生した可能性があります。このエラーから回復するために、DR デーモンの停止および再起動が必要な場合があります。エラーに関する情報をできる限り収集し、購入先にお問い合わせください。

NGDR Error: build_rpc_info: I/O bus node address format error

デバイスツリーは構築されましたが正しくありません。いくつかの関数は、/dev/devices ディレクトリを検索し、かつ libdevinfo API を使用して、システムボードのデバイスツリーを作成します。ツリーを構築すると、メッセージが build_rpc_info() 関数に渡されます。この関数は、DR デーモンのデバイスツリーを RPC から復帰可能な構造に変換する際、ツリーを検証します。

ps(1) コマンドを使って、DR デーモンのサイズをチェックします。通常、デーモンは 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、デーモン内で内部エラーが発生した可能性があります。このエラーから回復するために、DR デーモンの停止および再起動が必要な場合があります。エラーに関する情報をできる限り収集し、購入先にお問い合わせください。

NGDR Error: build_rpc_info: psycho number out of range

デバイスツリーは構築されましたが正しくありません。いくつかの関数は、/dev/devices ディレクトリを検索し、かつ libdevinfo API を使用して、システムボードのデバイスツリーを作成します。ツリーを構築すると、メッセージが build_rpc_info() 関数に渡されます。この関数は、DR デーモンのデバイスツリーを RPC から復帰可能な構造に変換する際、ツリーを検証します。

ps(1) コマンドを使って、DR デーモンのサイズをチェックします。通常、デーモンは 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、デーモン内で内部エラーが発生した可能性があります。このエラーから回復するために、DR デーモンの停止および再起動が必要な場合があります。エラーに関する情報をできる限り収集し、購入先にお問い合わせください。

NGDR Error: build_rpc_info: sysio number out of range

デバイスツリーは構築されましたが正しくありません。いくつかの関数は、/dev/devices ディレクトリを検索し、かつ libdevinfo API を使用して、システムボードのデバイスツリーを作成します。ツリーを構築すると、メッセージが build_rpc_info() 関数に渡されます。この関数は、DR デーモンのデバイスツリーを RPC から復帰可能な構造に変換する際、ツリーを検証します。

ps(1) コマンドを使って、DR デーモンのサイズをチェックします。通常、デーモンは 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、デーモン内で内部エラーが発生した可能性があります。このエラーから回復するために、DR デーモンの停止および再起動が必要な場合があります。エラーに関する情報をできる限り収集し、購入先にお問い合わせください。

安全でないデバイスの照会エラーメッセージ

安全でないデバイス照会の障害エラーメッセージの一覧を以下に示します。これらのメッセージは、システムログと SSP アプリケーションのいずれかまたは両方に送信されます。

表 A-12 安全でないデバイス照会エラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

unsafe_devices: couldn't determine name of unsafe device major_number

ドライバ名とメジャー番号を結び付けるために DR デーモンが使用するメカニズムに障害が発生したため、名前を検出できなくなりました。この障害が発生した場合は、DR デーモンはデバイス用の文字列を作成し、それを "(unknown, major_number)" として指定します。

このメッセージは、ユーザーに対し、DR デーモンがあるデバイスの名前を検出できなかったことを通知します。これは訂正可能なエラーではありません。デーモンはメジャー番号を使ってドライブを識別できます。 

WARNING: board board_number not checked for unsafe devices.

DR デーモンが、安全でないデバイスを検出するためにシステムボードを検査している間に障害に遭遇し、あるシステムボード (board_number) を検査できませんでした。このエラーメッセージは、より重大な問題を内包している場合があります。

ps(1) コマンドを使用して、DR デーモンのサイズをチェックします。通常、デーモンは 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、デーモン内で内部エラーが発生した可能性があります。このエラーを解決するには、DR デーモンを停止してから再起動します。システムログから可能な限り多くの情報を収集して、このエラーについて購入先にお問い合わせください。

NGDR Error: unsafe_devices: libdevinfo failed.

DR デーモンは、libdevinfo API を使用できなかったため、安全でないデバイスの名前を識別できませんでした。安全でないデバイスすべての名前をデバイスツリーから検索するには、この API を使用する必要があります。

ps(1) コマンドを使用して、DR デーモンのサイズをチェックします。通常、デーモンは 300 〜 400 KB のメモリーを使用します。デーモンのサイズが 400 KB を超えている場合は、デーモン内で内部エラーが発生した可能性があります。このエラーを解決するには、DR デーモンを停止してから再起動します。システムログから可能な限り多くの情報を収集して、このエラーについて購入先にお問い合わせください。

NGDR Error: create_ctlr_array: count mismatch [internal error]

AP コントローラの存在に関する通信プロトコル違反が報告されました。AP ライブラリアンから見ると、ドメインはある数の AP コントローラを保持しています。一方、DR デーモンから見ると、ドメインは異なる数のコントローラを保持しています。 

ドメイン内の AP コントローラの正確な数を把握し、エラーを訂正します。また、DR デーモンのサイズをチェックします。DR デーモンのサイズは 300 〜 400 KB の範囲内であるはずです。DR デーモンのサイズがこの範囲内にない場合は、DR デーモンを停止してから再起動してください。 

代替パス (AP) エラーメッセージ

Alternate Pathing 関連のエラーメッセージの一覧を以下に示します。これらのメッセージは、システムログと SSP アプリケーションのいずれかまたは両方に送信されます。

表 A-13 AP 関連のエラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

add_net_ap_info: multiple AP aliases ignored

AP デバイスが複数の AP エイリアスを保持しています。1 つのエイリアスだけが使用されます。他のエイリアスは無視されます。これはエラーではありません。 

このエラーが引き続き表示される場合は、AP エイリアスを 1 つだけ残し、残りをすべて削除してください。 

AP daemon call failed: error_message *OR* error = error_number

AP ライブラリアンの通知と照会のいずれかまたは両方が失敗しました。 

エラーメッセージに説明文が含まれる場合はそこから障害の詳細を調べ、エラー番号を利用できる場合はそれを調べます。また、ap_daemon(1M) のマニュアルページを参照して、このエラーの詳細を調べます。

AP daemon comm init failed: error_message *OR* error = error_number

DR デーモンが AP ライブラリアンとの通信チャネルを確立中に障害が発生しました。 

エラーメッセージに説明文が含まれる場合はそこから障害の詳細を調べ、エラー番号を利用できる場合はそれを調べます。また、ap_daemon(1M) のマニュアルページを参照して、このエラーの詳細を調べます。

AP daemon query failed: error_message *OR* error = error_number

DR デーモンが特定の I/O コントローラの使用状況について AP ライブラリアンに照会を実行できませんでした。 

エラーメッセージに説明文が含まれる場合はそこから障害の詳細を調べ、エラー番号を利用できる場合はそれを調べます。また、ap_daemon(1M) のマニュアルページを参照して、このエラーの詳細を調べます。

AP daemon query failed: length mismatch

特定の I/O コントローラの使用状況に関して DR デーモンが AP ライブラリアンに照会を実行しましたが、不正な応答が返されました。 

エラーメッセージに説明文が含まれる場合はそこから障害の詳細を調べ、エラー番号を利用できる場合はそれを調べます。また、ap_daemon(1M) のマニュアルページを参照して、このエラーの詳細を調べます。

Cannot find physical device for AP_alias

 

このエラーメッセージは、システムログにだけ送信されます。 

AP エイリアスに対応する物理デバイス名を検出できませんでした。デバイス名に関して AP が混乱しているか、/dev および /devices ディレクトリが不完全な状態にあります。

AP が適正に動作することを確認します。すべてのデバイスエントリが /dev および /devices ディレクトリ内に存在するかどうかをチェックします。デバイスエントリが存在しない場合は、必要なエントリを適切なディレクトリに追加します。

create_ap_net_leaf: interface instance not found

DR デーモンは、AP メタネットワークインタフェースを、それらが表す物理デバイスと一致させようとします。このエラーは、DR デーモンがネットワークインタフェースを、対応する、このボード用の物理デバイスと一致させることができなかったことを意味します。 

AP が適正に動作することを確認します。DR 操作中および操作後にデバイスを利用する際、異常な動作が見られる場合、またはこのエラーが引き続き発生する場合は、システムログから可能な限り多くの情報を収集して、このエラーについて購入先にお問い合わせください。 

dr_ap_notify: unknown state state_number

DR デーモンが、不正な値で内部関数を呼び出しました。ただし、このエラーが発生する場合は、より重大な問題が内包されている可能性があります。 

この問題に関する情報をシステムログからできる限り収集し、購入先にお問い合わせください。 

dr_daemon operating in NO AP interaction mode

AP ソフトウェアが機能していないか、インストールされていません。このメッセージは、DR デーモンから AP に対して接続および切断操作が通知されないことを意味します。 

AP をインストールしていない場合は、このエラーを無視してください。インストール済みの場合は、適切にインストールされていること、および AP ソフトウェアのバージョンがドメイン内で実行中の DR デーモンのバージョンと互換性があることを確認します。 

init_ap_rpc: Unable to get hostname

uname(2) システムコールが無効なホスト名を返しました。その結果、DR デーモンは AP ライブラリアンへの接続を確立できませんでした。

なし 

DCS エラーメッセージ

コンソールウィンドウ、/var/adm/messages ディレクトリ、および $SSPLOGGER/domain_name/messages ディレクトリへそれぞれ送信される DCS エラーメッセージを以下の表に示します。

表 A-14 DCS エラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

DCS ERROR: permission denied

DCS を実行できるのは、ドメインのスーパーユーザーだけです。  

ドメインの inetd.confファイルをチェックして、スーパーユーザー UID で DCS が起動していることを確認します。

DCS ERROR: internal error: operation: error_description

DCS 内で内部エラーが発生しました。  

error_descriptionerrno_value と一致していますので、これから発生したエラーを診断します。operation フィールドは、エラーを発生させたファンクションコールを示しています。

DCS NOTICE:unrecognized error reported

DCS から不明なエラー状態が通知されました。  

ドメインのログファイルを参考にして、エラーを発生させた原因を調べます。  

DCS ERROR:network initialization failed

DCS は、DCA からの DR 要求を受信するためのネットワーク接続を初期化できませんでした。  

DR 操作の再試行を行います。  

DCS ERROR:failed to acquire reserved port

DCS は、sun-dr により予約されているポート 665 を使用します。別のプロセスがこのポートを使用しているためにエラーが発生しました。  

別のプロセスがまだそのポートを使用しているかどうかを調べます。プロセスがポートを使用している場合、そのプロセスを終了できるならば終了し、DR 操作の再試行を行います。  

DCS ERROR:connection attempt failed

DCS は、DCA との接続を確立できませんでした。  

DR 操作の再試行を行います。  

DCS ERROR:unable to receive message

DCS は、DCA からのメッセージを受信できませんでした。  

DR 操作の再試行を行います。  

DCS ERROR:unable to send message for operation_name operation

DCS は、DCA へメッセージを送信できませんでした。  

DR 操作の再試行を行います。  

DCS NOTICE:sun-dr service not found, using reserved port 665

DCS は、/etc/services ファイルから sun-dr サービスの記述を見つけられませんでした。

なし 

DCS NOTICE:client disconnected

クライアントが予期しない理由により接続を切断しました。  

なし 

DCS ERROR:unknown operation requested

DCS が認識できない操作を DCA が要求しました。  

DR 操作の再試行を行います。  

DCS ERROR:operation failed

指定された DCS 操作を完了できませんでした。DCS が操作の結果を DCA へ送出できなかったことだけが原因の場合、DR 操作は正常に完了できる可能性があります。 

手動により、操作の状態をチェックします。DR 操作が失敗していた場合は、操作の再試行を行います。  

DCS ERROR:invalid session establishment sequence

DCA と DCS 間の通信セッションの確立処理、ハンドシェークの初期化が失敗しました。  

DR 操作の再試行を行います。  

DCS ERROR:operation_name operation issued before session established

通信セッションが確立する前に、DR 操作が要求されました。  

DR 操作の再試行を行います。  

DCS ERROR:received an invalid message

DCS は、未知の情報を持つメッセージを受信しました。  

DR 操作の再試行を行います。  

DCS NOTICE:confirm callback failed, aborting operation

DCS は、確認のためのプロンプトをユーザーに表示することができませんでした。 

なし 

DCS NOTICE:message callback failed, continuing

DCS は、メッセージをユーザーに表示することができませんでした。  

なし 

DCS NOTICE:retry value invalid (retry_value)

retry_value で指定された値が無効でしたので、再試行回数をゼロに設定して操作を続行しました。

なし 

DCS NOTICE:timeout value invalid (timeout_value)

timeout_value で指定された値が無効でしたので、再試行回数をゼロに設定して操作を続行しました。

なし 

DCS INFO:retrying operation, attempt attempt_number

DCS は操作の再試行を行っています。attempt_number フィールドは、現在実行している再試行の回数を示します。

なし 

DCS ERROR:failed to start a new session handler

DCS は、受信した DR 要求を処理するセッションハンドラを平行して起動できませんでした。  

DR 操作の再試行を行います。  

DCS ERROR:abort attempt of session, session_id, unsuccessful

DCS は、session_id が示すセッションを中止できませんでした。

中止操作を再要求します。  

DCS ERROR:unsupported message protocol version:version_number

DCS は、version_number が示すプロトコルバージョンをサポートしていません。

ドメインおよび SSP の DR ソフトウェアを調べます。両者の DR ソフトに互換性がない場合は、適切なバージョンのソフトウェアをドメインに再インストールします。  

DCS INFO:session aborted

実行中の DR 操作をユーザーが中止しました。  

なし 

DCS ERROR:illegal option option, exiting

不当なオプション名を DCS に渡しました。 

ドメインの inetd.conf ファイルを調べ、DCS に関するエントリーに記述されている不当なオプションを削除します。

DCS NOTICE:illegal argument to option flag (argument), action

option で指定したオプションに argument が示す不当な引数を指定しました。DCS は、引き続き、action で指定された動作を行います。

ドメインの inetd.conf ファイルを調べ、DCS に関するエントリーを修正します。

DCS ERROR:resource info init error (error_code)

DCS は、リソースの使用状態に関する情報を与えるモジュールを初期化できませんでした。 

操作の再試行を行います。 

DR ドライバエラーメッセージ

コンソールウィンドウ、/var/adm/messages ディレクトリ、および $SSPLOGGER/domain_name/messages ディレクトリへそれぞれ送信される DR ドライバエラーメッセージを以下の表に示します。

表 A-15 DR ドライバエラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

dr:Internal error:dr.c line_number

DR ドライバ内で内部エラーが発生しました。  

失敗した操作の再試行を行います。エラーが再発生する場合は、各種 DR ソフトウェアコンポーネントをいったん終了して再起動し、操作の再試行を行います。以上の操作を行ってもエラーが発生する場合は、ドメインを再起動します。その他の原因があるかどうか、コンソールまたはシステムログをチェックします。  

dr:Insufficient memory:resource

KPHYSM_ERESOURCE エラーまたは cpu_configure()/cpu_unconfigure() エラーと同時に ENOMEM errno が発生したため、DR フレームワークはリソースを構成また構成解除できませんでした。

この状態は一時的な場合があります。DR 操作の再試行を行います。エラーが再発生し、失敗する操作が構成解除操作である場合、別のドメインからそのドメインへメモリーを移動して構成してみます。以上の操作を行ってもエラーが発生する場合は、ドメインを再起動します。  

dr:Device busy:resource

cpu_configure() または cpu_unconfigure() から想定される EBUSY errno メッセージの変換結果を表わします。または、入出力デバイスが使用されているため、切り離せないことを示しています。dr_pre_detach_cpu を呼び出したときに、切り離そうとしている CPU がオンライン状態にある場合も、このエラーメッセージが表示されます。メモリードレイン操作を行っている間は、CPU を切り離せません。

システムコントローラで showdevices(1M) を使用して、リソースが使用中となっている原因を見つけます。または、ドメイン上で fuser(1M)、psrinfo(1M)、prtdiag(1M)、あるいは同様なツールを使用して、デバイスが使用中となっている原因を見つけます。また、他のメモリードレイン操作がすでに実行されていないかどうかを調べます。 どの原因でエラーが発生したかにより、リソースを使用している対象を再構成するか、終了します。あるいは、すでに行われているメモリードレイン操作が完了するまで待ちます。この後で、DR 操作の再試行を行います。

dr:Operation already in progress:resource

cpu_configure() または cpu_unconfigure() から想定される EALREADY errno の変換結果を表わします。

システムコントローラで showdevices(1M) を使用して、指定したリソースの構成を調査します。または、ドメイン上で cfgadm(1M)、pbind(1M)、psrinfo(1M)、または同様なコマンドを使用して、リソースの構成を調査します。このリソースですでに実行されている操作を調べます。操作が完了するまで待つか、その操作をキャンセルします。この後で、DR 操作の再試行を行います。先に操作が実行されていてもすでに終了していることがありますので、この操作を再試行すると正常に終了する可能性もありますし、エラーが再発生する場合もあります。

dr:I/O error:resource

kphysm_del_start の呼出しにより、未知のエラーコードが返されました。さらに詳細な cmn_err message のメッセージも表示されます。

システムログまたはコンソールに表示された cmn_err の詳細なエラーメッセージから、エラー状態を特定し対処方法を調べます。

dr:Bad address:resource

kphysm_add_memory_dynamic は、KPHYSM_EFAULT を返しました。

DR 操作の再試行を行います。エラーが再発生する場合は、購入先にお問い合わせください。  

dr:No device(s) on board:board_path

デバイス (入出力、メモリーまたは CPU) を持たないボードが接続されました。または、そのようなボードの接続を解除しました。  

ボードにデバイスが実装されていると思われる場合は、そのボードの接続を解除してシステムからボードを取り外してください。認定された技術者により、そのコンポーネントを再実装する必要があります。 

dr:Invalid argument:attachment_point

無効な引数を DR に渡しました。  

DR 操作の再試行を行います。エラーが再発生する場合は、購入先にお問い合わせください。  

dr:Invalid state transition:attachment_point

DR 操作の順番が誤っていました。 順番を誤って cfgadm(1M) コマンドを実行した場合は、オペレータの操作ミスの可能性があります。 または、なんらかの内部エラー状態により、DR ドライバが正常に動作しなかった可能性があります。

DR 操作の再試行を行います。 エラーが再発生する場合は、DR ソフトウェアコンポーネントをいったん停止させ、再起動 (つまり、読み込みを解除し、再度、読み込ませて)、このエラー状態から復旧してください。 以上の操作を行ってもエラーが発生する場合は、ドメインを再起動します。 

dr:Device in fatal state

デバイスを停止できません。または、デバイスが停止を拒否しました。  

DR 操作の再試行を行います。 エラーが再発生する場合は、そのデバイスが一時停止に対して危険なモードであった可能性があります。一時停止に対して危険なデバイスのリストを調べます。デバイスが一時停止に対して危険なデバイスであるならば、showdevices(1M) または fuser(1M) を使用してそのデバイスが使用されているかどうかを調べ、リソースを手動で再構成します。この後で、手動によりドライバの読み込みを解除し、デバイスの種類によっては、デバイスに接続しているケーブルを外します。以上の操作により、デバイスを停止させても安全な状態になりますので、操作の再試行を行います。DR 操作が正常に完了するまでは、このデバイスへのケーブルの再接続、デバイス用ドライバの再読込み、あるいは、リソースの再構成といった作業は行わないでください。

dr:Device failed to resume:path

停止させたデバイスの動作を再開できませんでした。  

 

dr:Cannot stop user thread

デバイスを停止させる準備段階で、DR はユーザースレッドを終了できませんでした。  

DR 操作の再試行を行います。このエラーが再発生する場合は、停止できなかったユーザースレッドを調査し、停止できなかった原因を調べます。DR 操作を続行させるには、スレッドを終了しなければならない場合があります。  

dr:Cannot quiesce realtime thread

オペレーティングシステムを停止しようとしたときに、リアルタイムスレッドが作動していました。リアルタイムスレッドを中断、または休止することはできません。すべてのリアルタイムスレッドを終了するか、非リアルタイムスレッドに変更しないと、中断操作は失敗します。  

リアルタイムスレッドを終了するか、priocntl(1M) コマンドを使用してスレッドの優先順位を調整します。(リアルタイムスレッドの優先順位を調整するには PID が必要です)

dr:Cannot stop kernel thread:name

DR はカーネルのスレッドを停止できませんでした。  

DR 操作の再試行を行います。このエラーが再発生する場合は、停止できなかったユーザースレッドを調査し、停止できなかった原因を調べます。カーネルのスレッドを終了できる場合はスレッドを終了し、DR 操作を続行します。  

dr:Failed to off-line:cpu

CPU をオフラインにできなかったため、CPU の構成を解除することができません。CPU に接続しているスレッドがある可能性があります。CPU に接続しているスレッドがある場合は、cmn_err メッセージもログに記録されています。ボードを切り離すには、DR が CPU をオフライン状態にし、CPU の電源を切断できなければなりません。

コンソールおよびシステムログをチェックして、CPU に接続しているスレッドがあるかどうかを調べます。スレッドがある場合は、手動により接続を解除するか、ドメイン内の別のボードの CPU へ再接続することができます。CPU に接続しているスレッドがない場合は、psrset(1M)、pbind(1M)、およびpsrinfo(1M) を使用して、どのように変更すれば、DR が CPU をオフラインにできるようになるのかを調べます。たとえば、別のボードの CPU をドメインへ追加しなければならない場合があります。あるいは、他の CPU をオンラインにしなければならないこともあります。最終的には、CPU 作業負荷を分散させるため CPU ボードを追加しなければならない場合もあります。

dr:Failed to on-line:cpu

DR は、新たに接続したボード、または以前に構成を解除したボード上の CPU をオンラインにできませんでした。  

 

dr:Failed to start CPU:cpu

DR は、新たに接続したボード、または以前に構成を解除したボード上の CPU を起動できませんでした。  

 

dr:Failed to stop CPU:cpu

DR は、構成を解除するボードの CPU の電源を切断できませんでした。構成を解除するボード上の CPU をすべてオフラインにして、かつ電源を切断しないと、構成解除操作は失敗します。  

 

dr:Kernel cage is disabled:resource

カーネルケージが無効になっていると、常時メモリーをホストしているボードを切り離せません。  

/etc/system を修正してカーネルケージを有効に設定し、ドメインを再起動します。

dr:No available memory target:resource

ボードが常時メモリーをホストし、メモリーの移動先となるターゲットが他にないため、DR はボードを切り離せません。ボードの常時メモリーをドメイン内にある別のメモリーコンポーネントへ移動しないと、DR 操作に失敗します。  

このボードのターゲットとして動作するのに十分なメモリー容量を持つ他のメモリーコンポーネントを構成します。この後で、DR 操作の再試行を行います。  

dr:VM viability test failed:resource

kphysm_del_start が返したエラーコードの変換を表わします。

他のメモリーコンポーネントをドメインに構成して、メモリーリソースの負荷を軽減します。この後で、DR 操作の再試行を行います。  

dr:kphysm_pre_del failed:resource

kphysm_del_start が返したエラーコードの変換を表わします。

他のメモリーコンポーネントをドメインに構成して、メモリーリソースの負荷を軽減します。この後で、DR 操作の再試行を行います。  

dr:Non-relocatable pages in span:resource

 

 

dr:kphysm_del_cancel:resource

 

 

dr:Memory operation failed:resource

DR は、新たに接続したボードのメモリーを接続できませんでした。  

 

dr:Can鱈t unconfig cpu if mem online

ボードのメモリーがオンライン状態のとき、DR は CPU の構成を解除できません。  

メモリーをオフラインにすると、ボードの構成を解除できます。  

ngdrmach:Cannot read property value:Device Node node_address:property property_name

DR は、表示されたデバイスノードの指定の属性を入手できませんでした。  

 

ngdrmach:Cannot determine property length:board::slot:property

DR は、表示されたデバイスノードの指定の属性の詳細を入手できませんでした。 

 

ngdrmach:No CPU specified for connect:slot

 

 

ngdrmach:Cannot move SIGB assignment

 

 

ngdrmach:Cannot disconnect CPU; SIGB is currently assigned:slot::board

 

 

ngdrmach:Device driver failure:path

 

 

ngdr:Must specify a CPU on the given board:cpu_id

 

 

ngdrmach:No such device:board::slot

 

 

ngdrmach:Memory configured with inter-board interleaving:board::slot

 

 

ngdrmach:Invalid board number:board_number

ボード割り当て操作で無効なボード番号が指定されました。  

別のボード番号を使用するか、ドメインのシステムコントローラに保存されている使用可能なコンポーネントのリストを修正して、割り当て操作が失敗したボードをリストに含めます。  

ngdrmach::Cannot proceed; Board is configured or busy:component_name

ボードが構成されているか、使用中のため、DR はそのボードの電源を切断できません。または割り当てを解除できません。 

ボードの構成を解除するか、ボードですでに行われている DR 操作が完了するまで待ちます。この後で、DR 操作の再試行を行います。 

ngdrmach:Firmware probe failed:attachment_point

OBP はボードをプローブできませんでした。  

 

ngdrmach:Firmware deprobe failed:attachment_point

OBP はボードをデプローブできませんでした。  

 

ngdrmach:Operation not supported

実行しようとした操作はサポートされていません。  

なし 

ngdrmach:Unrecognized platform command:command/options

DR が認識できないコマンドを DR に渡しました。 

cfgadm_sbd(1M) のマニュアルページを参照して、有効な引数を使用していることを確認します。有効な引数を使用しているのに、エラーが再発生する場合は、購入先にお問い合わせください。

ngdrmach:drmach parameter is not a valid ID

指定された drmachid_t の値は無効でした。

 

ngdrmach:drmach parameter is inappropriate for operation

誤ったタイプの drmachid_t を関数へ渡しました。

 

ngdrmach:Unexpected internal condition:drmach.c line_number

内部 drmach エラーが発生しました。

modunload(1M) と modload(1M) を使用して、drmach ドライバの読み込みをいったん解除し、再度、読み込みます。この後で、DR 操作の再試行を行います。以上の操作を行ってもこのエラーが発生する場合は、ドメインを再起動する必要があります。

ngdrmach:No CPU specified for connect.

 

 

ngdrmach:Firmware move_cpu0 failed:CPU cpu_id 

 

 

ngdrmach:Cannot move SIGB assignment 

 

 

ngdrmach:Cannot disconnect CPU; SIGB is currently assigned 

 

 

プラグインエラーメッセージ

libcfgadm システムボードのプラグインは、以下のエラーメッセージを生成します。発生したエラーメッセージは、netcon(1M) コンソールウィンドウ、/var/adm/messages ディレクトリ、および $SSPLOGGER/domain_name/messages ディレクトリへそれぞれ送信されます。

表 A-16 プラグインエラーメッセージ

エラーメッセージ 

推定される原因 

対処方法 

Configuration operation cancelled:command ap_id

確認を要する構成操作で、確認を行いませんでした。  

確認が必要な構成操作についての詳細は、cfgadm(1M) および cfgadm_sbd(1M) のマニュアルページを参照してください。

Hardware specific failure:command ap_id:error:resource

このコマンドの実行中にシステムエラーが発生しました。error が示すエラーメッセージは、標準エラーである場合と、DR ドライバが返すより詳細なエラーメッセージである場合があります (DR ドライバエラーについては、「DR ドライバエラーメッセージ」を参照してください)。resource で特定されるリソースの名前は、このエラーの原因となっているリソースを表わしていますが、DR ドライバもこの名前を返します。

使用中のデバイスについては、そのデバイスを特定し使用を停止します。その他のエラーに対する復旧方法については、ドライバのマニュアルを参照してください。 

Library Error:command invalid:command

指定されたコマンドは、システムボードに対しては使用できません。  

有効なコマンドの一覧については、cfgadm_sbd(1M) のマニュアルページを参照してください。

Library Error:command not supported:command ap_id

実行されたコマンドは、ap_id が示す接続点では使用できません。たとえば、接続操作は CPU に対しては行えません。  

サポートしているコマンドの一覧については、cfgadm_sbd(1M) のマニュアルページを参照してください。

Library Error:command aborted:command

ユーザーによりコマンドの実行が中止されました。  

該当しません。 

Library Error:option invalid:option

option で指定したオプションは無効です。

有効なオプションの一覧については、cfgadm_sbd(1M) のマニュアルページを参照してください。

Library Error:option requires value:option

option で指定したオプションには値が必要です。

有効なオプションの値の一覧については、cfgadm_sbd(1M) のマニュアルページを参照してください。

Library Error:option requires no value:option

option で指定したオプションに値を入れる必要はありません。

値を必要としないオプションの一覧については、cfgadm_sbd(1M) のマニュアルページを参照してください。

Library Error:option value invalid:option value

option で指定したオプションに対して、value で指定した値が無効です。

有効なオプションの値の一覧については、cfgadm_sbd(1M) のマニュアルページを参照してください。

Library Error:attachment point invalid:ap_id

ap_id で指定した接続点を正しくパース (解析) できませんでした。このエラーが発生することは稀で、内部エラーの発生を示している可能性があります。

有効な接続点の一覧については、cfgadm_sbd(1M) のマニュアルページを参照してください。エラーが再発生する場合は、購入先にお問い合わせください。

Library Error:component invalid:ap_id

ap_id で指定したコンポーネントは無効です。

有効な動的接続点の一覧については、cfgadm_sbd(1M) のマニュアルページを参照してください。

Library Error:sequence invalid:command (rstate ostate) ap_id

指定した接続点の受容体または占有装置の状態には、command で指定したコマンドを使用できません。たとえば、未実装のスロットへ接続しようとしても、無効処理エラーが返されます。

有効な操作の一覧については、cfgadm_sbd(1M) のマニュアルページを参照してください。

Library Error:offline ap_id (path):error

Reconfiguration Coordination Manager (RCM) は、ap_id で指定されたリソースをオフラインにできませんでした。RCM が返すエラーメッセージ (error) は障害の原因を示します。ほとんどの場合、デバイスが使用中であることが原因です。

使用中のデバイスについては、そのデバイスを特定し、解放します。  

Library Error:suspend ap_id (path):error

Reconfiguration Coordination Manager (RCM) は、ap_id で指定されたリソースを中断できませんでした。RCM が返すエラーメッセージ (error) は障害の原因を示します。ほとんどの場合、デバイスが使用中であることが原因です。

使用中のデバイスについては、そのデバイスを特定し、解放します。  

Library Error:not enough memory

プラグイン操作はメモリー不足のため失敗しました。  

メモリーの使用状態を調べます。  

Library Error:change signal disposition failed

プラグイン操作は、DR 操作を始める前に、信号を設定できませんでした。 

なし 

Library Error:cannot get RCM handle

Reconfiguration Coordination Manager (RCM) は初期化に失敗しました。  

なし 

Library Error:cannot open library:error

Reconfiguration Coordination Manager (RCM) のライブラリ (library) は見つかりましたが、これを開く際にエラーが発生しました。dlopen(3DL) は、error が示すエラーメッセージを返します。

RCM が正しくインストールされているかどうかを調べます。  

Library Error:cannot find symbol symbol in library

Reconfiguration Coordination Manager (RCM) のライブラリ (library) には、必要な記号 (symbol) が見つかりませんでした。

RCM が正しくインストールされているかどうかを調べます。  

Library Error:cannot stat library:error

library が示す Reconfiguration Coordination Manager (RCM) のライブラリは見つかりましたが、stat(2) 関数はファイルの状態情報を入手できませんでした。Solaris オペレーティング環境は、error が示すエラーメッセージを返します。

なし