Sun Management Center 3.6.1 ユーザーガイド

付録 D Sun Management Center ソフトウェアの規則

この付録では、次のモジュールについて Sun Management Center の規則を示します。

規則の概念

規則とは、監視対象のホストまたはノードのステータスを確認する上での複雑なロジックまたは特殊ロジックを可能にするアラームチェックメカニズムです。

規則には次の 2 種類があります。

カーネルリーダ

カーネルリーダの単純規則は次の表のとおりです。

表 D–1 カーネルリーダの単純規則

プロパティー 

説明 

avg_1min 

直前 1 分間における読み込みの平均 

avg_5min 

過去 5 分間における読み込みの平均 

avg_15min 

過去 15 分間における読み込みの平均 

cpu_delta 

先の時間と現在の時間の差 

cpu_idle 

CPU のアイドル時間 

cpu_kernel 

CPU のカーネル時間 

cpu_user 

CPU のユーザー時間 

cpu_wait 

CPU 待ち時間 

ipctused 

使用されている i ノードの割合 

kpctused 

使用されている容量の割合 (単位: K バイト) 

mem-inuse 

使用されている物理メモリー (単位: M バイト) 

numusers 

ユーザー数 

numsessions 

ユーザーセッションの数 

swap_used 

使用されているスワップ (単位: K バイト) 

wait_io 

CPU 待ち時間の内訳 

wait_pio 

CPU 待ち時間の内訳 

wait_swap 

CPU 待ち時間の内訳 

次の表は、カーネルリーダの複合規則をまとめています。

表 D–2 カーネルリーダの複合規則

規則の ID 

説明 

アラームの種類 

rknrd100

この規則は一時的なイベントに適用されます。この規則は、ディスクが 75% を超えてビジー状態であり、待ち行列の平均の長さが 10 を超え、待ち行列がさらに長くなりつつある場合に警告アラームを生成します。警告アラームは、ディスクが 70% 未満のビジー状態になり、かつ待ち行列の平均長が 8 未満になるまで続きます。

Alert (警告) 

rknrd102

この規則は一時的なイベントに適用されます。この規則は、90% のスワップ空間が使用状態になった場合に警告アラームを生成します。アラームを引き起こしているイベントは、使用されているスワップ空間がトータルスワップ空間の 80% 未満になるまで続きます。

Alert (警告) 

rknrd103

この規則は一時的なイベントに適用されます。この規則は、特定の CPU についてスワッピングとページングが過度の状態となった場合に警告アラームを生成します。この動作は、CPU がスラッシングを起こしている可能性があることを示します。CPU が 1 秒間に 1 回のスワップアウト、10 回のページイン、10 回のページアウトを超える場合には警告アラームが生成されます。この警告アラームは、CPU が 1 秒間に 1 回のスワップアウト、8 回のページイン、8 回のページアウトを超える場合に継続します。

Alert (警告) 

rknrd105

File System Full エラー。この規則は、syslog (/var/adm/message) 内に file system full エラーメッセージがないかを探します。

ただちに閉じられる警告アラーム 

rknrd106

no swap space エラー。この規則は、syslog (/var/adm/message) 内に no swap space エラーがないかを探します。

ただちに閉じられる警告アラーム 

rknrd400

この規則は、CPU ごとに 4 時間以内に 6 を超える継続的な CPU 負荷がないかをチェックします。 

情報メッセージ 

rknrd401

この規則は、90% を超えるファイルが x 時間の間、ビジー状態のディスクがないかどうかをチェックします。パラメータフィールドは、CPU 負荷が 6 未満であった最後の時点を維持し、2001 年のある日付に初期化されます。

情報メッセージ 

rknrd402

この規則は、使用可能なスワップ空間が x 時間の間 10% 未満に低下していないかどうかをチェックします。パラメータフィールドは、CPU 負荷が 6 未満であった最後の時点を示します。このフィールドは、2001 年のある日付に初期化されます。

情報メッセージ 

rknrd403 

この規則は現在サポートされていません。 

情報メッセージ 

rknrd404

規則 rknrd401 が 4 回引き起こされる場合には、情報アラームが生成されます。 

情報メッセージ 

rknrd405

規則 rknrd402 が 4 回引き起こされる場合には、情報アラームが生成されます。 

情報メッセージ 

状態モニター

状態モニターの複合規則は、次の表のとおりです。

表 D–3 状態モニターの複合規則

規則の ID 

説明 

アラームの種類 

rhltm000

この規則は、十分なスワップ空間が存在するかどうかをチェックします。

危険、警告、注意 

rhltm001

CPU 電源は、CPU がロックの開放を待機するたびに消費されます。このイベントがカウントされるのは、カーネルがそのオペレーションの同期をとったり、複数の CPU が重要なコードやデータ領域を同時アクセスしないように相互排除ロックを使用するためです。

危険、警告、注意 

rhltm002

NFS RPC のタイムアウトは、呼び出しが再送信されたあとの重複応答と関係がある可能性があります。これらのタイムアウトは、ネットワークには問題がないがサーバーの応答が遅いことを示します。

危険、警告、注意 

rhltm003

各 CPU はタイムスライスごとに実行待ち行列からジョブを 1 つ取り除くため、実行待ち行列の長さは CPU の数で分割されます。

危険、警告、注意 

rhltm004

ディスクがビジー状態であったり、処理が遅いと、システムスループットが低下し、ユーザー応答時間が長くなります。この規則は、負荷の均衡を調整し直すように読み込まれるディスクを特定します

危険、警告、注意 

rhltm005

参照されないページの常駐時間に基づく RAM 規則。この仮想メモリーシステムは、アイドルページを探してほかの利用に開放するために走査を行う際にシステムはより多くのメモリーを必要とすることを示しています。

危険、警告、注意 

rhltm006

この規則は、ログインまたはネットワーク接続に失敗する場合に発生するカーネルメモリーの割り当ての問題に対応しています。考えられる原因は 2 つあります。カーネルがそのアドレス空間の限界に達したか、空きリストに割り当てられるページが存在しないかです。失敗が連続する場合は、見落とされやすい問題が発生していることを意味します。

危険、警告、注意 

rhltm007

ディレクトリパス名コンポーネントのグローバルキャッシュが存在します。このキャッシュは、ディレクトリ名ルックアップキャッシュ (DNLC) と呼ばれます。このキャッシュが存在しない場合には、正しいファイルを見つけるためにディレクトリエントリをディスクから読み取って走査する必要があります。 

危険、警告、注意