Sun Management Center 3.5 ユーザーガイド

付録 D Sun Management Center ソフトウェアの規則

この付録では、以下のモジュールについて Sun Management Center の規則を示します。

規則の概念

規則とは、監視対象のホストまたはノードのステータスを確認する上での複雑なロジックまたは特殊ロジックを可能にするアラームチェックメカニズムです。

規則には次の 2 種類があります。

カーネルリーダ

次の表は、カーネルリーダの単純な規則を示したものです。

表 D–1 カーネルリーダの単純な規則

プロパティ  

説明 

avg_1min  

直前 1 分間における読み込みの平均 

avg_5min  

過去 5 分間における読み込みの平均 

avg_15min  

過去 15 分間における読み込みの平均 

cpu_delta  

先の時間と現在の時間の差 

cpu_idle  

CPU のアイドル時間 

cpu_kernel  

CPU のカーネル時間 

cpu_user  

CPU のユーザ時間 

cpu_wait  

CPU wait time 

ipctused  

使用されている i ノードの割合 

kpctused  

使用されている容量の割合 (単位: K バイト) 

mem-inuse  

使用されている物理メモリー (単位: M バイト) 

numusers  

ユーザ数 

numsessions  

ユーザセッションの数 

swap_used  

使用されているスワップ (単位: K バイト) 

wait_io  

CPU 待ち時間の内訳 

wait_pio  

CPU 待ち時間の内訳 

wait_swap  

CPU 待ち時間の内訳 

次の表は、カーネルリーダの複雑な規則を示したものです。

表 D–2 カーネルリーダの複雑な規則

規則の ID  

説明 

アラームの種類 

rknrd100

この規則は一時的なイベントに適用されます。この規則は、ディスクが 75% を超えてビジー状態であり、待ち行列の平均の長さが 10 を超え、待ち行列がさらに長くなりつつある場合に警告アラームを生成します。警告アラームは、ディスクが 70% 未満のビジー状態になり、かつ待ち行列の平均長が 8 未満になるまで続きます。

Alert (警告) 

rknrd102

この規則は一時的なイベントに適用されます。この規則は、90% のスワップ空間が使用状態になった場合に警告アラームを生成します。アラームを引き起こしているイベントは、使用されているスワップ空間がトータルスワップ空間の 80% 未満になるまで続きます。

Alert (警告) 

rknrd103

この規則は一時的なイベントに適用されます。この規則は、特定の CPU についてスワッピングとページングが過度の状態となった場合に警告アラームを生成します。この動作は、CPU がスラッシングを起こしている可能性があることを示します。CPU が 1 秒間に 1 回のスワップアウト、10 回のページイン、10 回のページアウトを超える場合には警告アラームが生成されます。この警告アラームは、CPU が 1 秒間に 1 回のスワップアウト、8 回のページイン、8 回のページアウトを超える場合に継続します。

Alert (警告) 

rknrd105

File System Full エラー。この規則は、syslog (/var/adm/message) 内に file system full エラーメッセージがないかを探します。

ただちに閉じられる警告アラーム 

rknrd106

no swap space エラーこの規則は、syslog (/var/adm/message) 内に no swap space エラーがないかを探します。

ただちに閉じられる警告アラーム 

rknrd400

この規則は、CPU ごとに 4 時間以内に 6 を超える継続的な CPU 負荷がないかをチェックします。 

情報メッセージ 

rknrd401

この規則は、x 時間で 90% を超えるファイルがビジー状態となるディスクがないかをチェックします。パラメータフィールドは、CPU 負荷が 6 未満であった最後の時点を維持し、2001 年のある日付に初期化されます。

情報メッセージ 

rknrd402

この規則は、使用可能なスワップ空間が x 時間で 10% 未満に低下するかどうかをチェックします。パラメータフィールドは、CPU 負荷が 6 未満であった最後の時点を示します。このフィールドは、2001 年のある日付に初期化されます。

情報メッセージ 

rknrd403  

この規則は現在サポートされていません。 

情報メッセージ 

rknrd404

規則 rknrd401 が 4 回引き起こされる場合には、情報アラームが生成されます。 

情報メッセージ 

rknrd405

規則 rknrd402 が 4 回引き起こされる場合には、情報アラームが生成されます。 

情報メッセージ 

状態モニター

次の表は、状態モニターの複雑な規則を示したものです。

表 D–3 状態モニターの複雑な規則

規則の ID  

説明 

アラームの種類 

rhltm000

この規則は、十分なスワップ空間が存在するかどうかをチェックします。

重大、警告、注意 

rhltm001

CPU パワーは、CPU がロックの開放を待機するたびに消費されます。このイベントがカウントされるのは、カーネルがそのオペレーションの同期をとったり、複数の CPU が重要なコードやデータ領域を同時アクセスしないように相互排除ロックを使用するためです。

重大、警告、注意 

rhltm002

NFS RPC のタイムアウトは、呼び出しが再送信されたあとの重複応答と関係がある可能性があります。これらのタイムアウトは、ネットワークには問題がないがサーバの応答が遅いことを示します。

重大、警告、注意 

rhltm003

各 CPU はタイムスライスごとに実行待ち行列からジョブを 1 つ取り除くため、実行待ち行列の長さは CPU の数で分割されます。

重大、警告、注意 

rhltm004

ビジー状態のディスクや処理の遅いディスクは、システムスループットを低下させ、ユーザ応答時間を増やします。この規則は、負荷の均衡を調整し直すように読み込まれるディスクを特定します

重大、警告、注意 

rhltm005

参照されないページの占有時間にもとづく RAM 規則。この仮想メモリーシステムは、アイドルページを探してほかの利用に開放するために走査を行う際にシステムはより多くのメモリーを必要とすることを示しています。

重大、警告、注意 

rhltm006

この規則は、ログインまたはネットワーク接続が思いがけなく失敗する場合に起きるカーネルメモリー割り当てについての問題について述べています。原因としては、カーネルがそのアドレス空間の限界に達したか、あるいは 割り当てるべきページが空きリスト内に存在しないという状況が考えられます。失敗が連続する場合は、見落とされやすい問題が発生しています。

重大、警告、注意 

rhltm007

ディレクトリパス名コンポーネントのグローバルキャッシュが存在します。このキャッシュは、ディレクトリ名ルックアップキャッシュ (DNLC) と呼ばれます。このキャッシュが存在しない場合には、正しいファイルを見つけるためにディレクトリエントリをディスクから読み取って走査する必要があります。 

重大、警告、注意