付録 D Sun Management Center ソフトウェアの規則
この付録では、以下のモジュールについて Sun Management Center の規則を示します。
規則の概念
規則とは、監視対象のホストまたはノードのステータスを確認する上での複雑なロジックまたは特殊ロジックを可能にするアラームチェックメカニズムです。
規則には次の 2 種類があります。
-
単純な規則は rCompare 規則にもとづいたもので、監視対象のプロパティと rCompare 規則の比較を行います。規則の状態が true になる場合は、アラームが生成されます。単純な規則の例としては、たとえば使用されているディスク領域の割合などが挙げられます。使用されている割合が規則に指定された割合以上になると、アラームが生成されます。
-
複雑な規則は、複数の条件をベースとしています。たとえば、以下のような条件が満たされる場合にアラームが生成されることを定義します。
-
ディスクが 75% を超えるビジー状態になる
-
待ち行列の平均の長さが
10 を超える
-
待ち行列が増えつつある
注 –
ユーザによってカスタマイズされた Solstice SyMONTM
1.x 規則を Sun Management Center ソフトウェアで使用するには、あらかじめその規則を Sun Management Center
環境に移植する必要があります。
カーネルリーダ
次の表は、カーネルリーダの単純な規則を示したものです。
表 D–1
カーネルリーダの単純な規則
プロパティ
|
説明
|
avg_1min
|
直前 1 分間における読み込みの平均
|
avg_5min
|
過去 5 分間における読み込みの平均
|
avg_15min
|
過去 15 分間における読み込みの平均
|
cpu_delta
|
先の時間と現在の時間の差
|
cpu_idle
|
CPU のアイドル時間
|
cpu_kernel
|
CPU のカーネル時間
|
cpu_user
|
CPU のユーザ時間
|
cpu_wait
|
CPU wait time
|
ipctused
|
使用されている i ノードの割合
|
kpctused
|
使用されている容量の割合 (単位: K バイト)
|
mem-inuse
|
使用されている物理メモリー (単位: M
バイト)
|
numusers
|
ユーザ数
|
numsessions
|
ユーザセッションの数
|
swap_used
|
使用されているスワップ (単位: K バイト)
|
wait_io
|
CPU 待ち時間の内訳
|
wait_pio
|
CPU 待ち時間の内訳
|
wait_swap
|
CPU 待ち時間の内訳
|
次の表は、カーネルリーダの複雑な規則を示したものです。
表 D–2 カーネルリーダの複雑な規則
規則の ID
|
説明
|
アラームの種類
|
rknrd100
|
この規則は一時的なイベントに適用されます。この規則は、ディスクが
75% を超えてビジー状態であり、待ち行列の平均の長さが 10 を超え、待ち行列がさらに長くなりつつある場合に警告アラームを生成します。警告アラームは、ディスクが
70% 未満のビジー状態になり、かつ待ち行列の平均長が 8 未満になるまで続きます。
|
Alert (警告)
|
rknrd102
|
この規則は一時的なイベントに適用されます。この規則は、90% のスワップ空間が使用状態になった場合に警告アラームを生成します。アラームを引き起こしているイベントは、使用されているスワップ空間がトータルスワップ空間の
80% 未満になるまで続きます。
|
Alert
(警告)
|
rknrd103
|
この規則は一時的なイベントに適用されます。この規則は、特定の CPU についてスワッピングとページングが過度の状態となった場合に警告アラームを生成します。この動作は、CPU
がスラッシングを起こしている可能性があることを示します。CPU が 1 秒間に 1 回のスワップアウト、10 回のページイン、10 回のページアウトを超える場合には警告アラームが生成されます。この警告アラームは、CPU
が 1 秒間に 1 回のスワップアウト、8 回のページイン、8 回のページアウトを超える場合に継続します。
|
Alert (警告)
|
rknrd105
|
File
System Full エラー。この規則は、syslog (/var/adm/message) 内に file system full エラーメッセージがないかを探します。
|
ただちに閉じられる警告アラーム
|
rknrd106
|
no swap space
エラーこの規則は、syslog (/var/adm/message) 内に no swap space エラーがないかを探します。
|
ただちに閉じられる警告アラーム
|
rknrd400
|
この規則は、CPU ごとに 4 時間以内に 6 を超える継続的な CPU 負荷がないかをチェックします。
|
情報メッセージ
|
rknrd401
|
この規則は、x 時間で 90% を超えるファイルがビジー状態となるディスクがないかをチェックします。パラメータフィールドは、CPU
負荷が 6 未満であった最後の時点を維持し、2001 年のある日付に初期化されます。
|
情報メッセージ
|
rknrd402
|
この規則は、使用可能なスワップ空間が x
時間で 10% 未満に低下するかどうかをチェックします。パラメータフィールドは、CPU 負荷が 6 未満であった最後の時点を示します。このフィールドは、2001
年のある日付に初期化されます。
|
情報メッセージ
|
rknrd403
|
この規則は現在サポートされていません。
|
情報メッセージ
|
rknrd404
|
規則 rknrd401 が 4 回引き起こされる場合には、情報アラームが生成されます。
|
情報メッセージ
|
rknrd405
|
規則 rknrd402 が 4 回引き起こされる場合には、情報アラームが生成されます。
|
情報メッセージ
|
状態モニター
次の表は、状態モニターの複雑な規則を示したものです。
表 D–3 状態モニターの複雑な規則
規則の ID
|
説明
|
アラームの種類
|
rhltm000
|
この規則は、十分なスワップ空間が存在するかどうかをチェックします。
|
重大、警告、注意
|
rhltm001
|
CPU パワーは、CPU がロックの開放を待機するたびに消費されます。このイベントがカウントされるのは、カーネルがそのオペレーションの同期をとったり、複数の
CPU が重要なコードやデータ領域を同時アクセスしないように相互排除ロックを使用するためです。
|
重大、警告、注意
|
rhltm002
|
NFS RPC
のタイムアウトは、呼び出しが再送信されたあとの重複応答と関係がある可能性があります。これらのタイムアウトは、ネットワークには問題がないがサーバの応答が遅いことを示します。
|
重大、警告、注意
|
rhltm003
|
各 CPU はタイムスライスごとに実行待ち行列からジョブを 1 つ取り除くため、実行待ち行列の長さは
CPU の数で分割されます。
|
重大、警告、注意
|
rhltm004
|
ビジー状態のディスクや処理の遅いディスクは、システムスループットを低下させ、ユーザ応答時間を増やします。この規則は、負荷の均衡を調整し直すように読み込まれるディスクを特定します
|
重大、警告、注意
|
rhltm005
|
参照されないページの占有時間にもとづく
RAM 規則。この仮想メモリーシステムは、アイドルページを探してほかの利用に開放するために走査を行う際にシステムはより多くのメモリーを必要とすることを示しています。
|
重大、警告、注意
|
rhltm006
|
この規則は、ログインまたはネットワーク接続が思いがけなく失敗する場合に起きるカーネルメモリー割り当てについての問題について述べています。原因としては、カーネルがそのアドレス空間の限界に達したか、あるいは
割り当てるべきページが空きリスト内に存在しないという状況が考えられます。失敗が連続する場合は、見落とされやすい問題が発生しています。
|
重大、警告、注意
|
rhltm007
|
ディレクトリパス名コンポーネントのグローバルキャッシュが存在します。このキャッシュは、ディレクトリ名ルックアップキャッシュ
(DNLC) と呼ばれます。このキャッシュが存在しない場合には、正しいファイルを見つけるためにディレクトリエントリをディスクから読み取って走査する必要があります。
|
重大、警告、注意
|