Sun N1 System Manager 1.2 管理ガイド

監視しきい値

監視対象の OS 健全性属性の値は、しきい値と比較されます。下限および上限しきい値を定義し、それらの値を設定することができます。

属性データは、定期的にしきい値と比較されます。

監視対象属性の値がデフォルトまたはユーザー定義のしきい値安全範囲外の場合は、イベントが生成され、ステータスが実行されます。属性値が下限しきい値を下回るか、上限しきい値を上回ると、そのしきい値の重要度に応じて、イベントが生成され、「回復不能」か「重大」、または「警告」いずれかのステータスが示されます。それ以外の場合では、属性値が取得できるときは、OS 健全性の監視属性のステータスが「良好」になります。

属性値そのものが取得できない場合は、イベントが生成され、監視対象の属性のステータスが「不明」であることが示されます。サーバーにはアクセス可能だが、監視機能のエージェントに SNMP ポート 161 で通信できない場合、OS リソースの健全性が unknown になります。詳細は、「プロビジョニング可能なサーバーの状態の「アクセス不能」と「不明」の違いについて」を参照してください。

「回復不能」、「重大」、および「警告」については、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show server」を参照してください。

しきい値が範囲外の場合の現象について

OS 健全性の監視対象の属性の値が「警告の上限」しきい値を上回った場合は、「警告の上限」のステータスが実行されます。この値が上昇し続けて、「重大の上限」しきい値を過ぎると、「Failed Critical」のステータスが実行されます。値がさらに上昇し続けて、「回復不能の上限」しきい値を上回ると、「回復不能の上限」のステータスが実行されます。

逆に値が下がって安全範囲に戻った場合は、値が「Failed Warning」しきい値よりも低くなるまで、イベントは生成されません。値が戻ると、イベントが生成され、ステータスとして「正常」が示されます。

監視対象の属性の値が「警告の下限」しきい値を下回った場合は、「Failed Warning」のステータスが実行されます。この値が下がり続けて、「重大の下限」しきい値を過ぎると、「 Failed Critical」のステータスが実行されます。値がさらに下がり続けて、「回復不能の下限」しきい値を下回ると、「回復不能の下限」のステータスが実行されます。

逆に値が上昇して安全範囲に戻った場合は、値が「警告の下限」しきい値よりも高くなるまで、イベントは生成されません。値が戻ると、イベントが生成され、ステータスとして「正常」が示されます。

OS 健全性属性のしきい値は、コマンド行から設定できます。この作業については、「しきい値の設定」で説明します。割合を測定するしきい値の場合、有効な範囲は 0% 〜 100% です。この範囲外のしきい値を設定しようとすると、エラーになります。割合を測定しない属性の場合、その値は、システム内のプロセッサ数と導入先の使用特性に依存します。

導入状況に応じたしきい値の調整

一定の期間使用したあとで、適切な OS 健全性の属性値の設定レベルが判明することがあります。イベントの生成、およびポケットベルまたは電子メールアドレスへのイベント通知の送信に関して、本当に妥当な値に近いものが判明したら、しきい値を調整することができます。たとえば、特定の属性が「警告の上限」のしきい値レベルに達すたびにイベント通知を受け取るようにすることができます。詳細は、「イベント通知の設定」を参照してください。

導入先で重要な属性の場合は、「警告の上限」しきい値レベルを小さい割合値に設定して、できるだけ早期に値の上昇が分かるようにすることができます。

Procedureサーバーのしきい値を取得する

始める前に

server という名前のサーバーで、管理エージェント IP およびセキュリティー資格を有効にするには管理機能を追加します (「基本管理機能と OS 監視機能の追加およびアップグレード」を参照)。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. show server コマンドを入力します。


    N1-ok> show server server
    

    この例の server は、しきい値を取得するプロビジョニング可能なサーバーの名前です。

    サーバーのハードウェア健全性、OS 健全性、ネットワークの到達可能性などの詳細な監視しきい値情報が表示されます。具体的な値が設定されていない場合は、デフォルト値が表示されます。

    詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show server」を参照してください。

    • しきい値情報は、ブラウザインタフェース の「サーバーの詳細」ページでも確認できます。それを次の図に示します。

      この図は、OS 監視情報およびしきい値のステータス情報を「サーバーの詳細」ページに表示できることを示しています。

デフォルトしきい値の管理

N1 System Manager ソフトウェアでは、一部の OS 健全性属性について、工場出荷時のしきい値が用意されています。これらの値は、百分率で表されています。表 5–1 は、Sun Fire V20z サーバー用の OS 健全性属性のデフォルト値の一覧です。


注 –

今回のバージョンの Sun N1 System Manager では、ハードウェアの健全性属性のしきい値の設定および変更はサポートされていません。


表 5–1 Sun Fire V20z の OS 健全性属性のデフォルトしきい値の出荷時設定

属性名 

説明 

デフォルトしきい値 

デフォルトしきい値 

cpustats.loadavg1min

待ち状態が 1 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh >4.00

criticalhigh >5.00

cpustats.loadavg5min

待ち状態が 5 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh >4.10

criticalhigh >5.10

cpustats.loadavg15min

待ち状態が 15 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh >4.10

criticalhigh >5.10

cpustats.pctusage

CPU 全体の使用率 

warninghigh >80%

criticalhigh >90.1%

cpustats.pctidle

CPU アイドル率 

warninglow <20%

criticallow <10%

memusage.mbmemfree

M バイト単位の未使用メモリー 

warninghigh <39%

criticalhigh <29%

memusage.mbmemused

M バイト単位の使用メモリー 

warninghigh >1501

criticalhigh >2001

memusage.pctmemused

メモリーの使用率 

warninghigh >80%

criticalhigh >90%

memusage.pctmemfree

メモリーの未使用率 

warninglow <20%

criticallow <10%

memusage.kbswapused

使用中のスワップスペース (KB) 

warninghigh >500000

criticalhigh >1000000

fsusage.kbspacefree

システムの未使用領域 (KB) 

warninglow <94.0Kb

criticallow <89.0Kb

個々のしきい値は、「しきい値の設定」で説明している手順に従って コマンド行で設定することができます。

表 5–2 に、OS 健全性属性の完全な一覧を示します。

表 5–2 OS 健全性属性 (すべて)

属性名 

説明 

サポートされるしきい値 

サポートされるしきい値 

cpustats.loadavg1min

待ち状態が 1 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh

criticalhigh

cpustats.loadavg5min

待ち状態が 5 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh

criticalhigh

cpustats.loadavg15min

待ち状態が 15 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh

criticalhigh

cpustats.pctusage

CPU 全体の使用率 

warninghigh

criticalhigh

cpustats.pctidle

CPU アイドル率 

warninglow

criticallow

memusage.pctmemused

メモリーの使用率 

warninghigh

criticalhigh

memusage.pctmemfree

メモリーの未使用率 

warninglow

criticallow

memusage.mbmemused

M バイト単位の使用メモリー 

warninghigh

criticalhigh

memusage.mbmemfree

M バイト単位の未使用メモリー 

warninglow

criticallow

memusage.kbswapused

使用中のスワップスペース (KB) 

warninghigh

criticalhigh

memusage.mbswapfree

M バイト単位の未使用スワップ空間 

warninglow

criticallow

memusage.pctswapfree

スワップ空間の未使用率 

warninglow

criticallow

fsusage.pctused

ファイルシステム空間の使用率 

warninghigh

criticalhigh

fsusage.kbspacefree

システムの未使用領域 (KB) 

warninghigh

criticalhigh

しきい値の設定

個別サーバーに OS 監視属性のしきい値を設定することができます。コマンド行から OS 健全性属性のしきい値を設定すると、その属性に関するしきい値の工場出荷時設定が無効になります。

Procedureサーバーに対するしきい値を設定する

始める前に

server という名前のサーバーで、 管理エージェント IP およびセキュリティー資格を有効にするには、管理機能を追加します (「基本管理機能と OS 監視機能の追加およびアップグレード」を参照)。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. threshold 属性を付けて set server コマンドを使用します。

    この構文では、threshold キーワードのあとに、しきい値を設定する attribute を続ける必要があります。attribute は OS 健全性属性です。OS 健全性属性の説明は、「OS の健全性の監視」に、一覧は、表 5–2 にあります。

    threshold は、criticallowwarninglow warninghighcriticalhigh のいずれかです。値は数字で、通常は百分率を表します。

    set server の操作では、実際にプロビジョニング可能なサーバーに接続しません。管理サーバー自身のデータを同期するだけです。

    • しきい値を 1 つ設定するには、次のように入力します。


      N1-ok> set server server threshold attribute threshold value
      
    • サーバーに対して複数のしきい値を設定するには、次のように入力します。


      N1-ok> set server server threshold attribute threshold value threshold value
      
    • サーバーグループの場合は、threshold 属性を付けて set group コマンドを使用します。サーバーグループのしきい値を 1 つ変更するには、次のように入力します。


      N1-ok> set group group threshold attribute threshold value
      
    • サーバーグループの複数のしきい値を変更するには、次のように入力します。


      N1-ok> set group group threshold attribute threshold value threshold value
      

例 5–2 サーバーの CPU 使用率に関する複数しきい値の設定

この例は、serv1 という名前のプロビジョニング可能なサーバーで、CPU 使用率の warninghigh しきい値を 53 パーセントに設定する方法を示しています。また、criticalhigh しきい値を 75 パーセントに設定しています。


N1-ok> set server serv1 threshold cpustats.pctusage warninghigh 53 criticalhigh 75


例 5–3 サーバーのファイルシステム使用率に関する複数しきい値の設定

この例では、serv1 という名前のプロビジョニング可能なサーバーで、ファイルシステム使用率の warninghigh しきい値を 75 パーセントに設定しています。また、criticalhigh しきい値を 87 パーセントに設定しています。この例では、サーバーのすべてのファイルシステムに対してしきい値を設定します。


N1-ok> set server serv1 threshold fsusage.pctused warninghigh 75 criticalhigh 87

複数のしきい値を設定するファイルシステムを指定することもできます。このサーバーの /usr ファイルシステムに対して warninghigh しきい値を 75 パーセント、criticalhigh しきい値を 87 パーセントに設定するには、 filesystem 属性を使用します。


N1-ok> set server serv1 filesystem /usr threshold fsusage.pctused 
warninghigh 75 criticalhigh 87


例 5–4 サーバーのファイルシステム空き容量に関するしきい値の設定

この例では、serv1 という名前のプロビジョニング可能なサーバーで、/var ファイルシステムのファイルシステム空き容量に対する warninghigh しきい値を 150K バイトに設定します。


N1-ok> set server serv1 filesystem /var threshold fsusage.kbspacefree warninghigh 150


例 5–5 サーバーの未使用メモリーに関するしきい値の設定

この例では、serv1 という名前のプロビジョニング可能なサーバーで、未使用メモリー率に対する criticalhigh しきい値を 5 パーセントに設定します。


N1-ok> set server serv1 threshold memusage.pctmemused criticalhigh 5


例 5–6 サーバーのファイルシステム使用率しきい値の削除

この例では、serv1 という名前のプロビジョニング可能なサーバーに設定されている warninghigh しきい値を削除します。


N1-ok> set server serv1 threshold fsusage warninghigh none

この場合は、このしきい値の該当する重要度の以前の設定値が削除されます。実際には、このサーバーのファイルシステム使用の warninghigh しきい値に関する監視は無効になります。



例 5–7 サーバーグループのファイルシステム使用に関する複数のしきい値の設定

次の例は、grp3 というグループ名の、プロビジョニング可能なサーバーのグループで、ファイルシステム使用の warninghigh しきい値を 75 パーセントに設定する方法を示しています。また、criticalhigh しきい値を 87 パーセントに設定しています。


N1-ok> set group grp3 threshold fsusage.pctused warninghigh 75 criticalhigh 87