Sun N1 System Manager 1.3 検出および管理マニュアル

監視しきい値

監視対象の OS 健全性属性の値は、しきい値と比較されます。下限および上限しきい値を定義し、それらの値を設定することができます。

属性データは、定期的にしきい値と比較されます。

監視対象属性の値がデフォルトまたはユーザー定義のしきい値安全範囲外の場合は、イベントが生成され、ステータスが発行されます。属性値が下限しきい値を下回るか、上限しきい値を上回ると、そのしきい値の重要度に応じて、イベントが生成され、「回復不能」か「重大」、または「警告」いずれかのステータスが示されます。それ以外の場合では、属性値が取得できるときは、OS 健全性の監視属性のステータスが「良好」になります。

属性値そのものが取得できない場合は、イベントが生成され、監視対象の属性のステータスが「未知」であることが示されます。サーバーにはアクセス可能だが、監視機能のエージェントに SNMP ポート 161 で通信できない場合、OS リソースの健全性が「未知」になります。詳細は、「管理対象サーバーの状態の「アクセス不能」と「未知」の違いについて」を参照してください。

「回復不能」、「重大」、「警告」、および「未知」の各ステータスは、ブラウザインタフェースに表示されるアラームで表されます。

「回復不能」、「重大」、および「警告」の各値については、『Sun N1 System Manager 1.3 コマンド行リファレンスマニュアル』「show server」を参照してください。

OS 健全性属性のしきい値は、コマンド行から設定できます。この作業については、「しきい値の設定」で説明します。割合を測定するしきい値の場合、有効な範囲は 0% 〜 100% です。この範囲外のしきい値を設定しようとすると、エラーになります。割合を測定しない属性の場合、その値は、システム内のプロセッサ数と導入先の使用特性に依存します。

しきい値が範囲外の場合の現象について

OS 健全性の監視対象の属性の値が「警告の上限」しきい値を上回った場合は、「警告の上限」のステータスが発行されます。この値が上昇し続けて、「重大の上限」しきい値を過ぎると、「重大」のステータスが発行されます。値がさらに上昇し続けて、「回復不能の上限」しきい値を上回ると、「回復不能の上限」のステータスが発行されます。

逆に値が下がって安全範囲に戻った場合は、値が「警告」しきい値よりも低くなるまで、イベントは生成されません。値が戻ると、イベントが生成され、ステータスとして「正常」が示されます。

監視対象の属性の値が「警告の下限」しきい値を下回った場合は、「警告」のステータスが発行されます。この値が下がり続けて、「重大の下限」しきい値を過ぎると、「重大」のステータスが発行されます。値がさらに下がり続けて、「回復不能の下限」しきい値を下回ると、「回復不能の下限」のステータスが発行されます。

逆に値が上昇して安全範囲に戻った場合は、値が「警告の下限」しきい値よりも高くなるまで、イベントは生成されません。値が戻ると、イベントが生成され、ステータスとして「正常」が示されます。

導入状況に応じたしきい値の調整

一定の期間使用したあとで、適切な OS 健全性の属性値の設定レベルが判明することがあります。イベントの生成、およびポケットベルまたは電子メールアドレスへのイベント通知の送信に関して、本当に妥当な値に近いものが判明したら、しきい値を調整することができます。たとえば、特定の属性が「警告の上限」のしきい値レベルに達すたびにイベント通知を受け取るようにすることができます。詳細は、「イベント通知の設定」を参照してください。

導入先で重要な属性の場合は、「警告の上限」しきい値レベルを小さい割合値に設定して、できるだけ早期に値の上昇が分かるようにすることができます。

Procedureサーバーのしきい値を取得する

始める前に

server という名前のサーバーで、 管理エージェント IP およびセキュリティー資格を有効にするには、管理機能を追加します (「基本管理機能と OS 監視機能の追加およびアップグレード」を参照)。

  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. show server コマンドを入力します。


    N1-ok> show server server
    

    この例の server は、しきい値を取得する管理対象サーバーの名前です。

    サーバーのハードウェア健全性、OS 健全性、ネットワークの到達可能性などの詳細な監視しきい値情報が表示されます。具体的な値が設定されていない場合は、デフォルト値が表示されます。

    詳細は、『Sun N1 System Manager 1.3 コマンド行リファレンスマニュアル』「show server」を参照してください。

    • しきい値情報は、ブラウザインタフェースの「サーバーの詳細」ページでも確認できます。それを次の図に示します。

      この図は、OS 監視情報およびしきい値のステータス情報を「サーバーの詳細」ページに表示できることを示しています。

デフォルトのしきい値

N1 System Manager ソフトウェアでは、一部の OS 健全性属性について、工場出荷時のしきい値が用意されています。これらの値は、百分率で表されています。表 6–3 に、これらの OS 健全性属性のデフォルト値を示します。


注 –

今回のバージョンの Sun N1 System Manager では、ハードウェアの健全性属性のしきい値の設定および変更はサポートされていません。


表 6–3 OS 健全性属性のデフォルトしきい値の出荷時設定

属性名 

説明 

デフォルトしきい値 

デフォルトしきい値 

cpustats.loadavg1min

待ち状態が 1 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh >4.00

criticalhigh >5.00

cpustats.loadavg5min

待ち状態が 5 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh >4.10

criticalhigh >5.10

cpustats.loadavg15min

待ち状態が 15 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh >4.10

criticalhigh >5.10

cpustats.pctusage

CPU 全体の使用率 

warninghigh >80%

criticalhigh >90.1%

cpustats.pctidle

CPU アイドル率 

warninglow <20%

criticallow <10%

memusage.mbmemfree

M バイト単位の未使用メモリー 

warninghigh <39%

criticalhigh <29%

memusage.mbmemused

M バイト単位の使用メモリー 

warninghigh >1501

criticalhigh >2001

memusage.pctmemused

メモリーの使用率 

warninghigh >80%

criticalhigh >90%

memusage.pctmemfree

メモリーの未使用率 

warninglow <20%

criticallow <10%

memusage.kbswapused

K バイト単位の使用中のスワップ空間 

warninghigh >500000

criticalhigh >1000000

fsusage.kbspacefree

K バイト単位のシステムの未使用領域 

warninglow <94.0Kb

criticallow <89.0Kb

個々のしきい値は、「しきい値の設定」で説明している手順に従ってコマンド行で設定することができます。

しきい値の設定

個別サーバーに OS 監視属性のしきい値を設定することができます。コマンド行から OS 健全性属性のしきい値を設定すると、その属性に関するしきい値の工場出荷時設定が無効になります。

Procedureサーバーに対するしきい値を設定する

始める前に

server という名前のサーバーで、 管理エージェント IP およびセキュリティー資格を有効にするには、管理機能を追加します (「基本管理機能と OS 監視機能の追加およびアップグレード」を参照)。

  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. threshold 属性を付けて set server コマンドを使用します。

    この構文では、threshold キーワードのあとに、しきい値を設定する attribute を続ける必要があります。attribute は OS 健全性属性です。OS 健全性属性の説明は、「OS の健全性の監視」に、一覧は、表 6–2 にあります。

    threshold は、criticallowwarninglow warninghighcriticalhigh のいずれかです。値は数字で、通常は百分率を表します。

    set server の操作では、実際に管理対象サーバーに接続しません。管理サーバー自身のデータを同期するだけです。

    • しきい値を 1 つ設定するには、次のように入力します。


      N1-ok> set server server threshold attribute threshold value
      
    • サーバーに対して複数のしきい値を設定するには、次のように入力します。


      N1-ok> set server server threshold attribute threshold value threshold value
      
    • サーバーグループの場合は、threshold 属性を付けて set group コマンドを使用します。サーバーグループのしきい値を 1 つ変更するには、次のように入力します。


      N1-ok> set group group threshold attribute threshold value
      
    • サーバーグループの複数のしきい値を変更するには、次のように入力します。


      N1-ok> set group group threshold attribute threshold value threshold value
      

例 6–5 サーバーの CPU 使用率に関する複数しきい値の設定

この例は、serv1 という名前の管理対象サーバーで、CPU 使用率の warninghigh しきい値を 53 パーセントに設定する方法を示しています。また、criticalhigh しきい値を 75 パーセントに設定しています。


N1-ok> set server serv1 threshold cpustats.pctusage warninghigh 53 criticalhigh 75


例 6–6 サーバーのファイルシステム使用率に関する複数しきい値の設定

この例では、serv1 という名前の管理対象サーバーで、ファイルシステム使用率の warninghigh しきい値を 75 パーセントに設定しています。また、criticalhigh しきい値を 87 パーセントに設定しています。この例では、サーバーのすべてのファイルシステムに対してしきい値を設定します。


N1-ok> set server serv1 threshold fsusage.pctused warninghigh 75 criticalhigh 87

複数のしきい値を設定するファイルシステムを指定することもできます。このサーバーの /usr ファイルシステムに対して warninghigh しきい値を 75 パーセント、criticalhigh しきい値を 87 パーセントに設定するには、filesystem 属性を使用します。


N1-ok> set server serv1 filesystem /usr threshold fsusage.pctused 
warninghigh 75 criticalhigh 87


例 6–7 サーバーのファイルシステム空き容量に関するしきい値の設定

この例では、serv1 という名前の管理対象サーバーで、/var ファイルシステムのファイルシステム空き容量に対する warninghigh しきい値を 150K バイトに設定します。


N1-ok> set server serv1 filesystem /var threshold fsusage.kbspacefree warninghigh 150


例 6–8 サーバーの未使用メモリーに関するしきい値の設定

この例では、serv1 という名前の管理対象サーバーで、未使用メモリー率に対する criticalhigh しきい値を 5 パーセントに設定します。


N1-ok> set server serv1 threshold memusage.pctmemused criticalhigh 5


例 6–9 サーバーのファイルシステム使用率しきい値の削除

この例では、serv1 という名前の管理対象サーバーに設定されている warninghigh しきい値を削除します。


N1-ok> set server serv1 threshold fsusage warninghigh none

この場合は、このしきい値の該当する重要度の以前の設定値が削除されます。実際には、このサーバーのファイルシステム使用の warninghigh しきい値に関する監視は無効になります。



例 6–10 サーバーグループのファイルシステム使用に関する複数のしきい値の設定

この例は、grp3 という名前の管理対象サーバーのグループのファイルシステム使用の warninghigh しきい値を 75 パーセントに設定する方法を示しています。また、criticalhigh しきい値を 87 パーセントに設定しています。


N1-ok> set group grp3 threshold fsusage.pctused warninghigh 75 criticalhigh 87