Sun N1 System Manager 1.0 管理ガイド

監視しきい値

監視対象の属性の値は、しきい値と比較されます。下限および上限しきい値を定義し、それらの値を設定することができます。

属性データは、定期的にしきい値と比較されます。このポーリング間隔の設定は変更できます。ポーリング間隔の詳細は、「ポーリング間隔」を参照してください。

監視対象属性がポーリングされ、その属性値がデフォルトまたはユーザー定義のしきい値安全範囲外の場合は、イベントが生成され、ステータスが発行されます。属性値が下限しきい値を下回るか、上限しきい値を上回ると、そのしきい値の重要度に応じて、イベントが生成され、「回復不能」か「重大」、または「警告」いずれかのステータスが示されます。どちらでもない場合は、属性値が取得できることを前提として、監視属性のステータスは「正常」になります。

属性値そのものが取得できない場合は、イベントが生成され、監視対象の属性のステータスが「不明」であることが示されます。

ステータスの 「回復不能」、「重大」、および「警告」については、「パラメータ」で説明します。

監視対象の属性の値が「警告上限」しきい値を上回った場合は、「警告上限」のステータスが発行されます。この値が上昇し続けて、「重大上限」しきい値を過ぎると、「重大上限」のステータスが発行されます。値がさらに上昇し続けて、「回復不能上限」しきい値を上回ると、「回復不能上限」のステータスが発行されます。

逆に値が下がって安全範囲に戻った場合は、値が「警告上限」しきい値より低くなり、安全範囲に戻るまで、イベントは生成されません。安全範囲に戻ると、イベントが生成され、ステータスとして「正常」が示されます。

監視対象の属性の値が「警告下限」しきい値を下回った場合は、「警告下限」のステータスが発行されます。この値が下がり続けて、「重大下限」しきい値を過ぎると、「重大下限」のステータスが発行されます。値がさらに下がり続けて、「回復不能下限」しきい値を下回ると、「回復不能下限」のステータスが発行されます。

逆に値が上昇して安全範囲に戻った場合は、値が「警告下限」しきい値より高くなり、安全範囲に戻るまで、イベントは生成されません。安全範囲に戻ると、イベントが生成され、ステータスとして「正常 」が示されます。

OS リソースの使用属性のしきい値は、コマンド行から設定できます。この作業については、「しきい値の設定」で説明します。割合を測定するしきい値の場合、有効な範囲は 0% 〜 100% です。この範囲外のしきい値を設定しようとすると、エラーになります。割合を測定しない属性の場合、その値は、システム内のプロセッサ数と導入先の使用特性に依存します。

ある程度の使用期間が経過すると、OS リソースの使用属性について、実際にどのような値を設定すべきかが判明してきます。イベントの生成、およびポケットベルまたは電子メールアドレスへの通知の送信に関して、本当に妥当なレベルまたは値に近いものが判明したら、しきい値を調整することができます。たとえば、特定の属性が「警告上限」しきい値レベルに達するたびに通知を受けるようにすることができます。導入先で特に重要な属性の場合は、「警告上限」しきい値レベルを小さい割合値に設定して、できるだけ早期に値の上昇が分かるようにすることができます。

Procedureサーバーのしきい値を取得する

始める前に

server という名前のサーバー上の管理エージェント IP およびセキュリティ資格を有効にするには、「OS 管理エージェントをインストールする」の説明に従って、そのサーバーに管理エージェントをインストールします。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. show server コマンドを入力します。


    N1-ok> show server server
    

    この例の server は、しきい値を読み出すプロビジョニング可能なサーバーの名前です。

    サーバーのハードウェア健全性、OS リソースの使用、ネットワークの到達可能性などの詳細な監視しきい値情報が出力に表示されます。具体的な値が設定されていない場合は、デフォルト値が表示されます。

    詳細は、「show server」を参照してください。

デフォルトしきい値の管理

しきい値のデフォルト値は、monitoring.properties 構成ファイルを編集することによって変更できます。monitoring.properties 構成ファイルが存在しない場合は、作成して、/etc/opt/sun/n1gc/monitoring.properties に保存してください。デフォルトでは、インストール時にこのファイルは作成されません。


注 –

今回のバージョンの Sun N1 System Manager では、ハードウェアの健全性属性のしきい値の設定および変更はサポートされていません。


N1 System Manager ソフトウェアでは、一部の OS リソース使用属性について、工場出荷時のデフォルトしきい値が用意されています。これらの値は、百分率値で表されています。表 6–1 は、OS リソースの使用属性のデフォルト値の一覧です。

表 6–1 OS リソースの使用属性のデフォルトしきい値の出荷時設定

属性名 

説明 

デフォルトしきい値 

デフォルトしきい値 

cpustats.pctusage

全体の CPU 使用率 

warninghigh 80%

criticalhigh 90%

cpustats.pctidle

全体の CPU アイドル率 

warninglow 20%

criticallow 10%

memusage.pctmemused

メモリーの使用率 

warninghigh 80%

criticalhigh 90%

memusage.pctmemfree

メモリーの未使用率 

warninglow 20%

criticallow 10%

memusage.pctswapused

スワップ空間の使用率 

warninghigh 80%

criticalhigh 90%

fsusage.pctused

ファイルシステム空間の使用率 

warninghigh 80%

criticalhigh 90%

OS リソースの使用属性については、付録 A 「ハードウェアおよび OS リソースの属性」の全一覧にまとめています。

monitoring.properties 構成ファイル内の 表 6–1 に示す属性のしきい値を変更すると、対応するしきい値の出荷時設定デフォルト値が上書きされます。

monitoring.properties 構成ファイルは 管理サーバーにのみ保存し、プロビジョニング可能なサーバーには保存しないでください。

monitoring.properties 構成ファイルを変更するか、エントリを追加すると、N1 System Manager によって管理されているすべてのプロビジョニング可能なサーバーに影響します。

個々のしきい値は、「しきい値の設定」で説明している手順に従って コマンド行で設定することができます。

monitoring.properties 構成ファイルに手動で監視対象項目のデフォルト値を追加することによってデフォルト値を変更すると、コマンド行から監視対象の属性の値が個別に設定されているサーバーを除くすべてのプロビジョニング可能なサーバーに、その変更後のデフォルト値が適用されます。


注 –

monitoring.properties ファイルに対する変更を有効にするために、管理サーバーや監視対象のプロビジョニング可能なサーバーを再起動する必要はありません。


百分率で表されるハードウェアの健全性の監視対象属性は、コマンド行 から変更することも、また monitoring.properties ファイルを編集することによって変更することもできます。

Procedureサーバーのデフォルトしきい値を変更する

デフォルトしきい値を変更するには、/etc/opt/sun/n1gc/monitoring.properties ファイルをエディタで編集します。変更できるのは、OS リソースの使用属性に関係するデフォルトしきい値だけです。ハードウェアの健全性属性のデフォルトしきい値は変更できません。

始める前に

server という名前のサーバー上の管理エージェント IP およびセキュリティ資格を有効にするには、「OS 管理エージェントをインストールする」の説明に従って、そのサーバーに管理エージェントをインストールします。

手順
  1. エディタで /etc/opt/sun/n1gc/monitoring.properties ファイルを開きます。

    このファイルが存在しない場合は、作成してください。

  2. monitoring.properties ファイル内のデフォルトしきい値を定義している行を変更するか、追加します。

    threshold. attribute.threshold= value

    この構文では、threshold キーワードの後に、しきい値を設定する attribute を続ける必要があります。attribute は、OS リソースの使用属性です。OS リソースの使用属性については、「OS リソースの使用の監視」で説明しています。

    threshold は、criticallowwarninglow warninghighcriticalhigh のいずれかです。

    値は数字で、通常は百分率値を表します。

  3. ファイルを保存します。

    変更を有効にするために、管理サーバーおよびプロビジョニング可能なサーバーを再起動する必要はありません。これで、N1 System Manager が管理するすべてのサーバーに変更後のデフォルトしきい値が適用されます。


例 6–1 ファイルシステム使用のデフォルトしきい値の変更

この例では、ファイルシステム使用のデフォルトの criticalhigh しきい値を最大ファイルシステム使用量の 75% に変更します。/etc/opt/sun/n1gc/monitoring.properties ファイルに次の行を追加するか、既存の行を変更します。


threshold.fsusage.pctused.criticalhigh=75

「しきい値の設定」で説明にしたがってコマンド行からset コマンドを使い、個別にしきい値の値を設定していないかぎり、この値はすべてのプロビジョニング可能なサーバーに適用されます。

しきい値は無効にすることができます。この方法は、例 6–4 で示します。


しきい値の設定

個別サーバーに監視対象オブジェクトのしきい値を設定することができます。コマンド行から監視対象オブジェクトの属性のしきい値を設定すると、該当するオブジェクトのその属性に関するしきい値の出荷時設定が無効になります。また、該当するオブジェクトのその属性に関する、monitoring.properties 内のすべてのエントリも無効になります。

Procedureサーバーに対するしきい値を設定する

始める前に

server という名前のサーバー上の管理エージェント IP およびセキュリティ資格を有効にするには、「OS 管理エージェントをインストールする」の説明に従って、そのサーバーに管理エージェントをインストールします。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. threshold 属性を付けて set server コマンドを入力します。


    N1-ok> set server server threshold attribute threshold=value
    

    サーバーの複数しきい値を設定する場合は、次の構文を使用します。


    N1-ok> set server server threshold attribute threshold=value threshold=value
    

    この構文では、threshold キーワードの後に、しきい値を設定する attribute を続ける必要があります。attribute は、OS リソースの使用属性です。OS リソースの使用属性については、「OS リソースの使用の監視」で説明しています。また、付録 A 「ハードウェアおよび OS リソースの属性」に一覧があります。

    threshold は、criticallowwarninglowwarninghighcriticalhigh のいずれかです。

    値は数字で、通常は百分率値を表します。


例 6–2 サーバーの CPU 使用に関する複数しきい値の設定

この例では、serv1 という名前のプロビジョニング可能なサーバー上の CPU 使用 warninghigh しきい値を 53%、criticalhigh しきい値を 75% に設定しています。


N1-ok> set server serv1 threshold cpustats.pctusage warninghigh=53 criticalhigh=75

serv1 という名前のサーバーについては、これらの値が、管理サーバー上の monitoring.properties 構成ファイルに保存されているデフォルト値に優先します。



例 6–3 サーバーのファイルシステム使用に関する複数しきい値の設定

この例では、serv1 という名前のプロビジョニング可能なサーバー上のファイルシステム使用の warninghigh しきい値を 75%、 criticalhigh しきい値を 87% に設定しています。


N1-ok> set server serv1 threshold fsusage.pctused warninghigh=75 criticalhigh=87


例 6–4 サーバーのファイルシステム使用しきい値の削除

この例では、serv1 という名前のプロビジョニング可能なサーバーに設定されている warninghigh しきい値を削除しています。


N1-ok> set server serv1 threshold fsusage warninghigh=none

この場合は、このしきい値の該当する重要度の以前の設定値が削除されます。このしきい値の重要度値が、monitoring.properties 構成ファイルに保存されているデフォルトしきい値や、出荷時設定のデフォルト値 (この属性に存在する場合) に戻ることはありません。実際には、このサーバーのファイルシステム使用の warninghigh しきい値に関する監視は無効になります。


Procedureサーバーグループに対するしきい値を設定する

始める前に

server という名前のサーバー上の管理エージェント IP およびセキュリティ資格を有効にするには、「OS 管理エージェントをインストールする」の説明に従って、そのサーバーに管理エージェントをインストールします。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. threshold 属性を付けて set group コマンドを入力します。


    N1-ok> set group group threshold attribute threshold=value
    

    サーバーグループの複数しきい値を変更する場合は、次の構文を使用します。


    N1-ok> set group group threshold attribute threshold=value threshold=value
    

    この構文では、threshold キーワードの後に、しきい値を設定する attribute を続ける必要があります。attribute は、OS リソースの使用属性です。OS リソースの使用属性については、「OS リソースの使用の監視」で説明しています。また、付録 A 「ハードウェアおよび OS リソースの属性」に一覧があります。

    threshold は、criticallowwarninglowwarninghighcriticalhigh のいずれかです。

    値は数字で、通常は百分率値を表します。


例 6–5 サーバーグループのファイルシステム使用に関する複数しきい値の設定

この例では、grp3 というグループ名を持つプロビジョニング可能なサーバーのグループのファイルシステム使用の warninghigh しきい値を 75%、criticalhigh しきい値を 87% に設定しています。


N1-ok> set group grp3 threshold fsusage.pctused warninghigh=75 criticalhigh=87