Sun N1 System Manager 1.0 管理ガイド

第 6 章サーバーの監視

この章では、N1 System Manager における監視とは何かを説明するとともに、N1 System Manager を構成しているサーバーを監視する方法を説明します。また、監視を有効および無効にする手順、コマンド行を使って監視しきい値およびポーリング間隔を管理する手順についても説明します。

一部の手順は、ブラウザインタフェースを使って行うこともできます。それらの手順は、Sun N1 System Manager ブラウザインタフェースのヘルプに記載されています。

具体的には、この章では次の作業について説明します。

監視の概要

Sun N1 System Manager ソフトウェアでの監視では、特定の管理対象オブジェクト内の特定の「属性」に対する変化を追跡することができます。属性は、Sun N1 System Manager ソフトウェアによってそのデータが取得され、配信される監視対象要素です。属性には、たとえば、待ち状態のプロセスの平均個数や使用メモリーの割合などがあります。属性については、付録 A 「ハードウェアおよび OS リソースの属性」に一覧があります。管理対象のオブジェクトは、サーバーのハードウェア要素やオペレーティングシステム、ファイルシステム、ネットワークなどです。

属性は、大きく次の 3 つのカテゴリに分類できます。

ハードウェアの健全性属性
OS リソースの使用属性
ネットワーク接続 (到達可能性)

サーバーまたはサーバーグループについては、ハードウェアの健全性とオペレーティングシステム、ネットワーク接続のすべての監視対象になります。ハードウェア健全性の監視については、「ハードウェア健全性の監視」を参照してください。OS リソースの使用の監視については、「OS リソースの使用の監視」を参照してください。ネットワークの到達可能性の監視については、「ネットワークの到達可能性監視」を参照してください。

監視のための比較および検査はすべて N1 System Manager によって行われます。プロビジョニング可能なサーバーは、データへのアクセスにのみ使用されます。

Sun N1 System Manager には、データ読み出しに使用される SNMP エージェントが用意されています。このエージェントは、Sun Management Center ソフトウェアの SNMP エージェントに基づいています。エージェントは、Sun N1 System Manager による管理対象のサーバーにオペレーティングシステムを配備すると配備されます。

次のコマンドを実行すると、検出されたすべてのサーバーに対して管理エージェントが配備されます。

N1-ok> set server servername agentip agentip agentssh username/password

このコマンドの詳細は、「set server」を参照してください。「OS 管理エージェントをインストールする」に、さらに詳しい説明があります。管理エージェントの配備は、OS リソースの使用の監視に重要ですが、ハードウェアの健全性やネットワークの到達可能性の監視には重要ではありません。たとえば、プロビジョニング可能なサーバーの監視対象のファイルシステムデータは、そのプロビジョニング可能なサーバーにオペレーティングシステムが配備され、かつ管理エージェントが、上記のように agentip エージェント初期化キーワードを付けた set server コマンドで初期化されていないかぎり、取得できません。

管理エージェントは、監視のために CPU 統計データやファイルシステム、メモリーデータを定期的に読み出すために使用されます。

監視は、監視対象の各サーバーまたは各サーバーグループの「イベント」伝送機能と接続されています。イベントは、属性に関係する特定の状態が発生すると生成されます。イベントおよびその発生タイミングについては、「イベントログエントリの管理」を参照してください。

サーバーに対する監視が有効な場合は、イベントのたびに、そのイベントに関する通知が N1 System Manager から送信されます。サーバーに対する監視が無効の場合、そのサーバーに対する監視イベントは生成されません。ライフサイクルイベントは、監視が無効でも引き続き生成されます。ライフサイクルイベントには、サーバー検出、変更、削除、グループ作成などがあります。この種のイベントの通知を要求していた場合は、監視が無効でも引き続き通知を受けることができます。

ハードウェア健全性の監視

検出されたサーバーのハードウェア健全性が監視されます。ハードウェアにあるセンサーを使用して、温度や電圧、ファン速度が監視されます。関係するハードウェアの詳細は、『Sun N1 System Manager 1.0 インストールおよび構成ガイド』の「Sun N1 System Manager の接続情報」を参照してください。センサーのデータは、IPMI を使用し、サービスプロセッサから取得されます。コマンド行から動的にデータを取得することができます。

監視できるサーバーのハードウェア要素は次のとおりです。

CPU の温度
周囲温度
ファン速度 (1 分あたり回転数)
電圧
LED

これらセンサーについては、付録 A 「ハードウェアおよび OS リソースの属性」に詳細な一覧があります。

show server コマンドでフィルタを使用し、すべてのサーバーに関するハードウェア健全性情報だけを表示することができます。

N1-ok> show server health health

health フィルタとして使用可能な値の詳細は、「パラメータ」を参照してください。

コマンドの詳細は、「show server」を参照してください。

OS リソースの使用の監視

OS リソースの使用は、N1 System Manager によって監視されます。agentip キーワードを付けた set server コマンドで agentssh キーワードを使用して、 ssh 経由で監視対象サーバーのオペレーティングシステムへのアクセス資格を指定します。詳細は、「OS 管理エージェントをインストールする」を参照してください。この指定は、OS リソースの使用の監視に重要ですが、ハードウェアの健全性やネットワークの到達可能性の監視には重要ではありません。

この仕組みでのオペレーティングシステムへのアクセスは、主としてリモートコマンド実行機能に必要です。この機構でのオペレーティングシステムへのアクセスは、管理エージェントを使って OS リソースの使用監視のデータを読み出す手段になります。

属性データは、 ssh および SNMP を使ってサーバーのオペレーティングシステムから取得されます。メモリーやスワップ使用、ファイルシステム関係のデータ同様、中央演算処理装置 (CPU) に関係する統計も提供されます。監視の目的上、システム負荷、メモリー使用、スワップ使用データは、次のように分類できます。

システム使用 (システムアイドル時間など)
システム負荷 (待ち状態が 1 分、5 分、15 分を超えるプロセスの平均個数で表現)
メモリー使用とメモリー未使用統計 (メガバイトおよび割合で表現)
物理負荷統計
使用スワップ空間および使用可能なスワップ空間 (M バイトおよび割合で表現)
使用ファイルシステムおよび使用可能な空間 (割合で表現)

これらの属性については、付録 A 「ハードウェアおよび OS リソースの属性」に一覧があります。

show server コマンドでフィルタを使用し、すべてのサーバーに関する OS リソースの使用情報だけを表示することができます。

N1-ok> show server utilization utilization

N1-ok> show server utilization unreachable

utilization として使用可能な値の詳細は、「パラメータ」を参照してください。

コマンドの詳細は、「show server」を参照してください。

OS リソースの使用属性の監視では、monitoring.properties 構成ファイルを作成、編集することによって、N1 System Manager が管理するすべてのサーバーに対するデフォルトしきい値を変更することができます。詳細は、「デフォルトしきい値の管理」を参照してください。

また、コマンド行で set コマンドを使用し、監視対象の個別サーバーまたは個別サーバーグループに対して特定のしきい値を設定することもできます。詳細は、「しきい値の設定」を参照してください。

特定の属性の値を監視する必要がない場合は、その属性を監視するためのしきい値を無効にすることができます。これで、不要なアラームを防ぐことができます。例 6–4 は、この無効化を行う方法を示しています。

ネットワークの到達可能性監視

デフォルトでは、N1 System Manager は、プロビジョニング可能なサーバーのすべての管理インタフェースおよびすべてのプラットフォームインタフェースを監視します。プラットフォームインタフェースには、eth0 などのサービスプロセッサの管理インタフェースや、eth1 あるいは eth2 などのデータネットワークインタフェースがあります。

管理インタフェースデータは、IPMI を使って取得されます。プラットフォームの OS インタフェースデータは、ssh および SNMP を使って取得されます。到達可能性は、インタフェースの IP アドレスに ICMP で ping アクセスすることによって検査されます。

すべてのネットワークインタフェースの到達可能性が定期的に検査されます。このポーリング間隔の設定は変更できます。ポーリング間隔の設定については、「ポーリング間隔」を参照してください。ネットワークの到達可能性の監視は、IP アドレスに基づいています。監視対象の IP アドレスが到達不可能な場合は、イベントが生成されます。

show server コマンドに監視情報を表示する適切なパラメータを付けることによって、すべてのサーバーに関する情報を絞り込むことができます。詳細は、「show server」を参照してください。

監視の有効化

監視可能なオブジェクトを作成するには、set server コマンドを使用します。

N1-ok> set server servername agentip agentip agentssh username/password

agentip サブコマンドの詳細は、「OS 管理エージェントをインストールする」を参照してください。この指定は、OS リソースの使用の監視に重要ですが、ハードウェアの健全性やネットワークの到達可能性の監視には重要ではありません。

デフォルトでは、Sun N1 System Manager での監視は、検出されたすべてのサーバーおよび初期化済みのすべてのオペレーティングシステムに対して有効になります。

ハードウェア監視のデフォルトステータス: デフォルトでは、サーバーまたはその他ハードウェアが検出されると、そのサーバーまたはハードウェアの監視が有効になります。サーバーを監視するには、そのサーバーが検出されていて、正しく N1 System Manager に登録されている必要があります。この作業については、「N1 System Manager へのサーバーの追加」を参照してください。デフォルトでは、管理サーバーのすべてに対してハードウェアセンサーの監視が有効になります。サーバーが削除され、再検出された場合は、そのサーバーに関する、監視のためのすべての状態が失われます。これは、サーバーを削除したときにそのサーバーに対して監視が有効であったかどうかに関係ありません。デフォルトでは、サーバーが再び検出されると、監視は true に設定されます。サーバーの検出の詳細は、「新しいサーバーを検出する」を参照してください。
OS リソースの使用監視のデフォルトステータス: デフォルトでは、OS リソースの使用の監視は無効です。プロビジョニング可能なサーバーに OS が正しくプロビジョニングされ、agentip を指定した set server コマンドを使って N1 System Manager 管理エージェントが初期化されると、OS リソースの使用監視が有効になります。OS のプロビジョニングは、N1 System Manager または外部 OS インストールで行うことができます。

特定の OS リソースの使用属性の値を監視する必要がない場合は、その属性を監視するためのしきい値を無効にすることができます。この場合、他の OS リソースの使用属性は引き続き監視することができます。これで、不要なアラームを防ぐことができます。例 6–4 は、この方法を示しています。しきい値の全般的な情報については、「監視しきい値」を参照してください。
ネットワークの到達可能性監視のデフォルトステータス: デフォルトでは、プロビジョニング可能なサーバーの管理インタフェースが検出されると、そのインタフェースの監視が有効になります。デフォルトでは、管理エージェントが初期化されると、他のインタフェースの監視も有効になります。

サーバーを監視する

ここでは、コマンド行を使用して、サーバーまたはサーバーグループのハードウェア健全性とオペレーティングシステムのリソース使用、ネットワークの到達可能性の監視を有効にする手順を説明します。

始める前に

server という名前のサーバー上の管理エージェント IP およびセキュリティ資格を有効にするには、「OS 管理エージェントをインストールする」の説明に従って、そのサーバーに管理エージェントをインストールします。

手順

N1 System Manager にログインします。

詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

monitored 属性を true に設定した set server コマンドを使用します。
N1-ok> set server server monitored=true
この例の server は、監視するプロビジョニング可能なサーバーの名前です。

サーバーの詳細を表示します。
N1-ok> show server server

サーバーグループを監視する

始める前に

server という名前のサーバー上の管理エージェント IP およびセキュリティ資格を有効にするには、「OS 管理エージェントをインストールする」の説明に従って、そのサーバーに管理エージェントをインストールします。この指定は、OS リソースの使用の監視に重要ですが、ハードウェアの健全性やネットワークの到達可能性の監視には重要ではありません。

手順

N1 System Manager にログインします。

詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

monitored 属性を true に設定した set group コマンドを使用します。
N1-ok> set group group monitored=true
このコマンドは、指定された名前のグループのサーバーに対して実行されます。詳細は、「set group」を参照してください。この例の group は、監視するプロビジョニング可能なサーバーのグループの名前です。

サーバーグループの詳細を表示して、グループ内の各サーバーに対して監視が有効になっていることを確認します。
N1-ok> show group group

グループ内の個別サーバーの特定の監視詳細を表示します。
N1-ok> show server server
詳細な監視情報が出力に表示されます。表示される情報は、ハードウェア健全性、OS リソースの使用、ネットワークの到達可能性の監視のポーリング間隔およびしきい値です。ポーリング間隔については、「ポーリング間隔」で説明しています。監視しきい値については、「監視しきい値」で説明しています。

サーバーの監視を無効にする

保守作業を行う場合は、ハードウェアコンポーネントの監視を無効にして、イベントが生成されないようにすることができます。

手順

N1 System Manager にログインします。

詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

monitored 属性を false に設定した set server コマンドを使用します。
N1-ok> set server server monitored=false
この例の server は、監視するプロビジョニング可能なサーバーの名前です。このコマンドを実行すると、指定したサーバーの監視が無効になります。サーバーの監視を無効にすると、そのサーバーに関する属性のしきい値違反があっても、イベントは生成されません。

サーバーの詳細を表示します。
N1-ok> show server server
監視が無効であることが出力に示されます。

特定の OS リソースの使用属性の値を監視する必要がない場合は、その属性を監視するためのしきい値を無効にすることができます。この場合、他の OS リソースの使用属性は引き続き監視することができます。これで、不要なアラームを防ぐことができます。例 6–4 は、この方法を示しています。しきい値の全般的な情報については、「監視しきい値」を参照してください。

サーバーグループの監視を無効にする

ここでは、サーバーグループの監視を無効にする手順を説明します。保守作業を行う場合は、ハードウェアコンポーネントの監視を無効にして、イベントが生成されないようにすることができます。

注 –

サーバーの監視を無効にすると、そのサーバーのハードウェア健全性監視、OS 監視、ネットワークの到達可能性監視のすべてが無効になります。

手順

N1 System Manager にログインします。

詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

monitored 属性を false に設定した set group コマンドを使用します。
N1-ok> set group group monitored=false
このコマンドは、指定された名前のグループのサーバーに対して実行されます。詳細は、「set group」を参照してください。この例の group は、監視するプロビジョニング可能なサーバーのグループの名前です。このコマンドを実行すると、グループ内のすべてのサーバーの監視が無効になります。サーバーグループの監視を無効にすると、そのグループ内のサーバーに関する属性のしきい値違反があっても、イベントは生成されません。

サーバーグループの詳細を表示して、グループ内のすべてのサーバーに対して監視が無効になっていることを確認します。
N1-ok> show group group

監視しきい値

監視対象の属性の値は、しきい値と比較されます。下限および上限しきい値を定義し、それらの値を設定することができます。

属性データは、定期的にしきい値と比較されます。このポーリング間隔の設定は変更できます。ポーリング間隔の詳細は、「ポーリング間隔」を参照してください。

監視対象属性がポーリングされ、その属性値がデフォルトまたはユーザー定義のしきい値安全範囲外の場合は、イベントが生成され、ステータスが発行されます。属性値が下限しきい値を下回るか、上限しきい値を上回ると、そのしきい値の重要度に応じて、イベントが生成され、「回復不能」か「重大」、または「警告」いずれかのステータスが示されます。どちらでもない場合は、属性値が取得できることを前提として、監視属性のステータスは「正常」になります。

属性値そのものが取得できない場合は、イベントが生成され、監視対象の属性のステータスが「不明」であることが示されます。

ステータスの「回復不能」、「重大」、および「警告」については、「パラメータ」で説明します。

監視対象の属性の値が「警告上限」しきい値を上回った場合は、「警告上限」のステータスが発行されます。この値が上昇し続けて、「重大上限」しきい値を過ぎると、「重大上限」のステータスが発行されます。値がさらに上昇し続けて、「回復不能上限」しきい値を上回ると、「回復不能上限」のステータスが発行されます。

逆に値が下がって安全範囲に戻った場合は、値が「警告上限」しきい値より低くなり、安全範囲に戻るまで、イベントは生成されません。安全範囲に戻ると、イベントが生成され、ステータスとして「正常」が示されます。

監視対象の属性の値が「警告下限」しきい値を下回った場合は、「警告下限」のステータスが発行されます。この値が下がり続けて、「重大下限」しきい値を過ぎると、「重大下限」のステータスが発行されます。値がさらに下がり続けて、「回復不能下限」しきい値を下回ると、「回復不能下限」のステータスが発行されます。

逆に値が上昇して安全範囲に戻った場合は、値が「警告下限」しきい値より高くなり、安全範囲に戻るまで、イベントは生成されません。安全範囲に戻ると、イベントが生成され、ステータスとして「正常」が示されます。

OS リソースの使用属性のしきい値は、コマンド行から設定できます。この作業については、「しきい値の設定」で説明します。割合を測定するしきい値の場合、有効な範囲は 0% 〜 100％です。この範囲外のしきい値を設定しようとすると、エラーになります。割合を測定しない属性の場合、その値は、システム内のプロセッサ数と導入先の使用特性に依存します。

ある程度の使用期間が経過すると、OS リソースの使用属性について、実際にどのような値を設定すべきかが判明してきます。イベントの生成、およびポケットベルまたは電子メールアドレスへの通知の送信に関して、本当に妥当なレベルまたは値に近いものが判明したら、しきい値を調整することができます。たとえば、特定の属性が「警告上限」しきい値レベルに達するたびに通知を受けるようにすることができます。導入先で特に重要な属性の場合は、「警告上限」しきい値レベルを小さい割合値に設定して、できるだけ早期に値の上昇が分かるようにすることができます。

サーバーのしきい値を取得する

始める前に

手順

N1 System Manager にログインします。

詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

show server コマンドを入力します。
N1-ok> show server server
この例の server は、しきい値を読み出すプロビジョニング可能なサーバーの名前です。

サーバーのハードウェア健全性、OS リソースの使用、ネットワークの到達可能性などの詳細な監視しきい値情報が出力に表示されます。具体的な値が設定されていない場合は、デフォルト値が表示されます。

詳細は、「show server」を参照してください。

デフォルトしきい値の管理

しきい値のデフォルト値は、monitoring.properties 構成ファイルを編集することによって変更できます。monitoring.properties 構成ファイルが存在しない場合は、作成して、/etc/opt/sun/n1gc/monitoring.properties に保存してください。デフォルトでは、インストール時にこのファイルは作成されません。

注 –

今回のバージョンの Sun N1 System Manager では、ハードウェアの健全性属性のしきい値の設定および変更はサポートされていません。

N1 System Manager ソフトウェアでは、一部の OS リソース使用属性について、工場出荷時のデフォルトしきい値が用意されています。これらの値は、百分率値で表されています。表 6–1 は、OS リソースの使用属性のデフォルト値の一覧です。

表 6–1 OS リソースの使用属性のデフォルトしきい値の出荷時設定


属性名	説明	デフォルトしきい値	デフォルトしきい値
`cpustats.pctusage`	全体の CPU 使用率	`warninghigh` 80%	`criticalhigh` 90%
`cpustats.pctidle`	全体の CPU アイドル率	`warninglow` 20%	`criticallow` 10%
`memusage.pctmemused`	メモリーの使用率	`warninghigh` 80%	`criticalhigh` 90%
`memusage.pctmemfree`	メモリーの未使用率	`warninglow` 20%	`criticallow` 10%
`memusage.pctswapused`	スワップ空間の使用率	`warninghigh` 80%	`criticalhigh` 90%
`fsusage.pctused`	ファイルシステム空間の使用率	`warninghigh` 80%	`criticalhigh` 90%

OS リソースの使用属性については、付録 A 「ハードウェアおよび OS リソースの属性」の全一覧にまとめています。

monitoring.properties 構成ファイル内の表 6–1 に示す属性のしきい値を変更すると、対応するしきい値の出荷時設定デフォルト値が上書きされます。

monitoring.properties 構成ファイルは管理サーバーにのみ保存し、プロビジョニング可能なサーバーには保存しないでください。

monitoring.properties 構成ファイルを変更するか、エントリを追加すると、N1 System Manager によって管理されているすべてのプロビジョニング可能なサーバーに影響します。

個々のしきい値は、「しきい値の設定」で説明している手順に従ってコマンド行で設定することができます。

monitoring.properties 構成ファイルに手動で監視対象項目のデフォルト値を追加することによってデフォルト値を変更すると、コマンド行から監視対象の属性の値が個別に設定されているサーバーを除くすべてのプロビジョニング可能なサーバーに、その変更後のデフォルト値が適用されます。

注 –

monitoring.properties ファイルに対する変更を有効にするために、管理サーバーや監視対象のプロビジョニング可能なサーバーを再起動する必要はありません。

百分率で表されるハードウェアの健全性の監視対象属性は、コマンド行から変更することも、また monitoring.properties ファイルを編集することによって変更することもできます。

サーバーのデフォルトしきい値を変更する

デフォルトしきい値を変更するには、/etc/opt/sun/n1gc/monitoring.properties ファイルをエディタで編集します。変更できるのは、OS リソースの使用属性に関係するデフォルトしきい値だけです。ハードウェアの健全性属性のデフォルトしきい値は変更できません。

始める前に

手順

エディタで /etc/opt/sun/n1gc/monitoring.properties ファイルを開きます。

このファイルが存在しない場合は、作成してください。

monitoring.properties ファイル内のデフォルトしきい値を定義している行を変更するか、追加します。

threshold. attribute.threshold= value

この構文では、threshold キーワードの後に、しきい値を設定する attribute を続ける必要があります。attribute は、OS リソースの使用属性です。OS リソースの使用属性については、「OS リソースの使用の監視」で説明しています。

threshold は、criticallow か warninglow、 warninghigh、criticalhigh のいずれかです。

値は数字で、通常は百分率値を表します。

ファイルを保存します。

変更を有効にするために、管理サーバーおよびプロビジョニング可能なサーバーを再起動する必要はありません。これで、N1 System Manager が管理するすべてのサーバーに変更後のデフォルトしきい値が適用されます。

例 6–1 ファイルシステム使用のデフォルトしきい値の変更

この例では、ファイルシステム使用のデフォルトの criticalhigh しきい値を最大ファイルシステム使用量の 75% に変更します。/etc/opt/sun/n1gc/monitoring.properties ファイルに次の行を追加するか、既存の行を変更します。

threshold.fsusage.pctused.criticalhigh=75

「しきい値の設定」で説明にしたがってコマンド行からset コマンドを使い、個別にしきい値の値を設定していないかぎり、この値はすべてのプロビジョニング可能なサーバーに適用されます。

しきい値は無効にすることができます。この方法は、例 6–4 で示します。

しきい値の設定

個別サーバーに監視対象オブジェクトのしきい値を設定することができます。コマンド行から監視対象オブジェクトの属性のしきい値を設定すると、該当するオブジェクトのその属性に関するしきい値の出荷時設定が無効になります。また、該当するオブジェクトのその属性に関する、monitoring.properties 内のすべてのエントリも無効になります。

サーバーに対するしきい値を設定する

始める前に

手順

N1 System Manager にログインします。

詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

threshold 属性を付けて set server コマンドを入力します。
N1-ok> set server server threshold attribute threshold=value
サーバーの複数しきい値を設定する場合は、次の構文を使用します。
N1-ok> set server server threshold attribute threshold=value threshold=value
この構文では、threshold キーワードの後に、しきい値を設定する attribute を続ける必要があります。attribute は、OS リソースの使用属性です。OS リソースの使用属性については、「OS リソースの使用の監視」で説明しています。また、付録 A 「ハードウェアおよび OS リソースの属性」に一覧があります。

threshold は、criticallow か warninglow、warninghigh、criticalhigh のいずれかです。

値は数字で、通常は百分率値を表します。

例 6–2 サーバーの CPU 使用に関する複数しきい値の設定

この例では、serv1 という名前のプロビジョニング可能なサーバー上の CPU 使用 warninghigh しきい値を 53%、criticalhigh しきい値を 75% に設定しています。

N1-ok> set server serv1 threshold cpustats.pctusage warninghigh=53 criticalhigh=75

serv1 という名前のサーバーについては、これらの値が、管理サーバー上の monitoring.properties 構成ファイルに保存されているデフォルト値に優先します。

例 6–3 サーバーのファイルシステム使用に関する複数しきい値の設定

この例では、serv1 という名前のプロビジョニング可能なサーバー上のファイルシステム使用の warninghigh しきい値を 75%、 criticalhigh しきい値を 87% に設定しています。

N1-ok> set server serv1 threshold fsusage.pctused warninghigh=75 criticalhigh=87

例 6–4 サーバーのファイルシステム使用しきい値の削除

この例では、serv1 という名前のプロビジョニング可能なサーバーに設定されている warninghigh しきい値を削除しています。

N1-ok> set server serv1 threshold fsusage warninghigh=none

この場合は、このしきい値の該当する重要度の以前の設定値が削除されます。このしきい値の重要度値が、monitoring.properties 構成ファイルに保存されているデフォルトしきい値や、出荷時設定のデフォルト値 (この属性に存在する場合) に戻ることはありません。実際には、このサーバーのファイルシステム使用の warninghigh しきい値に関する監視は無効になります。

サーバーグループに対するしきい値を設定する

始める前に

手順

N1 System Manager にログインします。

詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

threshold 属性を付けて set group コマンドを入力します。
N1-ok> set group group threshold attribute threshold=value
サーバーグループの複数しきい値を変更する場合は、次の構文を使用します。
N1-ok> set group group threshold attribute threshold=value threshold=value
この構文では、threshold キーワードの後に、しきい値を設定する attribute を続ける必要があります。attribute は、OS リソースの使用属性です。OS リソースの使用属性については、「OS リソースの使用の監視」で説明しています。また、付録 A 「ハードウェアおよび OS リソースの属性」に一覧があります。

threshold は、criticallow か warninglow、warninghigh、criticalhigh のいずれかです。

値は数字で、通常は百分率値を表します。

例 6–5 サーバーグループのファイルシステム使用に関する複数しきい値の設定

この例では、grp3 というグループ名を持つプロビジョニング可能なサーバーのグループのファイルシステム使用の warninghigh しきい値を 75%、criticalhigh しきい値を 87% に設定しています。

N1-ok> set group grp3 threshold fsusage.pctused warninghigh=75 criticalhigh=87

ポーリング間隔

オブジェクトの監視とは、監視対象オブジェクトを定期的に検査、すなわち、ポーリングすることです。ポーリングの頻度は、ポーリング間隔で制御します。監視対象オブジェクトのポーリング間隔がどのぐらいが適切かは、監視対象のオブジェクトやその環境、監視対象のオブジェクトが置かれているパフォーマンス条件に関係しています。ファンなどのサーバーハードウェアオブジェクトなど、一部の監視対象オブジェクトについては、デフォルトのポーリング間隔が用意されています。デフォルトのポーリング間隔は、set コマンドを使って特定の間隔値が設定されていないすべてのサーバーおよびサーバーグループに適用されます。

ハードウェアの健全性や OS リソースの使用、ネットワークの到達可能性のポーリング間隔値は、monitoring.properties 構成ファイルを編集することによって変更できます。monitoring.properties 構成ファイルが存在しない場合は、作成して、/etc/opt/sun/n1gc/monitoring.properties に保存してください。デフォルトでは、インストール時に monitoring.properties は作成されません。

N1 System Manager ソフトウェアには、出荷時設定のデフォルトポーリング間隔が用意されています。これら値は秒単位で表します。出荷時設定のデフォルト値は、表 6–2 に示すとおりです。

表 6–2 デフォルトポーリング間隔の出荷時設定


監視対象	デフォルト値の出荷時設定
ハードウェアの健全性	120 秒
OS リソースの使用	120 秒
ネットワークの到達可能性	60 秒

monitoring.properties 構成ファイルを変更すると、ソフトウェアに用意されている出荷時設定のデフォルト値が上書きされます。デフォルト値は、表 6–2 に示すとおりです。

注 –

設定可能な最小デフォルトポーリング間隔は 60 秒です。

monitoring.properties 構成ファイルは管理サーバーにのみ存在し、プロビジョニング可能なサーバーには存在しません。monitoring.properties 構成ファイルを変更するか、エントリを追加すると、N1 System Manager によって管理されているすべてのプロビジョニング可能なサーバーに影響します。

monitoring.properties 内のデフォルトポーリング間隔は、コマンド行から特定のサーバーまたはサーバーグループに対して個別に値が設定されていないかぎり、すべてのサーバーに適用されます。「ポーリング間隔の設定」で説明しているように、個別のポーリング間隔は、set コマンドを使って設定します。

インストールして配備した後、ある程度の使用期間が経過すると、ハードウェアの健全性属性や OS リソースの使用属性をどのぐらいの頻度でポーリングすべきか、またネットワークの到達可能性をどのぐらいの頻度でポーリングする必要があるかが判明してきます。これらの優先順位は、N1 System Manager の構成によって、またイベントの重要性から見た優先順位によって異なります。ポーリング間隔を設定あるいはデフォルトポーリング間隔を変更する場合は、N1 System Manager ソフトウェアを使って管理するサーバー数を考慮してください。また、プロビジョニング可能なサーバーのアプリケーション負荷、予想アプリケーション負荷およびネットワークの能力も考慮してください。イベントに対する期待応答性も関係してきます。イベントの発生とともに速やかに対処できる場合は、より頻繁にポーリングを行うのが適切です。

サーバーのポーリング間隔値を取得する

手順

N1 System Manager にログインします。

詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

show server コマンドを入力します。
N1-ok> show server server
この例の server は、ポーリング間隔を読み出すプロビジョニング可能なサーバーの名前です。

サーバーのハードウェア健全性、OS のリソース使用、ネットワークの到達可能性などの詳細な監視ポーリング間隔情報が出力に表示されます。

コマンドの詳細は、「show server」を参照してください。

サーバーのデフォルトポーリング間隔を変更する

始める前に

手順

エディタで /etc/opt/sun/n1gc/monitoring.properties ファイルを開きます。

このファイルが存在しない場合は、作成してください。

monitoring.properties ファイル内のデフォルトポーリング間隔を定義している行を変更するか、追加します。

pollinginterval. monitor.value

この構文では、pollinginterval キーワードが必要です。

monitor は、hardwarehealth か osresources 、 network のいずれかです。

value は秒単位で、最小値は 60 です。

ファイルを保存します。

変更を有効にするために、管理サーバーおよびプロビジョニング可能なサーバーを再起動する必要はありません。これで、N1 System Manager が管理するすべてのサーバーに変更後のデフォルトポーリング間隔が適用されます。

例 6–6 デフォルト値の変更

この例では、ハードウェアの健全性の監視ポーリング間隔を 180 秒、OS リソースの使用監視ポーリング間隔を 175 秒、ネットワークの到達可能性監視ポーリング間隔を 160 秒に設定します。monitoring.properties 構成ファイルに次のエントリを入力します。

pollinginterval.hardwarehealth=180
pollinginterval.osresources=175
pollinginterval.network=160

ポーリング間隔の設定

ここでは、サーバーまたはサーバーグループにポーリング間隔を設定する手順を説明します。

サーバーのポーリング間隔を設定する

以下は、コマンド行からサーバーのポーリング間隔を設定する方法を示しています。この方法で値を設定すると、出荷時設定のデフォルト値や、monitoring.properties 構成ファイル (存在する場合) 内の値が上書きされます。

手順

N1 System Manager にログインします。

詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

monitor 属性を付けて set server コマンドを入力します。
set server server monitor monitor interval value
このコマンドは、指定された名前のサーバーに対して実行されます。ここでは、この名前は server と表記しています。このコマンドの詳細は、「set server」を参照してください。

monitor は、hardwarehealth か osresources、 network のいずれかです。

値は秒数を表す数字です。

注 –
設定可能な最小デフォルトポーリング間隔は 60 秒です。

例 6–7 サーバーのハードウェアの健全性監視ポーリング間隔の設定

この例では、serv1 という名前のプロビジョニング可能なサーバーのハードウェアの健全性監視ポーリング間隔を 280 秒に設定しています。

N1-ok> set server serv1 monitor hardwarehealth interval 280

サーバーグループのポーリング間隔を設定する

この方法で値を設定すると、出荷時設定のデフォルト値や、monitoring.properties 構成ファイル (存在する場合) 内の値が上書きされます。

手順

N1 System Manager にログインします。

詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

monitor 属性を付けて set group コマンドを入力します。
set group group monitor monitor interval value
このコマンドは、指定された名前のグループのサーバーに対して実行されます。ここでは、この名前は group と表記しています。詳細は、「set group」を参照してください。

monitor は、hardwarehealth か osresources、 network のいずれかです。

値は秒数を表す数字です。

注 –
設定可能な最小デフォルトポーリング間隔は 60 秒です。

例 6–8 サーバーグループのネットワークの到達可能性監視ポーリング間隔の設定

この例では、grp5 という名前のプロビジョニング可能なサーバーグループのネットワーク到達可能性監視ポーリング間隔を 250 秒に設定しています。

N1-ok> set group grp5 monitor network interval 250

第 6 章 サーバーの監視

監視の概要

ハードウェア健全性の監視

OS リソースの使用の監視

ネットワークの到達可能性監視

監視の有効化

サーバーを監視する

始める前に

手順

サーバーグループを監視する

始める前に

手順

サーバーの監視を無効にする

手順

サーバーグループの監視を無効にする

手順

監視しきい値

サーバーのしきい値を取得する

始める前に

手順

デフォルトしきい値の管理

サーバーのデフォルトしきい値を変更する

始める前に

手順

例 6–1 ファイルシステム使用のデフォルトしきい値の変更

しきい値の設定

サーバーに対するしきい値を設定する

始める前に

手順

例 6–2 サーバーの CPU 使用に関する複数しきい値の設定

例 6–3 サーバーのファイルシステム使用に関する複数しきい値の設定

例 6–4 サーバーのファイルシステム使用しきい値の削除

サーバーグループに対するしきい値を設定する

始める前に

手順

例 6–5 サーバーグループのファイルシステム使用に関する複数しきい値の設定

ポーリング間隔

サーバーのポーリング間隔値を取得する

手順

サーバーのデフォルトポーリング間隔を変更する

始める前に

手順

例 6–6 デフォルト値の変更

ポーリング間隔の設定

サーバーのポーリング間隔を設定する

手順

例 6–7 サーバーのハードウェアの健全性監視ポーリング間隔の設定

サーバーグループのポーリング間隔を設定する

手順

例 6–8 サーバーグループのネットワークの到達可能性監視ポーリング間隔の設定

第 6 章サーバーの監視