Sun N1 System Manager ソフトウェアでの監視では、特定の管理対象オブジェクト内の特定の「属性」に対する変化を追跡することができます。属性は、Sun N1 System Manager ソフトウェアによってそのデータが取得され、配信される監視対象要素です。属性には、たとえば、待ち状態のプロセスの平均個数や使用メモリーの割合などがあります。属性については、付録 A 「ハードウェアおよび OS リソースの属性」に一覧があります。管理対象のオブジェクトは、サーバーのハードウェア要素やオペレーティングシステム、ファイルシステム、ネットワークなどです。
ハードウェアの健全性属性
OS リソースの使用属性
ネットワーク接続 (到達可能性)
サーバーまたはサーバーグループについては、ハードウェアの健全性とオペレーティングシステム、ネットワーク接続のすべての監視対象になります。ハードウェア健全性の監視については、「ハードウェア健全性の監視」を参照してください。OS リソースの使用の監視については、「OS リソースの使用の監視」を参照してください。ネットワークの到達可能性の監視については、「ネットワークの到達可能性監視」を参照してください。
監視のための比較および検査はすべて N1 System Manager によって行われます。プロビジョニング可能なサーバーは、データへのアクセスにのみ使用されます。
Sun N1 System Manager には、データ読み出しに使用される SNMP エージェントが用意されています。このエージェントは、Sun Management Center ソフトウェアの SNMP エージェントに基づいています。エージェントは、Sun N1 System Manager による管理対象のサーバーにオペレーティングシステムを配備すると配備されます。
次のコマンドを実行すると、検出されたすべてのサーバーに対して管理エージェントが配備されます。
N1-ok> set server servername agentip agentip agentssh username/password |
このコマンドの詳細は、「set server」を参照してください。「OS 管理エージェントをインストールする」に、さらに詳しい説明があります。管理エージェントの配備は、OS リソースの使用の監視に重要ですが、ハードウェアの健全性やネットワークの到達可能性の監視には重要ではありません。たとえば、プロビジョニング可能なサーバーの監視対象のファイルシステムデータは、そのプロビジョニング可能なサーバーにオペレーティングシステムが配備され、かつ管理エージェントが、上記のように agentip エージェント初期化キーワードを付けた set server コマンドで初期化されていないかぎり、取得できません。
管理エージェントは、監視のために CPU 統計データやファイルシステム、メモリーデータを定期的に読み出すために使用されます。
監視は、監視対象の各サーバーまたは各サーバーグループの「イベント」伝送機能と接続されています。イベントは、属性に関係する特定の状態が発生すると生成されます。イベントおよびその発生タイミングについては、「イベントログエントリの管理」を参照してください。
サーバーに対する監視が有効な場合は、イベントのたびに、そのイベントに関する通知が N1 System Manager から送信されます。サーバーに対する監視が無効の場合、そのサーバーに対する監視イベントは生成されません。ライフサイクルイベントは、監視が無効でも引き続き生成されます。ライフサイクルイベントには、サーバー検出、変更、削除、グループ作成などがあります。この種のイベントの通知を要求していた場合は、監視が無効でも引き続き通知を受けることができます。
検出されたサーバーのハードウェア健全性が監視されます。ハードウェアにあるセンサーを使用して、温度や電圧、ファン速度が監視されます。関係するハードウェアの詳細は、『Sun N1 System Manager 1.0 インストールおよび構成ガイド』の「Sun N1 System Manager の接続情報」を参照してください。センサーのデータは、IPMI を使用し、サービスプロセッサから取得されます。コマンド行から動的にデータを取得することができます。
監視できるサーバーのハードウェア要素は次のとおりです。
CPU の温度
周囲温度
ファン速度 (1 分あたり回転数)
電圧
LED
これらセンサーについては、付録 A 「ハードウェアおよび OS リソースの属性」に詳細な一覧があります。
show server コマンドでフィルタを使用し、すべてのサーバーに関するハードウェア健全性情報だけを表示することができます。
N1-ok> show server health health |
health フィルタとして使用可能な値の詳細は、「パラメータ」を参照してください。
コマンドの詳細は、「show server」を参照してください。
OS リソースの使用は、N1 System Manager によって監視されます。agentip キーワードを付けた set server コマンドで agentssh キーワードを使用して、 ssh 経由で監視対象サーバーのオペレーティングシステムへのアクセス資格を指定します。詳細は、「OS 管理エージェントをインストールする」を参照してください。この指定は、OS リソースの使用の監視に重要ですが、ハードウェアの健全性やネットワークの到達可能性の監視には重要ではありません。
この仕組みでのオペレーティングシステムへのアクセスは、主としてリモートコマンド実行機能に必要です。この機構でのオペレーティングシステムへのアクセスは、管理エージェントを使って OS リソースの使用監視のデータを読み出す手段になります。
属性データは、 ssh および SNMP を使ってサーバーのオペレーティングシステムから取得されます。メモリーやスワップ使用、ファイルシステム関係のデータ同様、中央演算処理装置 (CPU) に関係する統計も提供されます。監視の目的上、システム負荷、メモリー使用、スワップ使用データは、次のように分類できます。
システム使用 (システムアイドル時間など)
システム負荷 (待ち状態が 1 分、5 分、15 分を超えるプロセスの平均個数で表現)
メモリー使用とメモリー未使用統計 (メガバイトおよび割合で表現)
物理負荷統計
使用スワップ空間および使用可能なスワップ空間 (M バイトおよび割合で表現)
使用ファイルシステムおよび使用可能な空間 (割合で表現)
これらの属性については、付録 A 「ハードウェアおよび OS リソースの属性」に一覧があります。
show server コマンドでフィルタを使用し、すべてのサーバーに関する OS リソースの使用情報だけを表示することができます。
N1-ok> show server utilization utilization |
N1-ok> show server utilization unreachable |
utilization として使用可能な値の詳細は、「パラメータ」を参照してください。
コマンドの詳細は、「show server」を参照してください。
OS リソースの使用属性の監視では、monitoring.properties 構成ファイルを作成、編集することによって、N1 System Manager が管理するすべてのサーバーに対するデフォルトしきい値を変更することができます。詳細は、「デフォルトしきい値の管理」を参照してください。
また、コマンド行で set コマンドを使用し、監視対象の個別サーバーまたは個別サーバーグループに対して特定のしきい値を設定することもできます。詳細は、「しきい値の設定」を参照してください。
特定の属性の値を監視する必要がない場合は、その属性を監視するためのしきい値を無効にすることができます。これで、不要なアラームを防ぐことができます。例 6–4 は、この無効化を行う方法を示しています。
デフォルトでは、N1 System Manager は、プロビジョニング可能なサーバーのすべての管理インタフェースおよびすべてのプラットフォームインタフェースを監視します。プラットフォームインタフェースには、eth0 などのサービスプロセッサの管理インタフェースや、eth1 あるいは eth2 などのデータネットワークインタフェースがあります。
管理インタフェースデータは、IPMI を使って取得されます。プラットフォームの OS インタフェースデータは、ssh および SNMP を使って取得されます。到達可能性は、インタフェースの IP アドレスに ICMP で ping アクセスすることによって検査されます。
すべてのネットワークインタフェースの到達可能性が定期的に検査されます。このポーリング間隔の設定は変更できます。ポーリング間隔の設定については、「ポーリング間隔」を参照してください。ネットワークの到達可能性の監視は、IP アドレスに基づいています。監視対象の IP アドレスが到達不可能な場合は、イベントが生成されます。
show server コマンドに監視情報を表示する適切なパラメータを付けることによって、すべてのサーバーに関する情報を絞り込むことができます。詳細は、「show server」を参照してください。