Sun N1 System Manager 1.0 管理ガイド

監視の概要

Sun N1 System Manager ソフトウェアでの監視では、特定の管理対象オブジェクト内の特定の「属性」に対する変化を追跡することができます。属性は、Sun N1 System Manager ソフトウェアによってそのデータが取得され、配信される監視対象要素です。属性には、たとえば、待ち状態のプロセスの平均個数や使用メモリーの割合などがあります。属性については、付録 A 「ハードウェアおよび OS リソースの属性」に一覧があります。管理対象のオブジェクトは、サーバーのハードウェア要素やオペレーティングシステム、ファイルシステム、ネットワークなどです。

属性は、大きく次の 3 つのカテゴリに分類できます。

サーバーまたはサーバーグループについては、ハードウェアの健全性とオペレーティングシステム、ネットワーク接続のすべての監視対象になります。ハードウェア健全性の監視については、「ハードウェア健全性の監視」を参照してください。OS リソースの使用の監視については、「OS リソースの使用の監視」を参照してください。ネットワークの到達可能性の監視については、「ネットワークの到達可能性監視」を参照してください。

監視のための比較および検査はすべて N1 System Manager によって行われます。プロビジョニング可能なサーバーは、データへのアクセスにのみ使用されます。

Sun N1 System Manager には、データ読み出しに使用される SNMP エージェントが用意されています。このエージェントは、Sun Management Center ソフトウェアの SNMP エージェントに基づいています。エージェントは、Sun N1 System Manager による管理対象のサーバーにオペレーティングシステムを配備すると配備されます。

次のコマンドを実行すると、検出されたすべてのサーバーに対して管理エージェントが配備されます。


N1-ok> set server servername agentip agentip agentssh username/password

このコマンドの詳細は、「set server」を参照してください。「OS 管理エージェントをインストールする」に、さらに詳しい説明があります。管理エージェントの配備は、OS リソースの使用の監視に重要ですが、ハードウェアの健全性やネットワークの到達可能性の監視には重要ではありません。たとえば、プロビジョニング可能なサーバーの監視対象のファイルシステムデータは、そのプロビジョニング可能なサーバーにオペレーティングシステムが配備され、かつ管理エージェントが、上記のように agentip エージェント初期化キーワードを付けた set server コマンドで初期化されていないかぎり、取得できません。

管理エージェントは、監視のために CPU 統計データやファイルシステム、メモリーデータを定期的に読み出すために使用されます。

監視は、監視対象の各サーバーまたは各サーバーグループの「イベント」伝送機能と接続されています。イベントは、属性に関係する特定の状態が発生すると生成されます。イベントおよびその発生タイミングについては、「イベントログエントリの管理」を参照してください。

サーバーに対する監視が有効な場合は、イベントのたびに、そのイベントに関する通知が N1 System Manager から送信されます。サーバーに対する監視が無効の場合、そのサーバーに対する監視イベントは生成されません。ライフサイクルイベントは、監視が無効でも引き続き生成されます。ライフサイクルイベントには、サーバー検出、変更、削除、グループ作成などがあります。この種のイベントの通知を要求していた場合は、監視が無効でも引き続き通知を受けることができます。

ハードウェア健全性の監視

検出されたサーバーのハードウェア健全性が監視されます。ハードウェアにあるセンサーを使用して、温度や電圧、ファン速度が監視されます。関係するハードウェアの詳細は、『Sun N1 System Manager 1.0 インストールおよび構成ガイド』「Sun N1 System Manager の接続情報」を参照してください。センサーのデータは、IPMI を使用し、サービスプロセッサから取得されます。コマンド行から動的にデータを取得することができます。

監視できるサーバーのハードウェア要素は次のとおりです。

これらセンサーについては、付録 A 「ハードウェアおよび OS リソースの属性」に詳細な一覧があります。

show server コマンドでフィルタを使用し、すべてのサーバーに関するハードウェア健全性情報だけを表示することができます。


N1-ok> show server health health

health フィルタとして使用可能な値の詳細は、「パラメータ」を参照してください。

コマンドの詳細は、「show server」を参照してください。

OS リソースの使用の監視

OS リソースの使用は、N1 System Manager によって監視されます。agentip キーワードを付けた set server コマンドで agentssh キーワードを使用して、 ssh 経由で監視対象サーバーのオペレーティングシステムへのアクセス資格を指定します。詳細は、「OS 管理エージェントをインストールする」を参照してください。この指定は、OS リソースの使用の監視に重要ですが、ハードウェアの健全性やネットワークの到達可能性の監視には重要ではありません。

この仕組みでのオペレーティングシステムへのアクセスは、主としてリモートコマンド実行機能に必要です。この機構でのオペレーティングシステムへのアクセスは、管理エージェントを使って OS リソースの使用監視のデータを読み出す手段になります。

属性データは、 ssh および SNMP を使ってサーバーのオペレーティングシステムから取得されます。メモリーやスワップ使用、ファイルシステム関係のデータ同様、中央演算処理装置 (CPU) に関係する統計も提供されます。監視の目的上、システム負荷、メモリー使用、スワップ使用データは、次のように分類できます。

これらの属性については、付録 A 「ハードウェアおよび OS リソースの属性」に一覧があります。

show server コマンドでフィルタを使用し、すべてのサーバーに関する OS リソースの使用情報だけを表示することができます。


N1-ok> show server utilization utilization

N1-ok> show server utilization unreachable

utilization として使用可能な値の詳細は、「パラメータ」を参照してください。

コマンドの詳細は、「show server」を参照してください。

OS リソースの使用属性の監視では、monitoring.properties 構成ファイルを作成、編集することによって、N1 System Manager が管理するすべてのサーバーに対するデフォルトしきい値を変更することができます。詳細は、「デフォルトしきい値の管理」を参照してください。

また、コマンド行で set コマンドを使用し、監視対象の個別サーバーまたは個別サーバーグループに対して特定のしきい値を設定することもできます。詳細は、「しきい値の設定」を参照してください。

特定の属性の値を監視する必要がない場合は、その属性を監視するためのしきい値を無効にすることができます。これで、不要なアラームを防ぐことができます。例 6–4 は、この無効化を行う方法を示しています。

ネットワークの到達可能性監視

デフォルトでは、N1 System Manager は、プロビジョニング可能なサーバーのすべての管理インタフェースおよびすべてのプラットフォームインタフェースを監視します。プラットフォームインタフェースには、eth0 などのサービスプロセッサの管理インタフェースや、eth1 あるいは eth2 などのデータネットワークインタフェースがあります。

管理インタフェースデータは、IPMI を使って取得されます。プラットフォームの OS インタフェースデータは、ssh および SNMP を使って取得されます。到達可能性は、インタフェースの IP アドレスに ICMP で ping アクセスすることによって検査されます。

すべてのネットワークインタフェースの到達可能性が定期的に検査されます。このポーリング間隔の設定は変更できます。ポーリング間隔の設定については、「ポーリング間隔」を参照してください。ネットワークの到達可能性の監視は、IP アドレスに基づいています。監視対象の IP アドレスが到達不可能な場合は、イベントが生成されます。

show server コマンドに監視情報を表示する適切なパラメータを付けることによって、すべてのサーバーに関する情報を絞り込むことができます。詳細は、「show server」を参照してください。