Sun N1 System Manager 1.3 検出および管理マニュアル

OS の健全性の監視

OS の健全性は、N1 System Manager によって監視されます。

N1 System Manager では 2 つの異なるレベルで OS を監視できます。次のレベルがあります。

基本管理

この機能は、基本の OS 監視のサポートです。基本管理機能では、OS のアップデートとリモートコマンドの実行もサポートされます。詳細は、「基本管理 (基本の OS 監視)」を参照してください。

OS 完全監視

この機能は、基本の OS 監視、およびしきい値監視のサポートです。詳細は、「OS 完全監視 (しきい値を含む)」を参照してください。

OS 監視がサポートされているオペレーティングシステム

『Sun N1 System Manager 1.3 サイト計画の手引き』「管理可能なサーバーの要件」に示すオペレーティングシステムは、Microsoft Windows を除いてすべて N1 System Manager で監視できます。


注 –

このリリースでは、Microsoft Windows を実行している管理対象サーバーの OS 監視はできません。


Solaris オペレーティングシステムのサポートされているバージョン:

インストールするディストリビューショングループを選択するときは、「Entire Distribution plus OEM support」を選択する必要があります。ほかのディストリビューショングループには、N1 System Manager を使用して OS 監視をサポートするのに必要なパッケージが含まれません。

Red Hat Linux オペレーティングシステムのサポートされているバージョン:

インストールするディストリビューショングループを選択するときは、「Everything」を選択する必要があります。ほかのディストリビューショングループには、N1 System Manager を使用して OS 監視をサポートするのに必要なパッケージが含まれません。

SUSE オペレーティングシステムのサポートされているバージョン:

インストールするディストリビューショングループを選択するときは、「Default Installation」を選択する必要があります。ほかのディストリビューショングループには、N1 System Manager を使用して OS 監視をサポートするのに必要なパッケージが含まれません。

基本管理 (基本の OS 監視)

add server feature コマンドに basemanagementagentip の各キーワードを用いて基本管理のサポートを指定し、agentssh キーワードで、ssh 経由で監視対象サーバーのオペレーティングシステムへのアクセス資格を指定します。詳細は、「基本管理機能を追加する」を参照してください。この手順は、基本的な OS の健全性の監視に重要ですが、ハードウェアの健全性やネットワークの到達可能性の監視には重要ではありません。

basemanagement キーワードを指定した add server feature コマンドで基本管理機能を追加すると、基本管理がサポートされるようになり、デフォルトで監視が有効になります。その後、set server コマンドを使用すると、監視を無効および有効にできます。詳細は、「監視の有効化と無効化」を参照してください。

基本管理機能には、基本の OS 監視はありますが、しきい値の監視のサポートはありません。しきい値を監視するには、OS 完全監視機能を追加する必要があります。詳細は、「OS 完全監視 (しきい値を含む)」を参照してください。

基本管理機能では、メモリーやスワップ使用、ファイルシステム関係のデータ同様、中央演算処理装置 (CPU) に関係する統計も提供されます。監視の目的上、システム負荷、メモリー使用、スワップ使用データは、次のように分類できます。

これらの監視対象属性については、表 6–2 を参照してください。

基本管理機能では、リモートコマンドの実行もサポートされます。詳細は、「サーバーおよびサーバーグループでのリモートコマンドの実行」を参照してください。また、基本管理機能では、OS アップデートもサポートされます。OS アップデートについては、『Sun N1 System Manager 1.3 オペレーティングシステムプロビジョニングガイド』の第 5 章「パッケージ、パッチ、および RPM の管理」を参照してください。

OS 完全監視 (しきい値を含む)

add server feature コマンドに osmonitoragentip の各キーワードを用いて、agentssh キーワードで、ssh 経由で監視対象サーバーのオペレーティングシステムへのアクセス資格を指定します。さらに詳細な情報については、「OS 監視機能を追加する」を参照してください。この手順は、OS の健全性の監視に重要ですが、ハードウェアの健全性やネットワークの到達可能性の監視には重要ではありません。

add server feature コマンドと osmonitor キーワードを使用して OS 監視機能を追加すると、OS 監視と基本管理の両方がサポートされ、デフォルトで監視が有効になります。その後、set server コマンドを使用すると、監視を無効および有効にできます。詳細は、「監視の有効化と無効化」を参照してください。

OS 監視機能では、基本管理機能による基本的な監視データをすべて監視できます。基本管理機能については、「基本管理 (基本の OS 監視)」を参照してください。それに加えて、OS 監視機能では、しきい値の監視がサポートされます。また、OS 監視機能では、コマンド行で set コマンドを使用し、監視対象の個別サーバーまたは個別サーバーグループに対して特定のしきい値を設定することもできます。詳細は、「しきい値の設定」を参照してください。しきい値については、「監視しきい値」を参照してください。

プラットフォーム OS インタフェースデータは、ssh および SNMP 経由で取得されます。すべての属性データは、ssh および SNMP によってサーバーのオペレーティングシステムから取得されます。

表 6–2 に、OS の健全性の属性の一覧を示します。表には、サポートされるしきい値も示します。

表 6–2 OS 健全性属性 (すべて)

属性名 

説明 

サポートされるしきい値 

サポートされるしきい値 

cpustats.loadavg1min

待ち状態が 1 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh

criticalhigh

cpustats.loadavg5min

待ち状態が 5 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh

criticalhigh

cpustats.loadavg15min

待ち状態が 15 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh

criticalhigh

cpustats.pctusage

CPU 全体の使用率 

warninghigh

criticalhigh

cpustats.pctidle

CPU アイドル率 

warninglow

criticallow

memusage.pctmemused

メモリーの使用率 

warninghigh

criticalhigh

memusage.pctmemfree

メモリーの未使用率 

warninglow

criticallow

memusage.mbmemused

M バイト単位の使用メモリー 

warninghigh

criticalhigh

memusage.mbmemfree

M バイト単位の未使用メモリー 

warninglow

criticallow

memusage.kbswapused

K バイト単位の使用中のスワップ空間 

warninghigh

criticalhigh

memusage.mbswapfree

M バイト単位の未使用スワップ空間 

warninglow

criticallow

memusage.pctswapfree

スワップ空間の未使用率 

warninglow

criticallow

fsusage.pctused

ファイルシステム空間の使用率 

warninghigh

criticalhigh

fsusage.kbspacefree

K バイト単位のシステムの未使用領域 

warninghigh

criticalhigh

show server コマンドで、すべてのサーバーに関する OS 健全性の監視情報をフィルタで選別できます。


N1-ok> show server oshealth oshealth

oshealth フィルタの有効な値については、『Sun N1 System Manager 1.3 コマンド行リファレンスマニュアル』「show server」を参照してください。健全性状態によるサーバーの選別の詳細と図による説明は、「問題がある管理対象サーバーを表示する」を参照してください。

サーバーにはアクセス可能だが、監視機能のエージェントに SNMP ポート 61 で通信できない場合、OS リソースの健全性が「未知」になることがあります。サーバーにアクセスできない (たとえば待機モードになっているため) 場合は、OS リソースの健全性が「アクセス不能」になることがあります。「管理対象サーバーの状態の「アクセス不能」と「未知」の違いについて」も参照してください。

特定の属性の値を監視する必要がない場合は、その属性を監視するためのしきい値重要度を無効にすることができます。これで、不要なアラームを防ぐことができます。例 6–9 に、無効にする方法を示します。