add server feature コマンドに osmonitor と agentip の各キーワードを用いて、agentssh キーワードで、ssh 経由で監視対象サーバーのオペレーティングシステムへのアクセス資格を指定します。さらに詳細な情報については、「OS 監視機能を追加する」を参照してください。この手順は、OS の健全性の監視に重要ですが、ハードウェアの健全性やネットワークの到達可能性の監視には重要ではありません。
add server feature コマンドと osmonitor キーワードを使用して OS 監視機能を追加すると、OS 監視と基本管理の両方がサポートされ、デフォルトで監視が有効になります。その後、set server コマンドを使用すると、監視を無効および有効にできます。詳細は、「監視の有効化と無効化」を参照してください。
OS 監視機能では、基本管理機能による基本的な監視データをすべて監視できます。基本管理機能については、「基本管理 (基本の OS 監視)」を参照してください。それに加えて、OS 監視機能では、しきい値の監視がサポートされます。また、OS 監視機能では、コマンド行で set コマンドを使用し、監視対象の個別サーバーまたは個別サーバーグループに対して特定のしきい値を設定することもできます。詳細は、「しきい値の設定」を参照してください。しきい値については、「監視しきい値」を参照してください。
プラットフォーム OS インタフェースデータは、ssh および SNMP 経由で取得されます。すべての属性データは、ssh および SNMP によってサーバーのオペレーティングシステムから取得されます。
表 6–2 に、OS の健全性の属性の一覧を示します。表には、サポートされるしきい値も示します。
表 6–2 OS 健全性属性 (すべて)
属性名 |
説明 |
サポートされるしきい値 |
サポートされるしきい値 |
---|---|---|---|
cpustats.loadavg1min |
待ち状態が 1 分を超えるプロセスの平均個数で表したシステム負荷 |
warninghigh |
criticalhigh |
cpustats.loadavg5min |
待ち状態が 5 分を超えるプロセスの平均個数で表したシステム負荷 |
warninghigh |
criticalhigh |
cpustats.loadavg15min |
待ち状態が 15 分を超えるプロセスの平均個数で表したシステム負荷 |
warninghigh |
criticalhigh |
cpustats.pctusage |
CPU 全体の使用率 |
warninghigh |
criticalhigh |
cpustats.pctidle |
CPU アイドル率 |
warninglow |
criticallow |
memusage.pctmemused |
メモリーの使用率 |
warninghigh |
criticalhigh |
memusage.pctmemfree |
メモリーの未使用率 |
warninglow |
criticallow |
memusage.mbmemused |
M バイト単位の使用メモリー |
warninghigh |
criticalhigh |
memusage.mbmemfree |
M バイト単位の未使用メモリー |
warninglow |
criticallow |
memusage.kbswapused |
K バイト単位の使用中のスワップ空間 |
warninghigh |
criticalhigh |
memusage.mbswapfree |
M バイト単位の未使用スワップ空間 |
warninglow |
criticallow |
memusage.pctswapfree |
スワップ空間の未使用率 |
warninglow |
criticallow |
fsusage.pctused |
ファイルシステム空間の使用率 |
warninghigh |
criticalhigh |
fsusage.kbspacefree |
K バイト単位のシステムの未使用領域 |
warninghigh |
criticalhigh |
show server コマンドで、すべてのサーバーに関する OS 健全性の監視情報をフィルタで選別できます。
N1-ok> show server oshealth oshealth |
oshealth フィルタの有効な値については、『Sun N1 System Manager 1.3 コマンド行リファレンスマニュアル』の「show server」を参照してください。健全性状態によるサーバーの選別の詳細と図による説明は、「問題がある管理対象サーバーを表示する」を参照してください。
サーバーにはアクセス可能だが、監視機能のエージェントに SNMP ポート 61 で通信できない場合、OS リソースの健全性が「未知」になることがあります。サーバーにアクセスできない (たとえば待機モードになっているため) 場合は、OS リソースの健全性が「アクセス不能」になることがあります。「管理対象サーバーの状態の「アクセス不能」と「未知」の違いについて」も参照してください。
特定の属性の値を監視する必要がない場合は、その属性を監視するためのしきい値重要度を無効にすることができます。これで、不要なアラームを防ぐことができます。例 6–9 に、無効にする方法を示します。