Sun N1 System Manager 1.2 管理ガイド

第 5 章 サーバーの監視

この章の最初の節では、N1 System Manager における監視とは何かを説明するとともに、N1 System Manager を構成しているサーバーを監視する方法を説明します。この章では、監視の有効化と無効化の手順、および監視しきい値を管理する手順について、説明します。これらの手順ではコマンド行を使用します。

また、ジョブの管理、イベントログエントリ、通知の設定に関する情報も含まれています。

この章の内容は次のとおりです。

一部の手順は、ブラウザインタフェースを使って行うこともできます。それらの手順は、Sun N1 System Manager ブラウザインタフェースのヘルプに記載されています。

監視の概要

Sun N1 System Manager ソフトウェアでの監視では、特定の管理対象オブジェクト内の特定の「属性」に対する変化を追跡することができます。管理対象のオブジェクトは、サーバーのハードウェア要素やオペレーティングシステム、ファイルシステム、ネットワークなどです。属性とは、監視対象の要素であり、これに関するデータが N1 System Manager ソフトウェアによって取得され配信されます。属性には、たとえば、待ち状態のプロセスの平均個数および使用メモリーの割合などがあります。属性の一覧は、「ハードウェアセンサー属性」 および 表 5–2 にあります。

属性は 3 つの主要分野に関連付けられています。

サーバーの場合もサーバーグループの場合も、ハードウェアの健全性、オペレーティングシステムの健全性、およびネットワーク接続状態は、すべて管理サーバーによって監視されます。監視のための比較および検査はすべて N1 System Manager によって行われます。プロビジョニング可能なサーバーは、それ自身の健全性またはネットワーク到達可能性に関するデータのアクセスのみに使用されます。

監視は、監視対象の各サーバーまたは各サーバーグループの「イベント」伝送機能と接続されています。イベントは、属性に関係する特定の状態が発生すると生成されます。イベントおよびその発生タイミングについては、「イベントログエントリの管理」を参照してください。監視データは、ログファイルではなく N1 System Manager のデータベースにイベントとして格納されます。

サーバーに対する監視が有効な場合は、イベントのたびに、そのイベントに関する通知が N1 System Manager から送信されます。サーバーに対する監視が無効の場合、そのサーバーに対する監視イベントは生成されません。ライフサイクルイベントは、監視が無効でも引き続き生成されます。ライフサイクルイベントには、サーバー検出、サーバー変更や削除、サーバーグループ作成などがあります。この種のイベントの通知を要求していた場合は、監視が無効でも引き続きそのイベントの通知を受けることができます。

データの取得に使用される SNMPエージェントは、N1 System Manager ソフトウェアで提供されます。管理サーバーの N1 System Manager が Solaris OS で実行されている場合、このエージェントは Sun Management Center 3.5 ソフトウェアの SNMP エージェントに基づきます。管理サーバーの N1 System Manager が Linux で実行されている場合、このエージェントは Sun Management Center 3.6 Linux SNMP エージェントに基づきます。エージェントは、N1 System Manager による管理対象のサーバーにオペレーティングシステムを配備すると配備されます。N1 System Manager は、しきい値を超えた場合に SNMP エージェントで生成されるトラップを受動的に待ち受けます。SNMP エージェントで生成されたトラップが失われた場合、N1 System Manager はバックアップとして、ポーリングによる監視も行います。アクセス可能性監視とステータス監視です。アクセス可能性監視により、N1 System Manager が OS エージェントにアクセスできることが保証されます。ステータス監視では、SNMP エージェントの現在のステータスを定期的に取得し、ステータスが「良好」ではない場合に報告します。


注 –

監視機能のためのエージェントのデフォルト SNMP ポートはポート 161 です。このリリースでは、デフォルト以外のポート番号への変更がサポートされていません。


ハードウェア健全性の監視

検出されたサーバーのハードウェア健全性が監視されます。ハードウェアにあるセンサーを使用して、温度や電圧、ファン速度が監視されます。関連するハードウェアについての詳細は、『Sun N1 System Manager 1.2 サイト計画の手引き』「Sun N1 System Manager の接続情報」を参照してください。

SPARC デバイスのセンサーデータは、ALOM (Advanced Lights Out Manager) インタフェースを通じてサービスプロセッサから取得されます。x64 サーバーのセンサーデータは IPMI から取得されます。


注 –

ALOM を使用するサーバーは、管理サーバーへのデータ送信にトラップを使用しません。管理データをメールで送信します。管理サーバーがこれらのサーバーからデータを確実に収集できるよう、管理サーバーをメールサーバーとして設定してください。この手順については、『Sun N1 System Manager 1.2 インストールおよび構成ガイド』「ALOM 電子メール警告の設定を構成する」に説明があります。


監視できるサーバーのハードウェア特性は次のとおりです。

これらのセンサーの詳細な一覧は、「ハードウェアセンサー属性」にあります。

show server コマンドでフィルタを使用し、すべてのサーバーに関するハードウェア健全性情報だけを表示することができます。


N1-ok> show server hardwarehealth hardwarehealth

hardwarehealth フィルタに使用する値の詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show server」を参照してください。健全性状態によるサーバーのフィルタリングの詳細と図による説明は、「問題の発生したサーバーを表示する」を参照してください。

ハードウェアセンサー属性

x86 サーバーでは、管理サーバーソフトウェアが IPMI を使用して、サーバーのサービスプロセッサから、監視するハードウェアセンサー属性の一覧を取得します。SPARC アーキテクチャーのサーバーでは、ALOM インタフェースが使用されます。ハードウェアセンサー属性の一覧は、サーバーによって、またファームウェアのバージョンによって、異なる場合があります。 ここでは、いくつかのサーバーおよびファームウェアバージョンの表示例を示します。属性は、サーバーの種類とサーバー上の CPU 数によって異なります。


注 –

ハードウェアディスク障害およびメモリーエラーは、このバージョンの N1 System Manager では監視対象ではありません。


次の例は、ファームウェアバージョン 2.1.0.16 の Sun Fire V40z サーバーのセンサー名およびその説明の一覧です。


ambienttemp     Ambient air temp
bulk.v12-0-s0   Bulk 12V S0 voltage at CPU 0
bulk.v12-2-s0   Bulk 12V S0 voltage at CPU 2
bulk.v12-3-s0   Bulk 12V S0 voltage at CPU 3
bulk.v1_8-s0    Bulk 1.8V S0 voltage
bulk.v1_8-s5    Bulk 1.8V S5 voltage
bulk.v2_5-s0    Bulk 2.5V S0 voltage
bulk.v2_5-s0-dc Bulk 2.5V S0 voltage at DC
bulk.v2_5-s5    Bulk 2.5V S5 voltage
bulk.v3_3-s0    Bulk 3.3V S0 voltage
bulk.v3_3-s0-dc Bulk 3.3V S0 voltage at DC
bulk.v3_3-s3    Bulk 3.3V S3 voltage
bulk.v3_3-s5    Bulk 3.3V S5 voltage
bulk.v3_3-s5-dc Aux 3.3V S5 voltage at DC
bulk.v5-s0      Bulk 5V S0 voltage
bulk.v5-s0-dc   Bulk 5V S0 voltage at DC
bulk.v5-s5      Bulk 5V S5 voltage
bulk.v5-s5-dc   Bulk 5V S5 voltage at DC
cpu0.dietemp    CPU 0 Die temperature
cpu0.heartbeat  CPU 0 Heartbeat
cpu0.inlettemp  CPU 0 Inlet temperature
cpu0.memtemp    CPU 0 Memory temperature
cpu0.v2_5-s0    CPU 0 VDDA (2.5V) S0 voltage
cpu0.v2_5-s3    CPU 0 VDD (2.5V) S3 voltage
cpu0.vcore-s0   CPU 0 VCore S0 voltage
cpu0.vid        CPU 0 VID Selection
cpu0.vldt0      CPU 0 LDT0 voltage
cpu0.vtt-s3     CPU 0 DDR VTT S3 voltage
cpu1.dietemp    CPU 1 Die temperature
cpu1.heartbeat  CPU 1 Heartbeat
cpu1.inlettemp  CPU 1 Inlet temperature
cpu1.memtemp    CPU 1 Memory temperature
cpu1.v2_5-s0    CPU 1 VDDA (2.5V) S0 voltage
cpu1.v2_5-s3    CPU 1 VDD (2.5V) S3 voltage
cpu1.vcore-s0   CPU 1 VCore S0 voltage
cpu1.vid        CPU 1 VID Selection
cpu1.vldt1      CPU 1 LDT1 voltage
cpu1.vldt2      CPU 1 LDT2 voltage
cpu1.vtt-s3     CPU 1 DDR VTT S3 voltage
cpu2.dietemp    CPU 2 Die temperature
cpu2.heartbeat  CPU 2 Heartbeat
cpu2.inlettemp  CPU 2 inlet temperature
cpu2.temp       CPU 2 downwind temperature
cpu2.v2_5-s0    CPU 2 VDDA (2.5V) S0 voltage
cpu2.v2_5-s3    CPU 2 VDD (2.5V) S3 voltage
cpu2.vcore-s0   CPU 2 VCore S0 voltage
cpu2.vid        CPU-2 VID Selection
cpu2.vtt-s3     CPU 2 DDR VTT voltage
cpu3.dietemp    CPU 3 Die temperature
cpu3.heartbeat  CPU 3 Heartbeat
cpu3.inlettemp  CPU 3 inlet temperature
cpu3.temp       CPU 3 downwind temperature
cpu3.v2_5-s0    CPU 3 VDDA (2.5V) S0 voltage
cpu3.v2_5-s3    CPU 3 VDD (2.5V) S3 voltage
cpu3.vcore-s0   CPU 3 VCore S0 voltage
cpu3.vid        CPU-3 VID Selection
cpu3.vtt-s3     CPU 3 DDR VTT voltage
fan1.tach       Fan 1 measured speed
fan10.tach      Fan 10 measured speed
fan11.tach      Fan 11 measured speed
fan12.tach      Fan 12 measured speed
fan2.tach       Fan 2 measured speed
fan3.tach       Fan 3 measured speed
fan4.tach       Fan 4 measured speed
fan5.tach       Fan 5 measured speed
fan6.tach       Fan 6 measured speed
fan7.tach       Fan 7 measured speed
fan8.tach       Fan 8 measured speed
fan9.tach       Fan 9 measured speed
faultswitch     System Fault Indication
g0.vldt1        AMD-8131 PCI-X Tunnel 0 LDT1 voltage
g1.vldt1        AMD-8131 PCI-X Tunnel 1 LDT1 voltage
gbeth.temp      Gigabit ethernet local temperature
golem-v1_8-s0   AMD-8131 PCI-X Tunnel 1.8V S0 voltage
identifyswitch  Identify switch
scsibp.temp     SCSI Disk backplane temperature
scsifault       SCSI Disk Fault Switch
sp.temp         SP local temperature
vldt-reg1-dc    LDT Regulator 1 Voltage
vldt-reg2-dc    LDT Regulator 2 Voltage

次の例は、ファームウェアバージョン 2.1.0.16 の Sun Fire V20z サーバーのセンサー名およびその説明の一覧です。


ambienttemp    Ambient air temp
bulk.v12-0-s0  Bulk 12v supply voltage (cpu0)
bulk.v12-1-s0  Bulk 12v supply voltage (cpu1)
bulk.v1_8-s0   Bulk 1.8v S0 voltage
bulk.v1_8-s5   Bulk 1.8v S5 voltage
bulk.v2_5-s0   Bulk 2.5v S0 voltage
bulk.v2_5-s5   Bulk 2.5v S5 voltage
bulk.v3_3-s0   Bulk 3.3v supply
bulk.v3_3-s3   Bulk 3.3v S3 voltage
bulk.v3_3-s5   Bulk 3.3v S5 voltage
bulk.v5-s0     Bulk 5v supply voltage
bulk.v5-s5     Bulk 5v S5 voltage
cpu0.dietemp   CPU 0 die temp
cpu0.heartbeat CPU 0 heartbeat
cpu0.memtemp   CPU 0 memory temp
cpu0.temp      CPU 0 low side temp
cpu0.v2_5-s0   CPU VDDA voltage
cpu0.v2_5-s3   CPU 0 VDDIO voltage
cpu0.vcore-s0  CPU 0 core voltage
cpu0.vid       CPU-0 VID output
cpu0.vldt1     CPU0 HT 1 voltage
cpu0.vldt2     CPU 0 HT 2 voltage
cpu0.vtt-s3    CPU 0 VTT voltage
cpu1.dietemp   CPU 1 die temp
cpu1.heartbeat CPU 1 heartbeat
cpu1.memtemp   CPU 1 memory temp
cpu1.temp      CPU 1 low side temp
cpu1.v2_5-s3   CPU 1 VDDIO voltage
cpu1.vcore-s0  CPU 1 core voltage
cpu1.vid       CPU-1 VID output
cpu1.vtt-s3    CPU 1 VTT voltage
fan1.tach      Fan 1 measured speed
fan2.tach      Fan 2 measured speed
fan3.tach      Fan 3 measured speed
fan4.tach      Fan 4 measured speed
fan5.tach      Fan 5 measured speed
fan6.tach      Fan 6 measured speed
faultswitch    Fault switch (source for eval)
g.vldt1        AMD-8131 PCI-X Tunnel HT 1 voltage
gbeth.temp     Gigabit ethernet temp
golem.temp     PCIX bridge temp
hddbp.temp     Disk drive backplane temp
identifyswitch Identify switch
ps.fanfail     Power Supply fan failure sensor
ps.tempalert   Power Supply too hot sensor
sp.temp        SP temp
thor.temp      AMD-8111 I/O Hub temp

これらのセンサーの多くから N1 System Manager によって、監視データが取得されます。

Sun Fire X4100 および Sun Fire X4200 サーバーでは、次のセンサーが監視されます。


Chassis Sensors:
sys.id               Indicates chassis type
sys.intsw            State of the Chassis Intrusion switch. When the chassis cover to 
                     the CPU area is opened this sensor logs an event
sys.psfail           LED indicator shows state of PS Fail / Rear LED 
                     on the front panel
sys.tempfail         LED indicator shows state of Over Temperature LED 
                     on the front panel
sys.fanfail          LED indicator shows state of Over Temperature LED 
                     on the front panel

Back Panel Sensors
bp.power             LED indicator shows state of the Power LED on the back panel
bp.locate            LED indicator shows state of the Locate LED on the back panel
bp.locate.btn        Monitors the state of the back panel locate button
bp.alert             LED indicator shows state of Alert LED on the back panel

Front Panel Sensors
fp.prsnt             Monitors the presence of the front panel board
fp.ledbd.prsnt       Monitors the presence of the front panel LED board
fp.usbfail           Monitors the front panel USB over current sensor
fp.power             LED indicator shows state of Power LED on the front panel
fp.locate            LED indicator shows state of Locate LED on the front panel
fp.locate.btn        Monitors the state of the front panel locate button
fp.alert             LED indicator shows state of Alert LED on the front panel

I/O Sensors
io.id0.prsnt         Monitors the 2-disk I/O board presence signal
io.id1.prsnt         Monitors the 4-disk I/O board presence signal
io.f0.prsnt          Monitors the physical presence of the rear blower
                     (Sun Fire X4200 chassis only)
io.f0.speed          Monitors the speed of the rear blower 
                     (Sun Fire X4200 chassis only)
io.f0.fail           LED indicator shows state of the I/O fan assembly
io.hdd0.fail         LED indicator shows state of the Hard Disk Drive 0 fault LED
io.hdd1.fail         LED indicator shows state of the Hard Disk Drive 1 fault LED
                     (Unused on the 2-disk Sun Fire X4100)
io.hdd2.fail         LED indicator shows state of the Hard Disk Drive 2 fault LED
                     (Unused on the 2-disk Sun Fire X4100)
io.hdd3.fail         LED indicator shows state of the Hard Disk Drive 3 fault LED
                     (Unused on the 2-disk Sun Fire X4100)

CPU 0 Sensors
p0.fail              LED indicator shows state of the CPU 0 fault LED
                     Illuminated for CPU voltage and temperature events
p0.d0.fail           LED indicator shows state of the CPU 0 DIMM 0 fault LED 
                     Illuminated in response to ECC errors
                     PAIR 0 includes this and p0.d1.fail, both LEDs in the same pair
                     will be illuminated at the same time when one indicates a fault
p0.d1.fail           LED indicator shows state of the CPU 0 DIMM 1 fault LED 
                     Illuminated in response to ECC errors
                     PAIR 0 includes this and p0.d0.fail, both LEDs in the same pair
                     will be illuminated at the same time when one indicates a fault
p0.d2.fail           LED indicator shows state of the CPU 0 DIMM 2 fault LED 
                     Illuminated in response to ECC errors
                     PAIR 1 includes this and p0.d3.fail, both LEDs in the same pair
                     will be illuminated at the same time when one indicates a fault
p0.d3.fail           LED indicator shows state of the CPU 0 DIMM 3 fault LED 
                     Illuminated in response to ECC errors
                     PAIR 1 includes this and p0.d2.fail, both LEDs in the same pair
                     will be illuminated at the same time when one indicates a fault

CPU 1 Sensors
p1.fail              Same as p0.fail, but for CPU 1
p1.d0.fail           Same as p0.d0.fail, but for CPU 1
p1.d1.fail           Same as p0.d1.fail, but for CPU 1
p1.d2.fail           Same as p0.d2.fail, but for CPU 1
p1.d3.fail           Same as p0.d3.fail, but for CPU 1

Power Supply Sensors
ps0.prsnt            Indicates whether Power Supply 0 is present
ps0.vinok            Indicates whether Power Supply 0 is connected to AC power
ps0.pwrok            Indicates whether Power Supply 0 is turned on and powering the system
ps1.prsnt            Indicates whether Power Supply 1 is present
ps1.vinok            Indicates whether Power Supply 1 is turned on and powering the system
ps1.pwrok            Indicates whether Power Supply 1 is turned on and powering the system

Fan Control Temperature Sensors
fp.t_amb             Monitors front panel ambient temperature
p0.t_core            Monitors CPU 0 core temperature
p1.t_core            Monitors CPU 1 core temperature

Other Temperature Sensors
mb.t_amb             Monitors ambient temperature from the internal temperature
                     sensor in the chip on the mainboard
pdb.t_amb            Monitors the ambient temperature of the power distibution board
io.t_amb             Monitors the ambient temperature from near the I/O area in the chassis

Mainboard Voltage Sensors
mb.v_bat             Monitors the 3V RTC battery on the mainboard
mb.v_+3v3stby        Monitors the 3.3V standby input that powers 
                     the service processor and other standby devices
mb.v_+3v3            Monitors the 3.3V main input that is active when the power is on
mb.v_+5v             Monitors the 5V main input that is active when the power is on
mb.v_+12v            Monitors the 12V main input that is active when the power is on
mb.v_-12v            Monitors the -12V main input that is active when the power is on
mb.+2v5core          Monitors the 2.5V core input that is active when the power is on
mb.+1v8core          Monitors the 1.8V core input that is active when the power is on
mb.+1v2core          Monitors the 1.2V core input that is active when the power is on

CPU 0 Voltage Sensors
p0.v_+1v5            Monitors the CPU 0 1.5V input
p0.v_+2v5core        Monitors the CPU 0 2.5V core input
p0.v_+1v2core        Monitors the CPU 0 1.2V core input

CPU 1 Voltage Sensors
p1.v_+1v5            Monitors the CPU 1 1.5V input 
p1.v_+2v5core        Monitors the CPU 1 2.5V core input
p1.v_+1v2core        Monitors the CPU 1 1.2V core input

Fan Presence Sensors (Sun Fire X4200 chassis only)
ft0.fm0.prsnt        Indicates the presence of Fan Tray 0, Fan Module 0
ft0.fm1.prsnt        Indicates the presence of Fan Tray 0, Fan Module 1
ft0.fm2.prsnt        Indicates the presence of Fan Tray 0, Fan Module 2
ft1.fm0.prsnt        Indicates the presence of Fan Tray 1, Fan Module 0
ft1.fm1.prsnt        Indicates the presence of Fan Tray 1, Fan Module 1
ft1.fm2.prsnt        Indicates the presence of Fan Tray 1, Fan Module 2

Fan Speed Sensors
ft0.fm0.f0.speed     Monitors speed of fan at Fan Tray 0, Fan Module 0, Fan 0
ft0.fm0.f1.speed     Monitors speed of fan at Fan Tray 0, Fan Module 0, Fan 1
                     (Sun Fire X4100 only)
ft0.fm1.f0.speed     Monitors speed of fan at Fan Tray 0, Fan Module 1, Fan 0
ft0.fm1.f1.speed     Monitors speed of fan at Fan Tray 0, Fan Module 1, Fan 1
                     (Sun Fire X4100 only)
ft0.fm2.f0.speed     Monitors speed of fan at Fan Tray 0, Fan Module 2, Fan 0
ft0.fm2.f1.speed     Monitors speed of fan at Fan Tray 0, Fan Module 2, Fan 1
                     (Sun Fire X4100 only)
ft1.fm0.f0.speed     Monitors speed of fan at Fan Tray 1, Fan Module 0, Fan 0
ft1.fm0.f1.speed     Monitors speed of fan at Fan Tray 1, Fan Module 0, Fan 1
                     (Sun Fire X4100 only)
ft1.fm1.f0.speed     Monitors speed of fan at Fan Tray 1, Fan Module 1, Fan 0
ft1.fm1.f1.speed     Monitors speed of fan at Fan Tray 1, Fan Module 1, Fan 1
                     (Sun Fire X4100 only)
ft1.fm2.f0.speed     Monitors speed of fan at Fan Tray 1, Fan Module 2, Fan 0
ft1.fm2.f1.speed     Monitors speed of fan at Fan Tray 1, Fan Module 2, Fan 1
                     (Sun Fire X4100 only)

Sun Fire X2100 サーバーでは、ファンの速度、電圧、および温度を示すセンサーのみがデータの取得に使用されます。監視されるセンサーの一覧を、次に示します。


DDR 2.6V
CPU core Voltage
VCC 3.3V
VCC 5V
VCC 12V
Battery Volt
CPU TEMP
SYS TEMP
CPU FAN
SYSTEM FAN3
SYSTEM FAN1
SYSTEM FAN2

OS の健全性の監視

OS の健全性は、N1 System Manager によって監視されます。add server feature コマンドに agentip キーワードを用いて、agentssh キーワードを使った ssh 経由で監視対象サーバーのオペレーティングシステムへのアクセス資格を指定します。さらに詳細な情報については、「OS 監視機能を追加する」を参照してください。この手順は、OS の健全性の監視に重要ですが、ハードウェアの健全性やネットワークの到達可能性の監視には重要ではありません。

OS 監視機能を追加すると、OS 監視のサポートが可能になり、デフォルトで監視が有効になります。その後、set server コマンドを使用すると、監視を無効および有効にできます。詳細は、「監視の有効化と無効化」を参照してください。

プラットフォーム OS インタフェースデータは、ssh および SNMP 経由で取得されます。すべての属性データは、ssh および SNMP によってサーバーのオペレーティングシステムから取得されます。メモリーやスワップ使用、ファイルシステム関係のデータ同様、中央演算処理装置 (CPU) に関係する統計も提供されます。監視の目的上、システム負荷、メモリー使用、スワップ使用データは、次のように分類できます。

これらの属性の一覧は、「ハードウェアセンサー属性」にあります。

show server コマンドでフィルタを使用し、すべてのサーバーに関する OS 健全性の監視情報だけを表示することができます。


N1-ok> show server oshealth oshealth

oshealth フィルタで使用可能な値についての詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show server」を参照してください。健全性状態によるサーバーのフィルタリングの詳細と図による説明は、「問題の発生したサーバーを表示する」を参照してください。

サーバーにはアクセス可能だが、監視機能のエージェントに SNMP ポート 61 で通信できない場合、OS リソースの健全性が unknown になることがあります。サーバーにアクセスできない (たとえば待機モードになっているため) 場合は、OS リソースの健全性が unreachable になることがあります。「プロビジョニング可能なサーバーの状態の「アクセス不能」と「不明」の違いについて」も参照してください。

また、OS の健全性の監視では、コマンド行で set コマンドを使用し、監視対象の個別サーバーまたは個別サーバーグループに対して特定のしきい値を設定することもできます。詳細は、「しきい値の設定」を参照してください。

特定の属性の値を監視する必要がない場合は、その属性を監視するためのしきい値重要度を無効にすることができます。これで、不要なアラームを防ぐことができます。例 5–6 に、この無効化を行う方法が示されています。

ネットワークの到達可能性監視

デフォルトでは、N1 System Manager は、プロビジョニング可能なサーバーのすべての管理インタフェースおよびすべてのプラットフォームインタフェースを監視します。プラットフォームインタフェースには、eth0 などのサービスプロセッサの管理インタフェースや、eth1 あるいは eth2 などのデータネットワークインタフェースがあります。

Linux サーバーおよび Solaris OS で稼働しているサーバーの到達可能性は、インタフェースの IP アドレスに対する ICMP ping で確認します。詳細は、『Sun N1 System Manager 1.2 インストールおよび構成ガイド』「工場出荷時状態のサーバーの検出」を参照してください。

すべてのネットワークインタフェースの到達可能性が定期的に検査されます。ネットワークの到達可能性の監視は、IP アドレスに基づいています。監視対象の IP アドレスにアクセスできない場合は、イベントが生成されます。

show server コマンドに監視情報を表示する適切なパラメータを付けることによって、すべてのサーバーに関する情報を絞り込むことができます。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show server」を参照してください。

プロビジョニング可能なサーバーの状態の「アクセス不能」と「不明」の違いについて

プロビジョニング可能なサーバーの状態のアクセス不能と不明の違いは重要です。


N1-ok> show server oshealth unreachable

このコマンドは、すべてのアクセス不能のプロビジョニング可能なサーバーを一覧表示します。このコマンドに対して出力されるのは、いずれも、ネットワークに問題があるためアクセスできない、プロビジョニング可能なサーバーです。つまり、ハードウェアの健全性ステータスについてサーバーと通信できません。サーバーに対する ping コマンドは成功しません。この場合、サーバーがハードウェアの健全性ステータス情報を送信していないことを意味するとは限りません。サーバーが待機モードである場合もあります。


N1-ok> show server oshealth unknown

このコマンドは、ハードウェアの健全性ステータスに関する情報を返さないすべてのプロビジョニング可能なサーバーを一覧表示します。ping コマンドは成功するが、ハードウェアの健全性に関する情報を返さないサーバーが出力されます。ポート 161 で、監視機能のエージェントと通信できないことを示します。


N1-ok> show server power unreachable

このコマンドは、すべてのアクセス不能のプロビジョニング可能なサーバーを一覧表示します。このコマンドに対して出力されるのは、いずれも、ネットワークに問題があるためアクセスできないサーバーです。つまり、電源ステータスについてサーバーと通信できません。サーバーに対する ping コマンドは成功しません。この場合、サーバーが電源ステータス情報を送信していないことを意味するとは限りません。サーバーが待機モードである場合もあります。


N1-ok> show server power unknown

このコマンドは、電源のステータスに関する情報を返さないすべてのプロビジョニング可能なサーバーを一覧表示します。ping コマンドは成功するが、電源のステータスに関する情報を返さないサーバーが出力されます。ポート 161 で、監視機能のエージェントに通信できないことを示します。


N1-ok> show server oshealth unreachable

このコマンドは、すべてのアクセス不能のプロビジョニング可能なサーバーを一覧表示します。このコマンドに対して出力されるのは、いずれも、ネットワークに問題があるためアクセスできないサーバーです。つまり、OS の健全性についてサーバーと通信できません。サーバーに対する ping コマンドは成功しません。この場合、サーバーが OS の健全性に関する情報を送信していないことを意味するとは限りません。サーバーが待機モードである場合もあります。


N1-ok> show server oshealth unknown

このコマンドは、OS の健全性に関する情報を返さないすべてのプロビジョニング可能なサーバーを一覧表示します。ping コマンドは成功するが、OS の健全性に関する情報を返さないサーバーが出力されます。ポート 161 で、監視機能のエージェントに通信できないことを示します。

監視のサポート

プロビジョニング可能なサーバーの完全な監視を有効にするには、そのサーバーの監視がサポートされている必要があります。サーバーに基本管理機能と OS 監視機能をインストールすると、そのサーバーの監視がサポートされます。

基本管理機能と OS 監視機能は、プロビジョニング可能なサーバーの OS がインストールされたとき、あるいは load group コマンドまたは load server コマンドを使用して更新されたときにインストールされます。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「load group」、および『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「load server」を参照してください。


注 –

load server または load group コマンドを使用してプロビジョニング可能なサーバーにソフトウェアをインストールし、プロビジョニング可能なサーバーの networktype 属性が dhcp の場合は、feature 属性を使用できません。そのため、load server または load group コマンドで OS をロードするときに基本管理機能と OS 監視機能をロードする場合は、networktype 属性を static に設定します。また、networktype 属性を dhcp にする場合は、サーバーが再起動するたびに、「サーバーのエージェント IP を変更する」の説明に従ってエージェントの IP アドレスを変更する必要があります。


基本管理機能と OS 監視機能は、add server コマンドを使用してインストールまたは更新することもできます。詳細は、「基本管理機能と OS 監視機能の追加およびアップグレード」を参照してください。

OS 監視機能がインストールされていない状態で、set server monitored コマンドを使用して監視を有効にすると、ハードウェア健全性の監視のみが有効になります。前もって OS 監視機能をインストールしないでこのコマンドを実行した場合は、OS 監視が有効になりません。詳細は、「監視の有効化と無効化」を参照してください。

基本管理機能と OS 監視機能の追加およびアップグレード

基本管理機能と OS 監視機能では、インストールされた OS プロファイルの監視とパッチ適用、およびリモートコマンドの実行のサポートが提供されます。ここでは、基本管理機能と OS 監視機能の追加、サポートされる属性の変更、機能サポートの削除、および基本管理機能と OS 監視機能を最新バージョンにアップグレードする方法について説明します。

OS 監視機能を追加すると、OS 監視のサポートが可能になり、デフォルトで監視が有効になります。「監視の有効化と無効化」に説明のある set server コマンドを使用すると、後から監視を有効および無効にできます。

この節では、次の作業について説明します。

Procedure基本管理機能を追加する

ここでは、新しく OS が配備されたサーバーに基本管理機能を追加する手順を説明します。基本管理機能を使用すると、リモートコマンドの実行およびパッケージの配備が行えるようになります。


注 –

基本管理機能のアンインストールはサポートされていません。


ここで説明するエージェント IP は、管理サーバーによって監視されるプロビジョニング可能なサーバーのデータネットワークインタフェースの IP アドレスです。インタフェースは eth1/bge1eth0/bge0 のどちらでもかまいませんが、通常は eth0/bge0 です。サーバーのエージェント IP アドレスについての詳細は、「サーバーのエージェント IP を変更する」を参照してください。


注 –

基本管理機能は、load server または load group コマンドで自動的に追加できます。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「load server」、または『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「load group」を参照してください。


始める前に
手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを入力します。


    注 –

    次のコマンドで使用されている SSH ユーザーアカウントは、リモートマシンで root 権限を持っている必要があります。



    N1-ok> add server server feature basemanagement agentip agentip agentssh username/password
    

    「基本管理サポートの追加」ジョブが開始します。

    必要なパッケージおよびスクリプトが追加されます。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「add server」を参照してください。

  3. 「基本管理サポートの追加」ジョブが正常に完了したら、次のコマンドを入力します。


    N1-ok> show server server
    

    「基本管理サポートの有無」フィールドの値に「あり」が表示されます。

次の手順

「OS 監視機能を追加する」

ProcedureOS 監視機能を追加する

ここでは、サーバーに OS 監視機能を追加する手順を説明します。すでに基本管理機能が追加されているサーバーには、OS 監視機能を追加することができます。また、新しく OS をロードしたサーバーに OS 監視機能を追加することもできます。この場合、基本管理機能が自動的に追加されます。OS 監視機能は、OS の健全性監視と資産管理に使用されます。詳細は、第 5 章「サーバーの監視」を参照してください。

add server feature osmonitor コマンドは、「OS 監視サポートの追加」ジョブを作成します。重複する複数の add server feature osmonitor コマンドを送信し、並行して実行させることができます。ただし、重複する「OS 監視サポートの追加」ジョブは、15 個以下にするべきです。

スクリプトを使用して add server feature コマンドを送信する場合は、例 5–1 の例を参照してください。


注 –

OS 監視機能は、load server または load group コマンドで自動的に追加できます。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「load server」、または『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「load group」を参照してください。


始める前に
手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のいずれかを実行して OS 監視機能を追加します。

    • 基本管理機能を追加していない場合は、次のコマンドを入力します。


      注 –

      次のコマンドで使用されている SSH ユーザーアカウントは、リモートマシンで root 権限を持っている必要があります。



      N1-ok> add server server feature osmonitor agentip agentip agentssh username/password
      
    • すでに基本管理機能を追加している場合は、次のコマンドを入力します。


      注 –

      基本管理サポートがあるサーバーに OS 監視サポートを追加するときには、エージェント IP または SSH 資格を指定することはできません。



      N1-ok> add server server feature osmonitor
      

    「OS 監視サポートの追加」ジョブが開始します。

    コマンド構文についての詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「add server」を参照してください。

  3. 「OS 監視サポートの追加」ジョブの完了を確認します。

    ジョブが正常に完了すると、「システムダッシュボード」タブの「サーバー」表に、「使用 OS」および「OS リソースの健全性」の値が表示されます。

    show server コマンドを実行し、OS 監視機能がサポートされていることを確認します。サーバーの出力に、プロビジョニング可能なサーバーで次のいずれかのコマンドセットの「OS 監視サポートの有無」の値が「正常」と表示されます。


    注 –

    すべての OS 監視データが完全に初期化されるまでには、5 〜 7 分かかります。CPU のアイドルが 0.0% と表示される場合は、使用 OS のステータスが「Failed Critical」になります。OS 監視機能の追加またはアップグレード後、5 〜 7 分でこの状態が解消されるはずです。


    サーバーから監視データを取得できない場合は、「OS 監視に関連するコマンドの失敗の解決」を参照してください。

    プロビジョニング可能なサーバーの IP アドレスが変更された場合は、再び set server コマンドを実行してから監視を有効または無効にします。


例 5–1 OS 監視サポートのスクリプト作成

次のスクリプト例は、基本管理機能をサポートしていない複数のサーバーに対して、複数の add server feature コマンドを実行しています。


n1sh add server 10.0.0.10 feature=osmonitor agentip 10.0.0.110 agentssh root/admin &
n1sh add server 10.0.0.11 feature=osmonitor agentip 10.0.0.111 agentssh root/admin &
n1sh add server 10.0.0.12 feature=osmonitor agentip 10.0.0.112 agentssh root/admin &

注意事項

管理サーバー上に古い SSH エントリがある場合、OS 監視機能の追加に失敗する可能性があります。add server feature osmonitor agentip コマンドに失敗しても、実際のセキュリティー違反が発生していない場合は、known_hosts ファイルを削除するか、そのファイル内でプロビジョニング可能なサーバーに対応しているエントリを削除します。その後、add server feature osmonitor agentip コマンドを再実行してください。管理サーバー で Linux が実行されている場合、known_hosts ファイルは /root/.ssh/known_hosts にあります。管理サーバー で Solaris OS が実行されている場合、 known_hosts ファイルは /.ssh/known_hosts にあります。

add server feature osmonitor コマンドでエージェント IP または SSH 資格を指定し、すでに基本管理機能をサポートしているサーバーでそのコマンドを実行すると、OS 監視機能の追加に失敗します。この問題を解決するには、エージェント IP または SSH 資格の値を指定しないで add server feature osmonitor コマンドを実行します。

ProcedureOS 監視機能を削除する

このコマンドによる OS 監視機能の削除には、2 つのレベルがあります。uninstall キーワードを指定しなかった場合、OS 監視機能はプロビジョニング可能なサーバーにインストールされたままになりますが、機能がサポートされなくなり、サーバーの OS が N1 System Manager で監視できなくなります。uninstall キーワードを指定した場合、OS 監視機能はプロビジョニング可能なサーバーから完全にアンインストールされるため、OS 監視機能がサポートされなくなります。

どちらの方法で削除しても、そのサーバーの OS リソースの健全性ステータスは「未初期化」になります。

推奨する手順を使用して機能を削除した場合は、add server コマンドを使用して再度追加することができます。show server の出力の「基本管理サポートの有無」および「OS 監視サポートの有無」フィールドには、サーバーの機能の現在のステータスが表示されます。


注 –

エージェントを削除するために、OS 監視機能を手動で削除しないでください。手動で削除すると、OS 監視機能の再インストールや再使用ができなくなります。OS 監視機能の削除するには、ここで説明する remove server feature による手順を使用してください。


手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. OS 監視機能を削除します。


    N1-ok> remove server server feature osmonitor [uninstall]
    

    必要なパッケージおよびスクリプトが削除されます。コマンド構文の詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「remove server」を参照してください。

Procedure基本管理機能を削除する

基本管理機能を削除する前に、OS 監視機能を削除する必要があります。詳細は、「OS 監視機能を削除する」を参照してください。

基本管理機能を削除すると、機能がプロビジョニング可能なサーバーからアンインストールされ、サポートされなくなります。

推奨する手順を使用して機能を削除した場合は、add server コマンドを使用して再度追加することができます。show server の出力の「基本管理サポートの有無」および「OS 監視サポートの有無」フィールドには、サーバーの機能の現在のステータスが表示されます。


注 –

エージェントを削除するために、基本管理機能を手動で削除しないでください。手動で削除すると、基本管理機能の再インストールや再使用ができなくなります。基本管理機能の削除するには、ここで説明する remove server feature による手順を使用してください。


手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. OS 監視機能を削除します。


    N1-ok> remove server server feature basemanagement
    

    必要なパッケージおよびスクリプトが削除されます。コマンド構文の詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「remove server」を参照してください。

Procedureサーバーのエージェント IP を変更する

ここでは、サーバーのエージェント IP を変更する手順を説明します。エージェント IP は、管理サーバーで監視されるプロビジョニング可能なサーバーのデータネットワークインタフェースの IP アドレスです。このエージェント IP は、サーバーの管理ネットワーク IP アドレスとは異なります。

次の図は、ジョブで生成されたテーブルにあるサーバーのエージェント IP アドレスが、「ジョブ」タブに表示された状態を示しています。サーバーのエージェント IP アドレスが、サーバーの IP アドレスとは異なっていることが分かります。

この図では、「ジョブ」タブのジョブ手順、およびサーバーのエージェント IP アドレスとサーバーの IP アドレスとの違いがよく分かります。
注 –

プロビジョニング可能なサーバーの IP アドレスおよび資格を変更した場合、または N1 System Manager の外部から手動でなんらかのサービスを削除した場合は、サービスの有効化は成功しません。N1 System Manager の外部から OS を任意に変更した場合は、再検出し、基本管理機能と OS 管理機能を追加しなおす必要があります。


load server または load group コマンドを使用してプロビジョニング可能なサーバーにソフトウェアをインストールする場合は、プロビジョニング可能なサーバーの networktype 属性を dhcp に設定できます。このように設定すると、サーバーは DHCP を使用してプロビジョニング対象ネットワークの IP アドレスを取得します。システムが再起動し、load コマンドまたは add server コマンドで agentip パラメータに使用したものとは異なる IP アドレスを取得した場合、次の機能が動作しなくなります。

この場合は、set server server agentip コマンドを使用し、この手順で示したサーバーのエージェント IP アドレスに訂正してください。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを実行します。


    N1-ok> set server server agentip IP
    

    エージェント IP が変更されます。コマンド構文の詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「set server」を参照してください。この操作では、プロビジョニング可能なサーバーに接続します。

Procedureサーバーの管理機能用の SSH 資格を変更する

ここでは、プロビジョニング可能なサーバーの基本管理機能および OS 監視機能用の SSH (Secure Shell) 資格を変更する手順を説明します。このような管理用 SSH 資格は、 add serverset serverload server start serverload groupstart group など、 多くの N1 System Manager コマンドで必要または使用されます。これらの資格、特にプロビジョニング可能なサーバーの基本管理機能および OS 監視機能用のもの、およびこの章の例で agentssh 資格と呼んでいるもの は、サーバーの管理ネットワーク IP アドレスで必要な SSH 資格とは異なります。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。この手順では、SSH ログイン名とパスワードが必要です。デフォルトの SSH ログイン名 / パスワードペアは、「サーバーの検出」を参照してください。

  2. 次のコマンドを実行します。


    注 –

    次のコマンドで使用されている SSH ユーザーアカウントは、リモートマシンで root 権限を持っている必要があります。



    N1-ok> set server server agentip IP agentssh username/password
    

    agentssh のユーザー名とパスワードが変更されます。コマンド構文の詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「set server」を参照してください。

Procedureサーバーの管理機能用の SNMP 資格を変更する

ここでは、サーバーの管理機能用 SNMP 資格を変更する手順を説明します。管理機能 SNMP 証明を使用することで、N1 System Manager は Sun Management Center SNMP エージェントと接続でき、プロビジョニング可能なサーバーの基本管理機能および OS 監視機能専用として使用されます。これらの資格、特にプロビジョニング可能なサーバーの基本管理機能および OS 監視機能用のもの、およびこの章の例で agentsnmp 資格と呼んでいるものは、サーバーの管理ネットワーク IP アドレスで必要な SNMP 資格とは異なります。

N1 System Manager の OS 監視用の SNMP エージェントについての詳細は、「監視の概要」を参照してください。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを実行し、サーバー上の SNMP 資格を指定します。


    N1-ok> set server server agentsnmp agentsnmp
    

    SNMP 資格が変更されます。コマンド構文の詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「set server」を参照してください。

    set server の操作では、実際にプロビジョニング可能なサーバーに接続しません。管理サーバー 自身のデータを同期するだけです。

Procedureサーバーの管理機能用の SNMPv3 資格を変更する

ここでは、サーバーの管理機能用 SNMPv3 資格を変更する手順を説明します。管理機能 SNMPv3 資格を使用することで、N1 System Manager は Sun Management Center SNMP エージェントと接続でき、プロビジョニング可能なサーバーの基本管理機能および OS 監視機能専用として使用されます。このような資格、特にプロビジョニング可能なサーバーの基本管理機能および OS 監視機能用のもの、およびこの章の例で agentsnmpv3 資格と呼んでいるものは、サーバーの管理ネットワーク IP アドレスで必要な SNMP 資格とは異なります。

N1 System Manager の OS 監視用の SNMP エージェントについての詳細は、「監視の概要」を参照してください。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを実行し、サーバー上の SNMP 資格を指定します。


    N1-ok> set server server agentsnmpv3 agentsnmpv3
    

    SNMP 資格が変更されます。コマンド構文の詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「set server」を参照してください。

    set server の操作では、実際にプロビジョニング可能なサーバーに接続しません。管理サーバー 自身のデータを同期するだけです。

ProcedureLinux OS 監視機能を手動でアンインストールする

この手順を正しく完了すると、プロビジョニング可能なサーバーに対して OS 監視機能がサポートされなくなります。

手順
  1. スーパーユーザーでプロビジョニング可能なサーバーにログインします。

  2. 次のコマンドを入力します。


    # /etc/rc.d/rc3.d/S99es_agent stop
    
  3. 次のコマンドを実行し、プロンプトの指示に従います。


    # /opt/SUNWsymon/sbin/es-uninst
    

    エージェントがアンインストールされます。

  4. 手動で機能を削除します。


    # rpm -e n1sm-linux-agent
    

    機能が削除されます。

  5. 機能に関係するディレクトリを削除します。


    # rm -rf /var/opt/SUNWsymon
    

    ディレクトリが削除されます。

ProcedureSolaris OS 監視機能を手動でアンインストールする

この手順を正しく完了すると、プロビジョニング可能なサーバーの OS 監視機能はサポートされなくなります。

手順
  1. スーパーユーザーでプロビジョニング可能なサーバーにログインします。

  2. エージェントを停止します。


    # /etc/rc3.d/S81es_agent stop
    
  3. アンインストーラを実行します。


    # /var/tmp/solx86-agent-installer/disk1/x86/sbin/es-uninst -X
    
  4. パッケージを削除します。

    SPARC アーキテクチャーの Solaris OS:


    # pkgrm SUNWn1smsparcag-1-2
    

    x86 アーキテクチャーの Solaris OS:


    # pkgrm SUNWn1smx86ag-1-2
    
  5. 関係するディレクトリを削除します。


    # /bin/rm -rf /opt/SUNWsymon
    # /bin/rm -rf /var/opt/SUNWsymon
    

    ディレクトリが削除されます。

Procedureサーバーの基本管理機能をアップグレードする

ここでは、サーバーの基本管理機能をアップグレードする手順を説明します。この手順は、プロビジョニング可能なサーバーに以前のバージョンの基本管理機能がインストールされたまま、N1 System Manager を以前のリリースからアップグレードした場合に必要です。この手順は、サーバーごとに行います。基本管理機能は、複数のサーバーで同時にアップグレードできます。詳細は、『Sun N1 System Manager 1.2 インストールおよび構成ガイド』の第 2 章「Sun N1 System Manager ソフトウェアとプロビジョニング可能なサーバーの管理エージェントのアップグレード」を参照してください。


注 –

最新バージョンの N1 System Manager から load server または load group コマンドを使用してサーバーを新規インストールし、feature サブコマンドを使用した場合、この手順は不要です。


プロビジョニング可能なサーバーを既存の基本管理機能から新バージョンにアップグレードするには、add server feature basemanagement コマンドに upgrade キーワードを用いて使用します。

スクリプトを使用して add server feature コマンドを送信する場合は、例 5–1 の例を参照してください。

始める前に
手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 基本管理機能をアップグレードするには、次のコマンドを入力します。


    N1-ok> add server server feature basemanagement upgrade
    

    「基本管理サポートの追加」ジョブが起動します。

    コマンド構文の詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「add server」を参照してください。

  3. 「基本管理サポートの追加」ジョブの完了を確認します。

    ジョブが正常に完了すると、サーバーの show server コマンド出力には「OS 監視サポートの有無」の値に「正常」と表示されます。また、「サーバーの詳細」ページの「基本管理サポートの有無」列には「あり」と表示されます。これを示した図については、「監視の有効化と無効化」を参照してください。

注意事項

管理サーバー の SSH エントリが古いために、基本管理機能の追加に失敗することがあります。add server feature osmonitor agentip コマンドに失敗しても、実際のセキュリティー違反が発生していない場合は、known_hosts ファイルを削除するか、そのファイル内でプロビジョニング可能なサーバーに対応しているエントリを削除します。その後、add server feature osmonitor agentip コマンドを再実行してください。管理サーバー で Linux が実行されている場合、known_hosts ファイルは /root/.ssh/known_hosts にあります。管理サーバー で Solaris OS が実行されている場合、 known_hosts ファイルは /.ssh/known_hosts にあります。

Procedureサーバーの OS 監視機能をアップグレードする

ここでは、サーバーの OS 監視機能をアップグレードする手順を説明します。この手順は、プロビジョニング可能なサーバーに以前のバージョンの OS 監視機能がインストールされたまま、N1 System Manager を以前のリリースからアップグレードした場合に必要です。この手順は、サーバーごとに行います。OS 監視機能は、複数のサーバーで同時にアップグレードできます。詳細は、『Sun N1 System Manager 1.2 インストールおよび構成ガイド』の第 2 章「Sun N1 System Manager ソフトウェアとプロビジョニング可能なサーバーの管理エージェントのアップグレード」を参照してください。


注 –

最新バージョンの N1 System Manager から load server または load group コマンドを使用してサーバーを新規インストールし、feature サブコマンドを使用した場合、この手順は不要です。


プロビジョニング可能なサーバーを既存の基本管理機能および OS 監視機能から新バージョンにアップグレードするには、add server feature osmonitor コマンドに upgrade キーワードを用いて使用します。

スクリプトを使用して add server feature コマンドを送信する場合は、例 5–1 を参照してください。

始める前に
手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. OS 監視機能をアップグレードするには、次のコマンドを入力します。


    N1-ok> add server server feature osmonitor upgrade
    

    「OS 監視サポートの変更」ジョブが開始されます。このコマンドでは、基本管理機能もアップグレードされます。

    コマンド構文の詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「add server」を参照してください。

  3. 「OS 監視サポートの追加」ジョブの完了を確認します。

    ジョブが正常に完了すると、「システムダッシュボード」タブの「サーバー」表に、「使用 OS」および「OS リソースの健全性」の値が表示されます。

    show server コマンドを実行し、OS 監視機能がサポートされていることを確認します。サーバーの出力に、プロビジョニング可能なサーバーで次のいずれかのコマンドセットの「OS 監視サポートの有無」の値が「正常」と表示されます。


    注 –

    すべての OS 監視データが完全に初期化されるまでには、5 〜 7 分かかります。CPU のアイドルが 0.0% と表示される場合は、使用 OS のステータスが「Failed Critical」になります。OS 監視機能の追加またはアップグレード後、5 〜 7 分でこの状態が解消されるはずです。


注意事項

管理サーバー の SSH エントリが古いために、OS 監視機能のアップグレードに失敗することがあります。add server feature osmonitor agentip コマンドに失敗しても、実際のセキュリティー違反が発生していない場合は、known_hosts ファイルを削除するか、そのファイル内でプロビジョニング可能なサーバーに対応しているエントリを削除します。その後、add server feature osmonitor agentip コマンドを再実行してください。管理サーバー で Linux が実行されている場合、known_hosts ファイルは /root/.ssh/known_hosts にあります。管理サーバー で Solaris OS が実行されている場合、 known_hosts ファイルは /.ssh/known_hosts にあります。

add server feature osmonitor upgrade コマンドでエージェント IP または SSH 資格を指定し、すでに基本管理機能をサポートしているサーバーでそのコマンドを実行すると、OS 監視機能のアップグレードに失敗します。この問題を解決するには、エージェント IP または SSH 資格の値を指定しないで add server feature osmonitor コマンドを実行します。

監視の有効化と無効化

オペレーティングシステムがプロビジョニング可能なサーバーに配備され、OS 監視機能がインストールされていないと、プロビジョニング可能なサーバーの監視対象ファイルシステムおよび OS の健全性データを利用できません。

サーバーに OS 監視機能がインストールされると、デフォルトで監視が有効になります。サーバーへの OS 監視機能のインストールについての詳細は、「監視のサポート」を参照してください。

監視を有効にしたり無効化にするは、set server monitored コマンドを使用します。「監視の有効化と無効化」を参照してください。サーバー、またはグループ内のすべてのサーバーに OS 監視機能がインストールされていない場合は、set server monitored コマンドを使用しても、サーバーまたはサーバーグループの「ハードウェア監視」だけが有効になります。

次の図は、「サーバーの詳細」ページの一部を示しています。サーバーは電源がオンの状態であり、OS がインストール済みで、基本管理機能と OS 監視機能がサポートされています。このサーバーの監視が有効です。

この図は、「サーバーの詳細」ページの一部を示しています。監視は有効と表示され、基本管理機能と OS 監視機能が強調表示されています。

set server monitored コマンドを使用して監視を無効にしても、OS 監視機能で提供される監視サポートは削除されず、サーバーにインストールされたままになります。ただし、set server monitored コマンドで監視を無効にすると、ハードウェア健全性と OS 健全性の両方の監視が無効になります。

Procedureサーバーまたはサーバーグループを監視する

ここでは、コマンド行を使用して、サーバーまたはサーバーグループのハードウェア健全性とオペレーティングシステム健全性の監視を有効にする手順を説明します。サーバーまたはサーバーグループに OS 監視機能がインストールされている場合、このコマンドによってハードウェア健全性と OS 健全性の両方の監視が有効になります。サーバーまたはサーバーグループに OS 監視機能がインストールされていない場合は、ハードウェア健全性の監視だけが有効になります。

始める前に

server という名前のサーバーで管理エージェント IP およびセキュリティー資格を有効にするには、管理機能を追加します (「監視のサポート」を参照) 。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. set server コマンドを使用して、monitored 属性を true に設定します。


    N1-ok> set server server monitored true
    

    この手順の server は、監視するプロビジョニング可能なサーバーの名前です。

    • サーバーグループの場合は、set group コマンドを使用して、monitored 属性を true に設定します。


      N1-ok> set group group monitored true
      

      このコマンドは、指定された名前のグループのサーバーに対して実行されます。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「set group」を参照してください。この手順の group は、監視するプロビジョニング可能なサーバーのグループの名前です。

  3. サーバーの詳細を表示します。


    N1-ok> show server server
    
    • サーバーグループの場合は、サーバーグループの詳細を表示し、グループ内の各サーバーに対して監視が有効になっていることを確認します。


      N1-ok> show group group
      

    詳細な監視情報が表示されます。表示される情報は、ハードウェア健全性、OS 健全性、およびネットワークの到達可能性です。OS 健全性監視のしきい値も表示されます。監視しきい値については、「監視しきい値」で説明しています。

Procedureサーバーまたはサーバーグループの監視を無効にする

ここでは、コマンド行を使用して、サーバーまたはサーバーグループのハードウェア健全性とオペレーティングシステム健全性の監視を無効にする手順を説明します。OS 監視機能が追加されている場合、このコマンドによってハードウェア健全性と OS 健全性の両方の監視が無効になります。

保守作業を行う場合は、ハードウェアコンポーネントの監視を無効にして、イベントが生成されないようにすることができます。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. set server コマンドを使用して、monitored 属性を false に設定します。


    N1-ok> set server server monitored false
    

    この例の server は、監視を停止するプロビジョニング可能なサーバーの名前です。このコマンドを実行すると、指定したサーバーの監視が無効になります。サーバーの監視を無効にすると、そのサーバーに関する属性のしきい値違反があっても、イベントは生成されません。

    • サーバーグループの場合は、set group コマンドを使用して、monitored 属性を false に設定します。


      N1-ok> set group group monitored false
      

      このコマンドは、指定された名前のグループのサーバーに対して実行されます。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「set group」を参照してください。この手順の group は、監視を無効にするプロビジョニング可能なサーバーのグループの名前です。

  3. サーバーの詳細を表示します。


    N1-ok> show server server
    

    監視が無効であることが出力に示されます。

    特定の OS 健全性の属性の値を監視する必要がない場合は、その属性に対するしきい値重要度を無効にすることができます。この場合、他の OS 健全性の属性は引き続き監視することができます。これで、不要なアラームを防ぐことができます。例 5–6 に、この作業の方法が示されています。しきい値の全般的な情報については、「監視しきい値」を参照してください。OS 健全性の監視機能は削除することもできます。「OS 監視機能を削除する」を参照してください。

    • サーバーグループの場合は、サーバーグループの詳細を表示し、グループ内のすべてのサーバーに対して監視が無効になっていることを確認します。


      N1-ok> show group group
      

監視のデフォルト状態

Sun N1 System Manager における、検出されたサーバーおよび初期化されたオペレーティングシステム用の監視のデフォルトのステータスは次のとおりです。

ハードウェア監視のデフォルトのステータス

デフォルトでは、サーバーまたはその他のハードウェアが検出されると、そのサーバーまたはハードウェアの監視が有効になります。サーバーを監視するには、そのサーバーが検出されていて、正しく N1 System Manager に登録されている必要があります。このプロセスは、「サーバーの検出」で説明しています。デフォルトでは、すべての管理対象サーバーに対して、ハードウェアセンサーの監視が有効になります。サーバーが削除され、再検出された場合は、そのサーバーに関する、監視のためのすべての状態が失われます。これは、サーバーを削除したときにそのサーバーに対して監視が有効であったかどうかに関係ありません。デフォルトでは、サーバーが再び検出されると、監視は true に設定されます。サーバーの検出の詳細は、「新しいサーバーを検出する」を参照してください。

OS 健全性監視のデフォルトステータス

デフォルトは無効です。プロビジョニング可能なサーバーに OS が正しくプロビジョニングされ、N1 System Manager 管理機能がサポートされると (add server feature コマンドを agentip 付けて実行)、OS 健全性の監視が有効になります。OS のプロビジョニングは、N1 System Manager または、N1 System Manager 以外での OS インストールで行うことができます。

特定の OS 健全性の属性の値を監視する必要がない場合は、その属性に対するしきい値重要度を無効にすることができます。この場合、他の OS 健全性の属性は引き続き監視することができます。これで、不要なアラームを防ぐことができます。例 5–6 に、この方法が示されています。しきい値の全般的な情報については、「監視しきい値」を参照してください。

ネットワーク到達可能性監視のデフォルトのステータス

デフォルトでは、プロビジョニング可能なサーバーの管理インタフェースが検出されると、そのインタフェースの監視が有効になります。デフォルトでは、管理機能が追加されると、他のインタフェースの監視も有効になります。

監視しきい値

監視対象の OS 健全性属性の値は、しきい値と比較されます。下限および上限しきい値を定義し、それらの値を設定することができます。

属性データは、定期的にしきい値と比較されます。

監視対象属性の値がデフォルトまたはユーザー定義のしきい値安全範囲外の場合は、イベントが生成され、ステータスが実行されます。属性値が下限しきい値を下回るか、上限しきい値を上回ると、そのしきい値の重要度に応じて、イベントが生成され、「回復不能」か「重大」、または「警告」いずれかのステータスが示されます。それ以外の場合では、属性値が取得できるときは、OS 健全性の監視属性のステータスが「良好」になります。

属性値そのものが取得できない場合は、イベントが生成され、監視対象の属性のステータスが「不明」であることが示されます。サーバーにはアクセス可能だが、監視機能のエージェントに SNMP ポート 161 で通信できない場合、OS リソースの健全性が unknown になります。詳細は、「プロビジョニング可能なサーバーの状態の「アクセス不能」と「不明」の違いについて」を参照してください。

「回復不能」、「重大」、および「警告」については、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show server」を参照してください。

しきい値が範囲外の場合の現象について

OS 健全性の監視対象の属性の値が「警告の上限」しきい値を上回った場合は、「警告の上限」のステータスが実行されます。この値が上昇し続けて、「重大の上限」しきい値を過ぎると、「Failed Critical」のステータスが実行されます。値がさらに上昇し続けて、「回復不能の上限」しきい値を上回ると、「回復不能の上限」のステータスが実行されます。

逆に値が下がって安全範囲に戻った場合は、値が「Failed Warning」しきい値よりも低くなるまで、イベントは生成されません。値が戻ると、イベントが生成され、ステータスとして「正常」が示されます。

監視対象の属性の値が「警告の下限」しきい値を下回った場合は、「Failed Warning」のステータスが実行されます。この値が下がり続けて、「重大の下限」しきい値を過ぎると、「 Failed Critical」のステータスが実行されます。値がさらに下がり続けて、「回復不能の下限」しきい値を下回ると、「回復不能の下限」のステータスが実行されます。

逆に値が上昇して安全範囲に戻った場合は、値が「警告の下限」しきい値よりも高くなるまで、イベントは生成されません。値が戻ると、イベントが生成され、ステータスとして「正常」が示されます。

OS 健全性属性のしきい値は、コマンド行から設定できます。この作業については、「しきい値の設定」で説明します。割合を測定するしきい値の場合、有効な範囲は 0% 〜 100% です。この範囲外のしきい値を設定しようとすると、エラーになります。割合を測定しない属性の場合、その値は、システム内のプロセッサ数と導入先の使用特性に依存します。

導入状況に応じたしきい値の調整

一定の期間使用したあとで、適切な OS 健全性の属性値の設定レベルが判明することがあります。イベントの生成、およびポケットベルまたは電子メールアドレスへのイベント通知の送信に関して、本当に妥当な値に近いものが判明したら、しきい値を調整することができます。たとえば、特定の属性が「警告の上限」のしきい値レベルに達すたびにイベント通知を受け取るようにすることができます。詳細は、「イベント通知の設定」を参照してください。

導入先で重要な属性の場合は、「警告の上限」しきい値レベルを小さい割合値に設定して、できるだけ早期に値の上昇が分かるようにすることができます。

Procedureサーバーのしきい値を取得する

始める前に

server という名前のサーバーで、管理エージェント IP およびセキュリティー資格を有効にするには管理機能を追加します (「基本管理機能と OS 監視機能の追加およびアップグレード」を参照)。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. show server コマンドを入力します。


    N1-ok> show server server
    

    この例の server は、しきい値を取得するプロビジョニング可能なサーバーの名前です。

    サーバーのハードウェア健全性、OS 健全性、ネットワークの到達可能性などの詳細な監視しきい値情報が表示されます。具体的な値が設定されていない場合は、デフォルト値が表示されます。

    詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show server」を参照してください。

    • しきい値情報は、ブラウザインタフェース の「サーバーの詳細」ページでも確認できます。それを次の図に示します。

      この図は、OS 監視情報およびしきい値のステータス情報を「サーバーの詳細」ページに表示できることを示しています。

デフォルトしきい値の管理

N1 System Manager ソフトウェアでは、一部の OS 健全性属性について、工場出荷時のしきい値が用意されています。これらの値は、百分率で表されています。表 5–1 は、Sun Fire V20z サーバー用の OS 健全性属性のデフォルト値の一覧です。


注 –

今回のバージョンの Sun N1 System Manager では、ハードウェアの健全性属性のしきい値の設定および変更はサポートされていません。


表 5–1 Sun Fire V20z の OS 健全性属性のデフォルトしきい値の出荷時設定

属性名 

説明 

デフォルトしきい値 

デフォルトしきい値 

cpustats.loadavg1min

待ち状態が 1 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh >4.00

criticalhigh >5.00

cpustats.loadavg5min

待ち状態が 5 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh >4.10

criticalhigh >5.10

cpustats.loadavg15min

待ち状態が 15 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh >4.10

criticalhigh >5.10

cpustats.pctusage

CPU 全体の使用率 

warninghigh >80%

criticalhigh >90.1%

cpustats.pctidle

CPU アイドル率 

warninglow <20%

criticallow <10%

memusage.mbmemfree

M バイト単位の未使用メモリー 

warninghigh <39%

criticalhigh <29%

memusage.mbmemused

M バイト単位の使用メモリー 

warninghigh >1501

criticalhigh >2001

memusage.pctmemused

メモリーの使用率 

warninghigh >80%

criticalhigh >90%

memusage.pctmemfree

メモリーの未使用率 

warninglow <20%

criticallow <10%

memusage.kbswapused

使用中のスワップスペース (KB) 

warninghigh >500000

criticalhigh >1000000

fsusage.kbspacefree

システムの未使用領域 (KB) 

warninglow <94.0Kb

criticallow <89.0Kb

個々のしきい値は、「しきい値の設定」で説明している手順に従って コマンド行で設定することができます。

表 5–2 に、OS 健全性属性の完全な一覧を示します。

表 5–2 OS 健全性属性 (すべて)

属性名 

説明 

サポートされるしきい値 

サポートされるしきい値 

cpustats.loadavg1min

待ち状態が 1 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh

criticalhigh

cpustats.loadavg5min

待ち状態が 5 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh

criticalhigh

cpustats.loadavg15min

待ち状態が 15 分を超えるプロセスの平均個数で表したシステム負荷  

warninghigh

criticalhigh

cpustats.pctusage

CPU 全体の使用率 

warninghigh

criticalhigh

cpustats.pctidle

CPU アイドル率 

warninglow

criticallow

memusage.pctmemused

メモリーの使用率 

warninghigh

criticalhigh

memusage.pctmemfree

メモリーの未使用率 

warninglow

criticallow

memusage.mbmemused

M バイト単位の使用メモリー 

warninghigh

criticalhigh

memusage.mbmemfree

M バイト単位の未使用メモリー 

warninglow

criticallow

memusage.kbswapused

使用中のスワップスペース (KB) 

warninghigh

criticalhigh

memusage.mbswapfree

M バイト単位の未使用スワップ空間 

warninglow

criticallow

memusage.pctswapfree

スワップ空間の未使用率 

warninglow

criticallow

fsusage.pctused

ファイルシステム空間の使用率 

warninghigh

criticalhigh

fsusage.kbspacefree

システムの未使用領域 (KB) 

warninghigh

criticalhigh

しきい値の設定

個別サーバーに OS 監視属性のしきい値を設定することができます。コマンド行から OS 健全性属性のしきい値を設定すると、その属性に関するしきい値の工場出荷時設定が無効になります。

Procedureサーバーに対するしきい値を設定する

始める前に

server という名前のサーバーで、 管理エージェント IP およびセキュリティー資格を有効にするには、管理機能を追加します (「基本管理機能と OS 監視機能の追加およびアップグレード」を参照)。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. threshold 属性を付けて set server コマンドを使用します。

    この構文では、threshold キーワードのあとに、しきい値を設定する attribute を続ける必要があります。attribute は OS 健全性属性です。OS 健全性属性の説明は、「OS の健全性の監視」に、一覧は、表 5–2 にあります。

    threshold は、criticallowwarninglow warninghighcriticalhigh のいずれかです。値は数字で、通常は百分率を表します。

    set server の操作では、実際にプロビジョニング可能なサーバーに接続しません。管理サーバー自身のデータを同期するだけです。

    • しきい値を 1 つ設定するには、次のように入力します。


      N1-ok> set server server threshold attribute threshold value
      
    • サーバーに対して複数のしきい値を設定するには、次のように入力します。


      N1-ok> set server server threshold attribute threshold value threshold value
      
    • サーバーグループの場合は、threshold 属性を付けて set group コマンドを使用します。サーバーグループのしきい値を 1 つ変更するには、次のように入力します。


      N1-ok> set group group threshold attribute threshold value
      
    • サーバーグループの複数のしきい値を変更するには、次のように入力します。


      N1-ok> set group group threshold attribute threshold value threshold value
      

例 5–2 サーバーの CPU 使用率に関する複数しきい値の設定

この例は、serv1 という名前のプロビジョニング可能なサーバーで、CPU 使用率の warninghigh しきい値を 53 パーセントに設定する方法を示しています。また、criticalhigh しきい値を 75 パーセントに設定しています。


N1-ok> set server serv1 threshold cpustats.pctusage warninghigh 53 criticalhigh 75


例 5–3 サーバーのファイルシステム使用率に関する複数しきい値の設定

この例では、serv1 という名前のプロビジョニング可能なサーバーで、ファイルシステム使用率の warninghigh しきい値を 75 パーセントに設定しています。また、criticalhigh しきい値を 87 パーセントに設定しています。この例では、サーバーのすべてのファイルシステムに対してしきい値を設定します。


N1-ok> set server serv1 threshold fsusage.pctused warninghigh 75 criticalhigh 87

複数のしきい値を設定するファイルシステムを指定することもできます。このサーバーの /usr ファイルシステムに対して warninghigh しきい値を 75 パーセント、criticalhigh しきい値を 87 パーセントに設定するには、 filesystem 属性を使用します。


N1-ok> set server serv1 filesystem /usr threshold fsusage.pctused 
warninghigh 75 criticalhigh 87


例 5–4 サーバーのファイルシステム空き容量に関するしきい値の設定

この例では、serv1 という名前のプロビジョニング可能なサーバーで、/var ファイルシステムのファイルシステム空き容量に対する warninghigh しきい値を 150K バイトに設定します。


N1-ok> set server serv1 filesystem /var threshold fsusage.kbspacefree warninghigh 150


例 5–5 サーバーの未使用メモリーに関するしきい値の設定

この例では、serv1 という名前のプロビジョニング可能なサーバーで、未使用メモリー率に対する criticalhigh しきい値を 5 パーセントに設定します。


N1-ok> set server serv1 threshold memusage.pctmemused criticalhigh 5


例 5–6 サーバーのファイルシステム使用率しきい値の削除

この例では、serv1 という名前のプロビジョニング可能なサーバーに設定されている warninghigh しきい値を削除します。


N1-ok> set server serv1 threshold fsusage warninghigh none

この場合は、このしきい値の該当する重要度の以前の設定値が削除されます。実際には、このサーバーのファイルシステム使用の warninghigh しきい値に関する監視は無効になります。



例 5–7 サーバーグループのファイルシステム使用に関する複数のしきい値の設定

次の例は、grp3 というグループ名の、プロビジョニング可能なサーバーのグループで、ファイルシステム使用の warninghigh しきい値を 75 パーセントに設定する方法を示しています。また、criticalhigh しきい値を 87 パーセントに設定しています。


N1-ok> set group grp3 threshold fsusage.pctused warninghigh 75 criticalhigh 87

MIB の監視

N1 System Manager では、2 つの MIB が提供されています。これらの MIB は、他社製監視ツールで N1 System Manager から SNMP を使用してデータを取得するための、データ構造を提供します。また、N1 System Manager によって生成された SNMP 通知の構文解析に、他社製監視ツールを使用するための、データ構造を提供します。MIB は /opt/sun/n1gc/etc/ にあります。したがって、これらの MIB によって N1 System Manager への照会に、任意の SNMP クライアントを使用できるようになります。また、SNMP を使用したイベントの待機も可能になります。次の 2 つの MIB が提供されています。

SUN-N1SM-INFO-MIB

この MIB は、SNMP クライアントを使用して N1 System Manager を照会することによって、N1 System Manager から取得できる情報を記述します。

SUN-N1SM-TRAP-MIB

この MIB は、SNMP トラップを受け取ることができる N1 System Manager に関連するすべてのイベントを記述します。

これらの MIB は読み取り専用です。MIB には各オブジェクトの詳細な説明が提供されていますが、これらを使用するには、SNMP の詳細な知識が必要です。監視システムへの、トラップ受信を開始する設定方法は、使用している監視システムの性質によって異なります。

MIB はハードウエアに依存しません。


例 5–8 SNMP トラップの受信

この例は、単純な UNIX トラップリスナーである snmptrapd コマンドを使用して、N1 System Manager トラップの受信を開始する方法を示しています。


# snmptrapd -m all -M /opt/sun/n1gc/etc:/usr/share/snmp/mibs -P

この例では、snmptrapd コマンドを使用し、デフォルトポート 162 で SNMP トラップの監視を開始します。また、SNMP トラップの内容の解析に /opt/sun/n1gc/etc および /usr/share/snmp/mibs に格納された MIB を使用するよう、コマンドに指定しています。


ジョブの管理

ここでは、ジョブについて、およびそのサーバー監視におけるジョブの重要性について、説明します。

ジョブは、N1 System Manager で主なアクションを行うたびに 1 つ作成されます。ジョブのログを使用して、現在実行中のアクションのステータスを監視したり、ジョブが終了したことを確認したりできます。N1 System Manager におけるアクションには、完了までに時間がかかるものがあるため、ジョブの監視はとても役立ちます。そのようなアクションの 1 例として、1 つ以上のプロビジョニング可能なサーバーへの OS ディストリビューションのインストールがあげられます。

ジョブは、ブラウザインタフェース の「ジョブ」タブあるいは show job コマンドで監視できます。show job コマンドは、次の特性のほとんどに関する情報を表示します。

ジョブ ID

生成された一意のジョブ識別子。

日付

ジョブが開始された日付。

ジョブの種類

ジョブの種類。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show job」を参照してください。type パラメータを付けて show job コマンドを使用すると、ジョブは次のいずれかに分類されます。

  • addbase 基本管理サポートの追加。

  • addosmonitor OS 監視サポートの追加。

  • createos メディア (CD/DVD) または ISO ファイルからの OS ディストリビューションの作成。

  • deletejob ジョブの削除。

  • discover サーバー検出。

  • loadfirmware ファームウェアアップデートのロード。

  • loados OS のロード。

  • loadupdate OS アップデートのロード。

  • refresh サーバーの情報更新。

  • reset サーバーの再起動。

  • removeosmonitor OS 監視サポートの削除。

  • setagentip 管理機能の設定変更。基本管理機能と OS 監視機能に関するもの。

  • start サーバーの電源オン。

  • startcommand リモートコマンドの実行。

  • stop サーバーの電源オフ。

  • unloadupdate OS アップデートのアンロード。

状態

現在のジョブステップの状態。ジョブステップは、ジョブの進行状況と更新結果を示します。各ジョブステップには、種類、開始日時、およびジョブの完了日時 (ジョブが完了した場合のみ) が示されます。ジョブの進行状況は、次の状態として示されます。この状態でジョブを選別することができます。

未開始

「未開始」状態 のジョブは停止できません。

テスト

ID によってジョブを選択し、ジョブの詳細を表示すると、ジョブの各ステップが 2 つ (テストと実際の実行) 表示されます。

実行中

ジョブは現在実行中です。現在実行中のジョブは、delete job コマンドで削除することはできません。実行を完了させるか、stop job コマンドで中止します。

ジョブの完了状況は、次の結果で示されます。

完了

ジョブステップが正常に完了したことを示します。

警告

ジョブの実行中に警告があったことを示します。警告は、何らかの問題が報告されたことを示します。この問題は、ジョブステップを (そしてその結果ジョブを) エラーを伴って終了させるほど重大である場合があります。

停止

ジョブステップが完了する前に停止したことを示します。

停止中

ジョブはまだ実行中だが、ジョブステップを正常に完了できない状態を示します。

エラー

ジョブステップの一般エラーを示します。

タイムアウト

すべてのジョブステップが正常に完了しないうちにジョブがタイムアウトしたか、または、ジョブの現在のステップが正常に完了しないうちに次のステップが開始したことを示します。

ジョブがすべてのステップを正常に完了したが、ジョブの実行中に少なくとも 1 つの警告状態がステップに対して実行され、かつ、この警告がジョブをエラーを伴って終了させるほど重大でなかった場合、ジョブ全体のステータスとして「Complete - Warning」が出力されます。

ジョブは、その状態に従って選別することができます。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show job」を参照してください。

コマンド

ジョブの開始に使用されたコマンド。

所有者

ジョブを開始したユーザー。ジョブの「作成者」ともいいます。

ジョブの結果

完了したジョブの結果の詳細情報です。リモートコマンド操作および他のすべての種類のジョブの完了ステータスの標準出力を見ることができます。

Procedureジョブを一覧表示する

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. ジョブの一覧を表示します。


    N1-ok> show job all
    

    N1 System Manager のすべてのジョブの一覧が返されます。

    詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show job」を参照してください。


例 5–9 すべてのジョブの一覧表示

この例は、show job コマンドを all オプションを付けて使用した場合に返されるジョブ ID 別のジョブの一覧を示しています。ジョブが開始された日付と日時が表示されています。ジョブの種類、ステータス、ジョブを作成したユーザーの ID も返されます。


N1-ok> show job all
ジョブ ID   日時                        種類                ステータス  所有者
7        2005-09-16T10:51:07-0700  検出                完了     root
6        2005-09-14T14:42:52-0700  Server Reboot     エラー    root
5        2005-09-14T14:38:25-0700  Server Power On   完了     root
4        2005-09-14T14:29:20-0700  Server Power Off  完了     root
3        2005-09-09T13:01:35-0700  検出                完了     root
2        2005-09-09T12:38:16-0700  検出                完了     root
1        2005-09-09T10:32:40-0700  検出                完了     root

Procedure特定のジョブを表示する

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 特定のジョブを表示します。


    N1-ok> show job job
    

    指定したジョブの詳細情報が表示されます。

    詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show job」を参照してください。


例 5–10 ジョブの詳細の表示

この例は、show job コマンドを、ジョブ ID を付けて使用した場合に返される出力を示しています。ジョブが開始された日付と時刻、ジョブの種類とステータス、ジョブを作成したユーザーの ID が表示されています。この例のジョブは、load server コマンドを使用して 192.168.200.4 という名前のサーバーに OS プロファイルをロードします。ジョブの各「ステップ」の詳細も表示されています。詳細は、ステップの開始時刻と完了時刻、およびステップが成功したかどうかが含まれています。


N1-ok> show job 21
ジョブ ID:   21
日時:       2005-10-27T10:09:18-0600
種類:       Load OS
ステータス:    Completed (2005-10-27T10:37:23-0600)
コマンド:     load server 192.168.200.4 osprofile SLES9RC5 
bootip=192.168.200.30 networktype=static ip=192.168.200.31
所有者:      root
エラー:      0
警告:       0

ステップ
ID     種類            開始                        Completion                 結果
1      Acquire Host  2005-10-27T10:09:19-0600  2005-10-27T10:09:19-0600   完了
2      Execute Java  2005-10-27T10:09:19-0600  2005-10-27T10:09:19-0600   完了
3      Acquire Host  2005-10-27T10:09:21-0600  2005-10-27T10:09:21-0600   完了
4      Execute Java  2005-10-27T10:09:21-0600  2005-10-27T10:37:22-0600   完了

結果
結果 1: 
サーバー:    192.168.200.4
ステータス:   0
メッセージ:   OS deployment using OS Profile SLES9RC5 was successful.
IP address 192.168.200.30 was assigned.

Procedureジョブを停止する

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 特定のジョブを停止します。


    N1-ok> stop job job
    

    ジョブが停止します。

    詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「stop job」を参照してください。

  3. ジョブの詳細を表示します。


    N1-ok> show job job
    

    出力の「結果」の項目には、ジョブが停止されたことが示されます。

    ジョブはどれも停止できます。ただし、実際には、停止できるのは、その最終ステップになっていないジョブだけです。ジョブにはステップが 1 つだけのものもあり、その場合は停止できません。ステータスが 未開始 のジョブは停止できません。多くのサーバーからなるグループに対して行う操作は大量のステップから構成され、時間がかかることがあります。

    詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show job」を参照してください。


例 5–11 ジョブの停止

この例は、ジョブ ID を付けて stop job コマンドを使用すると返される、要求が受信されたことを確認するメッセージを示しています。


N1-ok> stop job 32

Stop Job "32" request received.

次の例のように、show job コマンドに停止したジョブのジョブ ID を付けて使用すると、停止したジョブのより詳細な情報を得ることができます。「ステータス」に、ジョブが停止されたことの確認が返されます。ジョブを作成したコマンドも表示されます。ジョブの各「ステップ」も詳細表示されています。詳細には、ステップの開始時刻と完了時刻、およびステップが成功したかどうかが含まれています。「結果」の項目には、ジョブが停止されたことが示されています。


N1-ok> show job 32
ジョブ ID:   32
日時:       2005-11-02T08:08:37-0700
種類:       Server Refresh
ステータス:    停止 (2005-11-02T08:08:48-0700)
コマンド:     set server 192.168.200.2 refresh
所有者:      root
エラー:      0
警告:       0

ステップ
ID   種類            開始                        Completion                 結果   
1    Acquire Host  2005-11-02T08:08:38-0700  2005-11-02T08:08:38-0700   完了
2    Run Command   2005-11-02T08:08:38-0700  2005-11-02T08:08:38-0700   完了
3    Acquire Host  2005-11-02T08:08:40-0700  2005-11-02T08:08:40-0700   完了
4    Run Command   2005-11-02T08:08:40-0700  2005-11-02T08:08:47-0700   停止

参照

「サーバーまたはサーバーグループにリモートコマンドを実行する」

Procedureジョブを削除する

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 削除するジョブを確認します。


    N1-ok> show job all
    

    すべてのジョブ およびジョブ ID が表示されます。

    詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show job」を参照してください。

  3. 適切なジョブを削除します。


    N1-ok> delete job job
    

    ジョブが削除されます。

    詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「delete job」を参照してください。

  4. ジョブが削除されたことを確認します。


    N1-ok> show job all
    

    削除したジョブが表示されていないことを確認します。

    詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show job」を参照してください。


例 5–12 ジョブの削除

この例は、ジョブを削除する方法を示しています。

まず、show job コマンドを all オプションを付けて使用します。これは、すべてのジョブを降順で一覧表示します。


N1-ok> show job all
ジョブ ID    日時                        種類                ステータス     Creator
7         2005-02-16T10:51:07-0700  検出                完了        root
6         2005-02-14T14:42:52-0700  Server Reboot     エラー       root
5         2005-02-14T14:38:25-0700  Server Power On   完了        root
4         2005-02-14T14:29:20-0700  Server Power Off  完了        root
3         2005-02-09T13:01:35-0700  検出                完了        root
2         2005-02-09T12:38:16-0700  検出                完了        root
1         2005-02-09T10:32:40-0700  検出                完了        root

ジョブ ID 6 にはエラーがあり、削除することができます。削除するジョブのジョブ ID を付けて delete job コマンドを使用します。


N1-ok> delete job 6

再度 show job コマンドを all オプションを付けて使用します。すべてのジョブが降順で一覧表示されます。削除されたジョブは、もう一覧には表示されていません。


N1-ok> show job all
ジョブ ID    日時                        種類                ステータス     Creator
7         2005-02-16T10:51:07-0700  検出                完了        root
5         2005-02-14T14:38:25-0700  Server Power On   完了        root
4         2005-02-14T14:29:20-0700  Server Power Off  完了        root
3         2005-02-09T13:01:35-0700  検出                完了        root
2         2005-02-09T12:38:16-0700  検出                完了        root
1         2005-02-09T10:32:40-0700  検出                完了        root


例 5–13 すべてのジョブの削除

この例は、すべてのジョブを削除する方法を示しています。

まず、show job コマンドを all オプションを付けて使用します。これは、すべてのジョブを降順で一覧表示します。


N1-ok> show job all
ジョブ ID    日時                        種類                ステータス     Creator
7         2005-09-16T10:51:07-0700  検出                完了        root
6         2005-09-14T14:42:52-0700  Server Reboot     エラー       root
5         2005-09-14T14:38:25-0700  Server Power On   完了        root
4         2005-09-14T14:29:20-0700  Server Power Off  完了        root
3         2005-09-09T13:01:35-0700  検出                実行中       root
2         2005-09-09T12:38:16-0700  検出                完了        root
1         2005-09-09T10:32:40-0700  検出                完了        root

all オプションを付けて delete job コマンドを使用し、すべてのジョブを削除します。


N1-ok> delete job all

Unable to delete job "3"

all オプションを付けて show job コマンドを使用し、すべてのジョブが正常に削除されたかどうかを確認します。


N1-ok> show job all
ジョブ ID    日時                        種類        ステータス    Creator
3         2005-09-09T13:01:35-0700  検出        実行中      root

ジョブ ID 3 はまだ実行中です。これは、delete job コマンドが実行されたときに、ジョブの状態が「実行中」であったためです。ジョブは、削除する前に実行が完了しているか停止されている必要があります。

ジョブを停止してから削除するには、まず、停止するジョブのジョブ ID を付けて stop job コマンドを使用します。


N1-ok> stop job 3

Stop Job "3" request received.

show job コマンドを使用してジョブが停止されたことを確認します。


N1-ok> show job all
ジョブ ID    日時                        種類      ステータス       Creator
3         2005-09-09T13:02:35-0700  検出      Aborted     root

ジョブは実行中に停止され、「停止」状態にあります。all オプションを付けて delete job コマンドを使用し、すべてのジョブを削除します。


N1-ok> delete job all

show job コマンドを使用し、すべてのジョブが削除されたことを確認します。


N1-ok> show job all
ジョブ ID    日時                        種類      ステータス       Creator

ジョブのキューイング

N1 System Manager では、ジョブの種類ごとに重みが関連付けられます。重みは、システムリソースに対してジョブが生む負荷を反映しています。システムにかけることができる負荷総量に対するグローバル制限もあります。次の表は、各種ジョブ (ユーザーレベル) の重みをまとめています。最大許容負荷は 5000 です。

表 5–3 ジョブの重み値

作業 

重み 

OS 配備 

500 

パッケージ配備 

500 

パッケージのアンインストール 

500 

検出 

200 

ファームウェアの配備 

500 

リモートコマンドの実行 

200 

ジョブの削除 

400 

OS の作成 

1000 

サーバーのリセット 

200 

サーバーの電源オフ 

200 

サーバーの電源オン 

200 

サーバーの再表示 

200 

サーバー機能の設定 

200 

サーバーの削除 

100 

サーバーの追加 

100 

   

負荷総量は、実行しているすべてのジョブの負荷の合計です。システムは、次の時点で現在の負荷総量と最大許容負荷を比較します。

現在の負荷総量と最大許容負荷との間に十分な差があり、ジョブキューの先頭にあるジョブを処理できる状態の場合、そのジョブは実行中の状態に格上げされます。そうでない場合は、待ち状態のままになります。システム上で同時に実行可能なジョブの組み合わせは、現在の負荷総量によって決まります。

たとえば、同時に実行できる OS 配備ジョブは 2 つだけです。

500 + 500 = 1000

あるいは、1 つの OS 配備ジョブと 2 つのサーバーの電源オフジョブを同時に実行できます。

500 + 200 + 200 < 1000

イベントログエントリの管理

ここでは、イベントについて、およびサーバー監視における重要性について、説明します。

「イベント」は、属性に関係する特定の状態が発生すると生成されます。各イベントごとに項目が関連付けられます。たとえば、管理サーバーによってサーバーが検出された場合、Action.Physical.Discovered という項目でイベントが生成されます。イベント項目の完全な一覧は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「create notification」を参照してください。

イベントは監視できます。監視は、監視対象の各サーバーまたは各サーバーグループのイベント伝送機能と接続されています。監視対象の属性の値が、デフォルトまたはユーザー定義のしきい値安全範囲外になった場合は、イベントが生成され、ステータスが実行されます。

監視の詳細は、「監視の概要」を参照してください。

イベント通知の詳細は、「イベント通知の設定」を参照してください。

ライフサイクルイベントは、監視が無効でも引き続き生成されます。「ライフサイクルイベント」には、サーバー検出、サーバーの変更または削除、サーバーグループ作成などがあります。この種のイベントの通知を要求していた場合は、監視が無効でも引き続き通知を受けることができます。

イベントが発生すると、イベントログが作成されます。たとえば、監視対象の IP アドレスが到達不可能な場合は、イベントが生成されます。イベントログレコードが 1 つ作成され、このレコードはブラウザインタフェースで見ることができます。


注 –

ALOM (Advanced Lights Out Manager) 規格のマシンは、電子メールを使用して 管理サーバー にイベント通知を送信します。これは、『Sun N1 System Manager 1.2 サイト計画の手引き』「管理サーバーのメールサービスとアカウントの設定」に従って設定しておく必要があります。障害追跡情報は、「ALOM によるサーバーからの通知の修正」を参照してください。


イベントログの概要

N1 System Manager のインストールおよび構成作業中に、ログを記録するイベントを設定することができます。また、対話形式でイベント項目に重要度レベルを設定することもできます。『Sun N1 System Manager 1.2 インストールおよび構成ガイド』「N1 System Manager システムの設定」を参照してください。

ログが保存されなくても、イベント通知は生成することができます。

イベントに関する次の情報を表示するには、show log コマンドを使用します。

n1smconfig スクリプトを使用し、イベントログを保管する日数を変更することができます。イベントログを保管する日数を減らすと、イベントログファイルの平均容量が減少します。この作業によって、イベントログファイルの容量がパフォーマンスに影響を与えることを避けることができます。Linux プラットフォームと Solaris OS プラットフォームのどちらでも、n1smconfig スクリプトは /usr/bin に保存されます。このスクリプトではイベントログを保持する日数を設定します。イベントログを設定するには、イベントカテゴリおよびリソースカテゴリを指定する必要があります。次のイベントカテゴリが定義されています。

all イベントカテゴリは、すべてのイベントのログを記録する場合に使用します。各イベントカテゴリの実際のイベントの関連については、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「create notification」のイベント通知に関する項目を参照してください。一般的なログファイルは、/var/adm/messages または /var/log/messagessyslog ファイルに保存されます。

Procedureイベントログを表示する

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを入力します。


    N1-ok> show log [count count]

    イベントの新しい順にイベントログが表示されます。 count 属性の値は出力に表示するイベント数です。 count のデフォルト値は 500 です。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show log」を参照してください。

参照

「イベントログの概要」

Procedureイベントログを選別する

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを入力します。


    N1-ok> show log [after after] [before before] [count count] [severity severity]

    指定した条件に一致するイベントのみ表示されます。before または after 変数値は、2005-07-20T11:53:04 というように適切な書式にする必要があります。severity として有効な値は、次のとおりです。

    • unknown

    • other

    • information

    • warning

    • minor

    • major

    • critical

    • fatal

    詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show log」を参照してください。

Procedureイベントの詳細を表示する

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを入力します。


    N1-ok> show log log
    

    イベントの詳細が表示されます。log 変数はログ ID です。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show log」を参照してください。


例 5–14 イベントの詳細の表示


N1-ok> show log 72
ID:       72
Date:     2005-03-15T13:35:59-0700
Subject:  RemoteCmdPlan
Topic:    Action.Logical.JobStarted
Severity: Information
Level:    FINE
Source:   Job Service
Role:     root
Message:  RemoteCmdPlan job initiated by root: job ID = 15. 

イベント通知の設定

N1 System Manager には、N1 System Manager 内でイベントが発生したとき、あるいはプロビジョニング可能なサーバーで特定のイベントが発生したときに電子メールまたは SNMP によるイベント通知を送信する機能があります。必要とされるさまざまな状況に応じたイベント通知規則を作成することができます。イベントのデフォルト通知の設定は、インストール時に n1smconfig ユーティリティーを使用して行います。N1 System Manager のインストールと設定についての詳細は、『Sun N1 System Manager 1.2 インストールおよび構成ガイド』「N1 System Manager システムの設定」を参照してください。

コマンド行で、追加のイベント通知を作成できます。発生する、または発生する可能性のあるイベントに基づく、イベント「通知規則」を作成するには、create notification コマンドを使用します。項目を使用してイベント通知を作成してください。

SNMP トラップを使用してイベント通知を設定するには、 /opt/sun/n1gc/etc/SUN-N1SM-TRAP-MIB.mib にある SNMP MIB を使用します。SNMP MIB に関する詳細は、「MIB の監視」を参照してください。

イベントの種類ごとに、通知規則を使用し、電子メールまたは SNMP を通信媒体として特定の送信先にイベント発生通知を送信することができます。たとえば、管理サーバーによって新しいプロビジョニング可能なサーバーが検出されるたびに、イベントが発生したことを示すメッセージをポケットベルで受け取るようにする通知規則を作成できます。


create notification notification destination destination topic topic 
type type [description description]

このコマンド構文で使用されている用語についての詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「create notification」を参照してください。

N1 System Manager のインストールと設定中に、SMTP サーバーがイベント通知を使用するよう設定することができます。『Sun N1 System Manager 1.2 インストールおよび構成ガイド』「N1 System Manager システムの設定」を参照してください。

イベント通知の表示と変更

イベント通知の詳細を表示および変更するには、show notification および set notification コマンドを使用します。構文およびパラメータの詳細は、N1–ok コマンド行で help show notification または help set notification と入力してください。

Procedureイベント通知を一覧表示する

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを入力します。


    N1-ok> show notification all
    

    読み取り権限をもつイベント通知が表示されます。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show notification」を参照してください。

Procedureイベント通知の詳細を表示する

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを入力します。


    N1-ok> show notification notification
    

    指定したイベント通知の詳細が表示されます。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「show notification」を参照してください。


例 5–15 イベント通知の詳細の表示

この例は、通知の詳細を表示するための show notification コマンドの使用方法を示しています。


N1-ok> show notification notif33
名前:        notif33
イベントトピック:  EReport.Physical.ThresholdExceeded
通知のタイプ:    Email
送信先:       nobody@sun.com
状態:        有効

Procedureイベント通知を変更する

ここでは、イベント通知の名前や説明、あるいは送信先を変更する手順を説明します。

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを入力します。


    N1-ok> set notification notification name name description description
     destination destination
    

    指定したイベント通知属性が、指定した新しい値に変更されます。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「set notification」を参照してください。


例 5–16 イベント通知名の変更

この例は、set notification コマンドを name オプションを付けて使用し、通知名を notif22 から notif23 に変更する方法を示しています。


N1-ok> set notification notif22 name notif23

イベント通知の作成、テスト、および削除

create notification または delete notification コマンドを使用すると、イベント通知を作成および削除できます。

start notification コマンドに test キーワードを付けて使用すると、イベント通知をテストできます。

構文およびパラメータの詳細は、N1–ok コマンド行で help create notification または help delete notification と入力してください。

Procedureイベント通知を作成、テストする

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを入力します。


    N1-ok> create notification notification topic topic
    type type destination destination
    

    イベント通知が作成されて有効になります。詳細および有効な項目については、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「create notification」を参照してください。

  3. 次のコマンドを入力します。


    N1-ok> start notification notification test
    

    テスト用の通知メッセージが送信されます。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「start notification」を参照してください。


例 5–17 電子メール通知の作成

この例は、サーバーグループが作成されたときに電子メールで送信されるイベント通知を作成する方法を示しています。『Sun N1 System Manager 1.2 インストールおよび構成ガイド』「N1 System Manager システムの設定」の説明に従って n1smconfig ユーティリティーを使用し、SMTP メールサーバーをあらかじめ設定しておく必要があります。

このイベント通知名を notif2 、送信先の電子メールアドレスを nobody@sun.com とします。


N1-ok> create notification notif2 destination nobody@sun.com
Lifecycle.Logical.CreateGroup type email

イベント通知が作成されたことを確認するには、show notification コマンドを使用できます。


N1-ok> show notification
名前      イベントトピック                                  送信先              状態
notif2  EReport.Physical.ThresholdExceeded        nobody@sun.com   有効 

テスト用に仮のグループを作成すると、イベントを起動できます。


N1-ok> create group test

通知の作成に成功すると、電子メールが送信されます。作成されなかった場合は、次のエラーメッセージが表示されます。


Notification test failed.

SMTP サーバーが正しく設定され、到達可能かどうか、および通知規則で使用している電子メールアドレスが有効かどうかを確認してください。



例 5–18 SNMP 通知の作成

この例は、物理しきい値を超えた場合に SNMP で送信するイベント通知を作成する方法を示しています。イベント通知名を notif3、送信先の SNMP アドレスを sun.com とします。


N1-ok> create notification notif3 destination sun.com
topic EReport.Physical.ThresholdExceeded type snmp

イベント通知が作成されたことを確認するには、show notification コマンドを使用できます。


N1-ok> show notification
名前      イベントトピック                                  送信先       状態
notif3  EReport.Physical.ThresholdExceeded        sun.com   有効

show notification コマンドに通知属性値を付けて使用すると、表示するイベント通知を指定できます。


N1-ok> show notification notif3
名前      イベントトピック                                  送信先       状態
notif3  EReport.Physical.ThresholdExceeded        sun.com   有効

Procedureイベント通知を削除する

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを入力します。


    N1-ok> delete notification notification
    

    イベント通知が削除されます。

イベント通知の有効化と無効化

デフォルトでは、イベント通知は作成された時点で有効になります。無効になっていたイベント通知を有効にするには、start notification コマンドを使用します。構文およびパラメータの詳細は、N1–ok コマンド行で help start notification と入力してください。

Procedureイベント通知を有効にする

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを入力します。


    N1-ok> start notification notification
    

    イベント通知が有効になります。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「start notification」を参照してください。

Procedureイベント通知を無効にする

手順
  1. N1 System Manager にログインします。

    詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。

  2. 次のコマンドを入力します。


    N1-ok> stop notification notification
    

    イベント通知が無効になります。詳細は、『Sun N1 System Manager 1.2 コマンド行レファレンスマニュアル』「stop notification」を参照してください。