ここでは、ジョブについて、およびそのサーバー監視におけるジョブの重要性について説明します。
ジョブは、N1 System Manager で主なアクションを行うたびに 1 つ作成されます。ジョブのログを使用して、現在実行中のアクションのステータスを監視したり、ジョブが終了したことを確認したりできます。N1 System Manager におけるアクションには、完了までに時間がかかるものがあるため、ジョブの監視はとても役立ちます。そのようなアクションの 1 例として、1 つ以上の管理対象サーバーへの OS ディストリビューションのインストールがあげられます。
ジョブは、ブラウザインタフェースの「ジョブ」タブあるいは show job コマンドで監視できます。show job コマンドは、次の特性のほとんどに関する情報を表示します。
生成された一意のジョブ識別子。
ジョブが開始された日付。
ジョブの種類。詳細は、『Sun N1 System Manager 1.3 コマンド行リファレンスマニュアル』の「show job」を参照してください。type パラメータを付けて show job コマンドを使用するときは、次の種類のジョブを指定できます。
addbase – 基本管理サポートの追加。
addosmonitor – OS 監視サポートの追加。
createos – メディア (CD/DVD) または ISO ファイルから OS ディストリビューションを作成。
deletejob – ジョブの削除。
discover – サーバーの検出。
loadfirmware – ファームウェアアップデートのロード。
loados – OS のロード。
loadupdate – OS アップデートのロード。
refresh – サーバーの更新。
reset – サーバーの再起動。
removeosmonitor – OS 監視サポートの削除。
removeserver – サーバーの削除。
setagentip – 管理機能の設定変更。基本管理機能と OS 監視機能に関するもの。
start – サーバーの電源を入れる。
startcommand – リモートコマンドの実行。
stop – サーバーの電源を停止する。
unloadupdate – OS アップデートのアンロード。
現在のジョブステップの状態。ジョブステップは、ジョブの進行状況と更新結果を示します。各ジョブステップには、種類、開始日時、およびジョブの完了日時 (ジョブが完了した場合のみ) が示されます。ジョブの進行状況は、次の状態として示されます。この状態でジョブを選別することができます。
ステータスが 未開始 のジョブは停止できません。
ID によってジョブを選択し、ジョブの詳細を表示すると、ジョブの各ステップが 2 つ (テストと実際の実行) 表示されます。
ジョブは現在実行中です。現在実行中のジョブは、delete job コマンドで削除することはできません。実行を完了させるか、stop job コマンドで中止します。
ジョブの完了状況は、次の結果で示されます。
ジョブステップが正常に完了したことを示します。
ジョブの実行中に警告があったことを示します。警告は、何らかの問題が報告されたことを示します。この問題は、ジョブステップを (そしてその結果ジョブを) エラーを伴って終了させるほど重大である場合があります。
ジョブステップが完了する前に停止したことを示します。
ジョブはまだ実行中だが、ジョブステップを正常に完了できない状態を示します。
ジョブステップの一般エラーを示します。
すべてのジョブステップが正常に完了しないうちにジョブがタイムアウトしたか、または、ジョブの現在のステップが正常に完了しないうちに次のステップが開始したことを示します。
ジョブがすべてのステップを正常に完了したが、ジョブの実行中に少なくとも 1 つの警告状態がステップに対して実行され、かつ、この警告がジョブをエラーを伴って終了させるほど重大でなかった場合、ジョブ全体のステータスとして「Complete - Warning」が出力されます。
ジョブは、その状態に従って選別することができます。詳細は、『Sun N1 System Manager 1.3 コマンド行リファレンスマニュアル』の「show job」を参照してください。
ジョブの開始に使用されたコマンド。
ジョブを開始したユーザー。ジョブの「作成者」ともいいます。
完了したジョブの結果の詳細情報です。リモートコマンド操作および他のすべての種類のジョブの完了ステータスの標準出力を見ることができます。
N1 System Manager にログインします。
詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。
ジョブの一覧を表示します。
N1-ok> show job all |
N1 System Manager のすべてのジョブの一覧が返されます。
詳細は、『Sun N1 System Manager 1.3 コマンド行リファレンスマニュアル』の「show job」を参照してください。
この例は、 all オプションを指定した show job コマンドを使用した場合に返されるジョブ ID 別のジョブの一覧を示しています。ジョブが開始された日付と日時が表示されています。ジョブの種類、ステータス、ジョブを作成したユーザーの ID も返されます。
N1-ok> show job all ジョブ ID 日時 種類 ステータス 所有者 7 2005-09-16T10:51:07-0700 検出 完了 root 6 2005-09-14T14:42:52-0700 サーバーの再起動 エラー root 5 2005-09-14T14:38:25-0700 サーバーの電源オン 完了 root 4 2005-09-14T14:29:20-0700 サーバーの電源オフ 完了 root 3 2005-09-09T13:01:35-0700 検出 完了 root 2 2005-09-09T12:38:16-0700 検出 完了 root 1 2005-09-09T10:32:40-0700 検出 完了 root |
N1 System Manager にログインします。
詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。
特定のジョブを表示します。
N1-ok> show job job |
指定したジョブの詳細情報が表示されます。
また、ジョブの種類に基づいてジョブにフィルタをかけることもできます。
N1-ok> show job type |
詳細は、『Sun N1 System Manager 1.3 コマンド行リファレンスマニュアル』の「show job」を参照してください。
この例は、show job コマンドを、ジョブ ID を付けて使用した場合に返される出力を示しています。ジョブが開始された日付と時刻、ジョブの種類とステータス、ジョブを作成したユーザーの ID が表示されています。この例のジョブは、load server コマンドを使用して 192.168.200.4 という名前のサーバーに OS プロファイルをロードします。ジョブの各「ステップ」も詳細表示されています。詳細には、ステップの開始時刻と完了時刻、およびステップが成功したかどうかが含まれています。
N1-ok> show job 21 ジョブ ID: 21 日時: 2005-10-27T10:09:18-0600 種類: OS のロード ステータス: 完了 (2005-10-27T10:37:23-0600) コマンド: load server 192.168.200.4 osprofile SLES9RC5 bootip=192.168.200.30 networktype=static ip=192.168.200.31 所有者: root エラー: 0 警告: 0 ステップ ID 種類 開始 完了 結果 1 Acquire Host 2005-10-27T10:09:19-0600 2005-10-27T10:09:19-0600 完了 2 Execute Java 2005-10-27T10:09:19-0600 2005-10-27T10:09:19-0600 完了 3 Acquire Host 2005-10-27T10:09:21-0600 2005-10-27T10:09:21-0600 完了 4 Execute Java 2005-10-27T10:09:21-0600 2005-10-27T10:37:22-0600 完了 結果 結果 1: サーバー: 192.168.200.4 ステータス: 0 メッセージ: OS プロファイル SLES9RC5 を使用した OS の配備に成功しました。 IP アドレス 192.168.200.30 が割り当てられました。 |
この例は、show job コマンドとジョブの種類 addosmonitor を使用して、OS 監視サポートを追加するすべてのジョブを表示する方法を示しています。
N1-ok> show job type addosmonitor |
N1 System Manager にログインします。
詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。
特定のジョブを停止します。
N1-ok> stop job job |
ジョブが停止します。
詳細は、『Sun N1 System Manager 1.3 コマンド行リファレンスマニュアル』の「stop job」を参照してください。
ジョブの詳細を表示します。
N1-ok> show job job |
出力の「結果」の項目には、ジョブが停止されたことが示されます。
ジョブはどれも停止できます。ただし、実際には、停止できるのは、その最終ステップになっていないジョブだけです。ジョブにはステップが 1 つだけのものもあり、その場合は停止できません。ステータスが 未開始 のジョブは停止できません。多くのサーバーからなるグループに対して行う操作は大量のステップから構成され、時間がかかることがあります。
詳細は、『Sun N1 System Manager 1.3 コマンド行リファレンスマニュアル』の「show job」を参照してください。
この例は、ジョブ ID を付けて stop job コマンドを使用すると返される、要求が受信されたことを確認するメッセージを示しています。
N1-ok> stop job 32 ジョブ "32" の停止要求を受け取りました。 |
次の例のように、show job コマンドに停止したジョブのジョブ ID を付けて使用すると、停止したジョブのより詳細な情報を得ることができます。「ステータス」に、ジョブが停止されたことの確認が返されます。ジョブを作成したコマンドも表示されます。ジョブの各「ステップ」も詳細表示されています。詳細には、ステップの開始時刻と完了時刻、およびステップが成功したかどうかが含まれています。「結果」の項目には、ジョブが停止されたことが示されています。
N1-ok> show job 32 ジョブ ID: 32 日時: 2005-11-02T08:08:37-0700 種類: サーバーの再表示 ステータス: 停止 (2005-11-02T08:08:48-0700) コマンド: set server 192.168.200.2 refresh 所有者: root エラー: 0 警告: 0 ステップ ID 種類 開始 完了 結果 1 Acquire Host 2005-11-02T08:08:38-0700 2005-11-02T08:08:38-0700 完了 2 Run Command 2005-11-02T08:08:38-0700 2005-11-02T08:08:38-0700 完了 3 Acquire Host 2005-11-02T08:08:40-0700 2005-11-02T08:08:40-0700 完了 4 Run Command 2005-11-02T08:08:40-0700 2005-11-02T08:08:47-0700 停止 |
「管理対象サーバーまたはグループに対してリモートコマンドを実行する」
N1 System Manager にログインします。
詳細は、「N1 System Manager のコマンド行にアクセスする」を参照してください。
削除するジョブを確認します。
N1-ok> show job all |
すべてのジョブ およびジョブ ID が表示されます。
詳細は、『Sun N1 System Manager 1.3 コマンド行リファレンスマニュアル』の「show job」を参照してください。
適切なジョブを削除します。
N1-ok> delete job job |
ジョブが削除されます。
詳細は、『Sun N1 System Manager 1.3 コマンド行リファレンスマニュアル』の「delete job」を参照してください。
ジョブが削除されたことを確認します。
N1-ok> show job all |
削除したジョブが表示されていないことを確認します。
詳細は、『Sun N1 System Manager 1.3 コマンド行リファレンスマニュアル』の「show job」を参照してください。
この例は、ジョブを削除する方法を示しています。
まず、all オプションを指定した show job コマンドを使用して、すべてのジョブを降順で一覧表示します。
N1-ok> show job all ジョブ ID 日時 種類 ステータス 所有者 7 2005-02-16T10:51:07-0700 検出 完了 root 6 2005-02-14T14:42:52-0700 サーバーの再起動 エラー root 5 2005-02-14T14:38:25-0700 サーバーの電源オン 完了 root 4 2005-02-14T14:29:20-0700 サーバーの電源オフ 完了 root 3 2005-02-09T13:01:35-0700 検出 完了 root 2 2005-02-09T12:38:16-0700 検出 完了 root 1 2005-02-09T10:32:40-0700 検出 完了 root |
ジョブ ID 6 にはエラーがあり、削除することができます。削除するジョブのジョブ ID を付けて delete job コマンドを使用します。
N1-ok> delete job 6 |
再度 all オプションを指定した show job コマンドを使用して、すべてのジョブを降順で一覧表示します。削除されたジョブは、もう一覧には表示されていません。
N1-ok> show job all ジョブ ID 日時 種類 ステータス 所有者 7 2005-02-16T10:51:07-0700 検出 完了 root 5 2005-02-14T14:38:25-0700 サーバーの電源オン 完了 root 4 2005-02-14T14:29:20-0700 サーバーの電源オフ 完了 root 3 2005-02-09T13:01:35-0700 検出 完了 root 2 2005-02-09T12:38:16-0700 検出 完了 root 1 2005-02-09T10:32:40-0700 検出 完了 root |
この例は、すべてのジョブを削除する方法を示しています。
まず、all オプションを指定した show job コマンドを使用して、すべてのジョブを降順で一覧表示します。
N1-ok> show job all ジョブ ID 日時 種類 ステータス 所有者 7 2005-09-16T10:51:07-0700 検出 完了 root 6 2005-09-14T14:42:52-0700 サーバーの再起動 エラー root 5 2005-09-14T14:38:25-0700 サーバーの電源オン 完了 root 4 2005-09-14T14:29:20-0700 サーバーの電源オフ 完了 root 3 2005-09-09T13:01:35-0700 検出 実行中 root 2 2005-09-09T12:38:16-0700 検出 完了 root 1 2005-09-09T10:32:40-0700 検出 完了 root |
all オプションを指定した delete job コマンドを使用し、すべてのジョブを削除します。
N1-ok> delete job all Unable to delete job "3" |
all オプションを指定した show job コマンドを使用し、すべてのジョブが正常に削除されたかどうかを確認します。
N1-ok> show job all ジョブ ID 日時 種類 ステータス 所有者 3 2005-09-09T13:01:35-0700 検出 実行中 root |
ジョブ ID 3 はまだ実行中です。これは、delete job コマンドが実行されたときに、ジョブの状態が「実行中」であったためです。ジョブは、削除する前に実行が完了しているか停止されている必要があります。
ジョブを停止してから削除するには、まず、停止するジョブのジョブ ID を付けて stop job コマンドを使用します。
N1-ok> stop job 3 ジョブ "3" の停止要求を受け取りました。 |
show job コマンドを使用してジョブが停止されたことを確認します。
N1-ok> show job all ジョブ ID 日時 種類 ステータス 所有者 3 2005-09-09T13:02:35-0700 検出 停止 root |
ジョブは実行中に停止され、「停止」状態にあります。all オプションを指定した delete job コマンドを使用し、すべてのジョブを削除します。
N1-ok> delete job all |
show job コマンドを使用し、すべてのジョブが削除されたことを確認します。
N1-ok> show job all ジョブ ID 日時 種類 ステータス 所有者 |
N1 System Manager では、ジョブの種類ごとに重みが関連付けられます。重みは、システムリソースに対してジョブが生む負荷を反映しています。グローバルな制限によって、システムに課すことができる合計負荷が決定します。次の表は、各種ジョブ (ユーザーレベル) の重みをまとめています。最大許容負荷は 1000 です。
表 6–4 ジョブの重み値
ジョブ |
重み |
---|---|
OS 配備 |
500 |
パッケージ配備 |
500 |
パッケージのアンインストール |
500 |
検出 |
200 |
ファームウェアの配備 |
500 |
リモートコマンドの実行 |
200 |
ジョブの削除 |
400 |
OS の作成 |
1000 |
サーバーのリセット |
200 |
サーバーの電源オフ |
200 |
サーバーの電源オン |
200 |
サーバーの再表示 |
200 |
サーバー機能の設定 |
200 |
サーバーの削除 |
100 |
サーバーの追加 |
100 |
負荷総量は、実行しているすべてのジョブの負荷の合計です。システムは、次の時点で現在の負荷総量と最大許容負荷を比較します。
新しいジョブをキューに入れたあと
ジョブの実行を完了または停止したあと
現在の負荷総量と最大許容負荷との間に十分な差があり、ジョブキューの先頭にあるジョブを処理できる状態の場合、そのジョブは実行中の状態に格上げされます。そうでない場合は、待ち状態のままになります。システム上で同時に実行可能なジョブの組み合わせは、現在の負荷総量によって決まります。
たとえば、同時に実行できる OS 配備ジョブは 2 つだけです。
500 + 500 = 1000
あるいは、1 つの OS 配備ジョブと 2 つのサーバーの電源オフジョブを同時に実行できます。
500 + 200 + 200 < 1000