Sun N1 Grid Engine 6.1 ユーザーズガイド

異なるエラーコードまたは終了コードの意味

次の表に、複数のジョブ関連エラーコードまたは終了コードの意味を示します。これらのコードは、あらゆる種類のジョブに該当します。

表 7–1 ジョブ関連のエラーまたは終了コード

スクリプト/方法 

終了またはエラーコード 

意味 

Job スクリプト 

成功 

 

99 

再度キューに入れる 

 

Rest 

成功。アカウンティングファイルの終了コード 

prolog/epilog 

成功 

 

99 

再度キューに入れる 

 

Rest 

キューエラー状態。ジョブは再度キューに入れられる 

次の表に、並列環境 (PE) 構成に関連するジョブのエラーコードまたは終了コードの意味を示します。

表 7–2 並列環境関連のエラーまたは終了コード

スクリプト/方法 

終了またはエラーコード 

意味 

pe_start 

成功 

 

Rest 

キューをエラー状態に設定。ジョブは再度キューに入れられる 

pe_stop 

成功 

 

Rest 

キューをエラー状態に設定。ジョブは再度キューには入れられない 

次の表に、キュー構成に関連するジョブのエラーコードまたは終了コードの意味を示します。これらのコードは、対応メソッドが上書きされた場合だけ有効です。

表 7–3 キュー関連のエラーまたは終了コード

スクリプト/方法 

終了またはエラーコード 

意味 

ジョブ開始 

成功 

 

Rest 

成功。ほかの意味は特になし 

一時停止 

成功 

 

Rest 

成功。ほかの意味は特になし 

再開 

成功 

 

Rest 

成功。ほかの意味は特になし 

終了 

成功 

 

Rest 

成功。ほかの意味は特になし 

次の表に、チェックポイント設定に関連するジョブのエラーコードまたは終了コードの意味を示します。

表 7–4 チェックポイント設定関連のエラーまたは終了コード

スクリプト/方法 

終了またはエラーコード 

意味 

チェックポイント 

成功 

 

Rest 

成功。ただし、カーネルチェックポイントの場合、チェックポイントが成功しなかったことを意味する。 

移行 

成功 

 

Rest 

成功。ただし、カーネルチェックポイントの場合、チェックポイントが成功しなかったことを意味する。移行は行われる。 

再開 

成功 

 

Rest 

成功。ほかの意味は特になし 

後処理 

成功 

 

Rest 

成功。ほかの意味は特になし 

正常に実行されたジョブに対して、qacct -j コマンドからの出力は、「failed」フィールドに「0」を示し、「exit_status」フィールドにジョブの終了ステータスを示します。ただし、シェパードがジョブを正常に実行できない場合があります。たとえば、epilog スクリプトが失敗したり、シェパードがジョブを開始できない場合があります。このような場合、「failed」フィールドは、次の表のコードの値のいずれかを表示します。

表 7–5 qacct -j failed フィールドコード

コード 

説明 

acctvalid 

ジョブに対する意味 

No failure 

ジョブは実行され、正常に終了された 

Presumably before job 

ジョブを開始できなかった 

Before writing config 

ジョブを開始できなかった 

Before writing PID 

ジョブを開始できなかった 

On reading config file 

ジョブを開始できなかった 

Setting processor set 

ジョブを開始できなかった 

Before prolog 

ジョブを開始できなかった 

In prolog 

ジョブを開始できなかった 

Before pestart 

ジョブを開始できなかった 

10 

In pestart 

ジョブを開始できなかった 

11 

Before job 

ジョブを開始できなかった 

12 

Before pestop 

ジョブは実行され、PE 停止手続きの呼び出し前に障害が発生した 

13 

In pestop 

ジョブは実行され、PE 停止手続きで障害が発生した 

14 

Before epilog 

ジョブは実行され、epilog スクリプトの呼び出し前に障害が発生した 

15 

In epilog 

ジョブは実行され、epilog 内で障害が発生した 

16 

Releasing processor set 

ジョブは実行され、プロセッサセットは解放できなかった 

24 

Migrating (checkpointing jobs) 

ジョブは実行され、移行される予定 

25

Rescheduling 

ジョブは実行され、再スケジューリングされる予定 

26 

Opening output file 

ジョブを開始できず、stderr/stdout ファイルを開けない 

27 

Searching requested shell 

ジョブを開始できず、シェルを検出できない 

28 

Changing to working directory 

ジョブを開始できず、エラーで開始ディレクトリへ移動した 

100 

Assumedly after job 

ジョブは実行され、信号によってジョブ終了させられた。 

「コード」の列には、「failed」フィールドの値が一覧表示されています。「説明」列には、qacct -j の出力で表示されるテキストが一覧表示されています。acctvalidt に設定されている場合、ジョブアカウンティングの値は有効です。acctvalidf に設定されている場合、アカウンティングレコードのリソース使用率は有効ではありません。「ジョブに対する意味」の列では、ジョブが実行されたのかどうかが示されています。