一般的なジョブ・システムの問題

ジョブ・システムのパフォーマンスに影響する可能性のある上位の問題の一部を次に示します。

  • エージェントが停止中、不明またはブラックアウトで一時停止です
  • エージェントが過負荷になるため、ジョブの再試行が過剰になります(メトリック拡張によってこれが発生する場合が多くあります)
  • システム再試行ジョブが失敗したため、優先度ジョブが不足しています
  • リポジトリ・バックグラウンド・プロセスのデッドロックのためDBセッションがハングしました
  • OMS UIコンソールからPBSへの通信エラー
  • メトリックしきい値設定が正しくないため、修正処理が頻繁にトリガーされます
  • ユーザーが一時停止したジョブによって、リソースがロックされています
  • 長時間実行中のジョブが共通ジョブ・システム・リソースをブロックしているため、新規ジョブの実行が妨げられています
  • キューの先頭のスタックによるジョブ・バックログ

ジョブ診断ダッシュボードを使用すると、管理者は前述の問題を簡単に特定し、根本原因を診断して適切な処理を実行できます。