この章では、グリッドを構成するホストに関する情報を表示する方法について説明します。すべてのホストのパフォーマンス、および特定のホストに関する詳細情報を表示できます。
「ホスト」ページでは、ホストの資源の使用効率を確認できます。また、このページから、ホスト自体に関する詳細情報を表示することもできます。
「ホスト」表のフィールドには、次の意味があります。
ホスト名 – このホストに割り当てた名前です。ホスト名をクリックすると、「ホストの詳細」ページに詳細情報が表示されます。
Arch – ホストのプロセッサアーキテクチャーです (win32-x86、sol-sparc64 など)。サポートされているアーキテクチャーの一覧については、「ホストの詳細」ページを参照してください。
平均負荷/CPU – ホストの CPU の使用効率を示します。このパラメータは任意の正の 10 進数ですが、通常はゼロから 2 または 3 の間です。この値は 1 に近い数字であるべきです。1 より小さい値はホストが活用されていないことを示し、1 より大きい値はホストが過度に使用されていることを示します。理想の値は、実行されている作業負荷によって異なります。作業負荷の意味を本当に理解できるのはローカルの管理者だけです。
使用メモリー容量 – メモリーの合計容量に対する、ジョブの実行に現在使用されているメモリーの割合 (%) です。この値がメモリーの合計容量に近すぎる場合は、ホストは危険な状態である可能性があります。ただし、サーバーに合わせて作業負荷を調整すれば、メモリーの使用容量がメモリーの合計容量に近くてもかまいません。これは実際に調整可能です。この 2 つのパラメータの差が特定の値になるとアラームが発生するように設定できます。したがって、たとえば、差が 100M バイト未満になると警告が発生するようにしたり、25M バイト未満になると警告が発生するようにしたりできます。
総メモリー容量 – このホストのメモリーの合計容量です。
空きスワップ – このホストに残っている空きスワップ空間 (M バイト単位) です。優れたアーキテクチャーのグリッドでは、空きスワップ空間が初期値から大幅に下がることはありません。グリッドのアーキテクチャーによっては、この値の一時的な減少は許容できます。この値がゼロに近くなった場合は、ホストは完全に機能しなくなる可能性があります。
「ホストの詳細」ページには、ジョブの実行を助け、キューのホストとして機能するホストシステムに関する詳細情報が表示されます。
「ホストの詳細」ページには、次の情報が表示されます。
ホスト名 – このホストに割り当てた名前です。
Arch – cod_execd にコンパイルされたアーキテクチャー文字列です。execd が対象とするオペレーティングシステムアーキテクチャーを示します。次に有効な値を示します。
sol-sparc – Sun Solaris (Sparc) 7 以降、32 ビットカーネル
sol-sparc64 – Sun Solaris (Sparc) 7 以降、64 ビットカーネル
sol-x86 – Sun Solaris (x86) 8 以降
x24-amd64 – Linux 2.4.x (AMD64) glibc 2.2+ ベース
lx24-x86 – Linux 2.4.x (x86) glibc 2.2+ ベース
win-x86 – MS-Windows NT
特定のアーキテクチャー用の sge_execd デーモンを複数の OS バージョンで実行することはできますが、アーキテクチャー文字列はこのレベルの詳細は示しません。
プロセッサ数 – 実行ホストのプロセッサ数です。この場合、ホストは単一のインターネットアドレスで定義されます。たとえば、ラック型多重ホストシステムは、1 台のマルチヘッドマシンではなく、クラスタとして数えられます。
負荷平均 – 「負荷 (中)」と同じです。
負荷 (小) – 短時間の平均 OS 実行キューの長さです。この値は、uptime コマンドで表示される 3 つの値のうち、最初の値です。多くの実装では、1 分間の平均が表示されます。
負荷 (中) – 中期の平均 OS 実行キューの長さです。この値は、uptime コマンドで表示される 3 つの値のうち、2 番目の値です。多くの実装では、5 分間の平均が表示されます。
負荷 (大) — 長時間の平均 OS 実行キューの長さです。この値は、uptime コマンドで表示される 3 つの値のうち、3 番目の値です。多くの実装では、10 または 15 分間の平均が表示されます。
NP 負荷平均 – 「負荷 (中)」と同じです。
NP 負荷 (小) – 「負荷 (小)」と同じですが、プロセッサ数で割ったものです。この値によって、シングルヘッドとマルチヘッドのホストの負荷を比較できます。
NP 負荷 (中) – 「負荷 (中)」と同じですが、プロセッサ数で割ったものです。この値によって、シングルヘッドとマルチヘッドのホストの負荷を比較できます。
NP 負荷 (大) – 「負荷 (大)」と同じですが、プロセッサ数で割ったものです。この値によって、シングルヘッドとマルチヘッドのホストの負荷を比較できます。
空きメモリー容量 – メモリーの空き容量です。
使用メモリー容量 – メモリーの使用容量です。
総メモリー容量 – メモリーの合計容量です (空き容量と使用容量の合計)。
スワップ空き容量 – スワップメモリーの空き容量です。
スワップ使用量 – スワップ空間の使用容量です。
総スワップ – スワップ空間の合計容量です (空き容量と使用容量の合計)。
空き仮想メモリー – 「空きメモリー容量」と「スワップ空き容量」の合計です。
使用仮想メモリー – 「使用メモリー容量」と「スワップ使用量」の合計です。
総仮想メモリー – 「総メモリー容量」と「総スワップ」の合計です。
CPU – データ収集時点での CPU に対する CPU ビジー時間の割合 (%) です。
日付/時刻 – データ収集時点のタイムスタンプです。
実行ホストのパラメータの設定については、docs.sun.com にある『N1 Grid Engine 管理ガイド』の「QMON を使用した実行ホストの構成」を参照してください。