このリリースの Sun N1 Grid Engine 6.1 ソフトウェアには、次のような制限があります。
sge_qmaster のスタックサイズは 16M バイトに設定する必要があります。次のアーキテクチャーにおいてスタックサイズをデフォルト値のままにしておくと、sge_qmaster が実行できないことがあります。IBM AIX および HP/UX 11。
sge_qmaster デーモンを実行するように指定されたホスト上のカーネル構成で、ファイル記述子の制限を高めに設定してください。同様に、シャドウマスターホストに対してファイル記述子の制限を高めに設定することもできます。数多くのファイル記述子を利用できるようにしておくと、通信システムは接続を開いたままにしておくことができ、ファイル記述子を何度も閉じたり開いたりする必要がなくなります。実行ホストが多い場合、ファイル記述子の制限を高く設定しておくと、パフォーマンスは大幅に向上します。ファイル記述子の制限は、実行ホストの予定数よりも多く設定します。また、並行クライアント要求 (特に、qsub -sync で発行されるジョブ) のために、あるいは、DRMAA セッションを実行してマスターデーモンとの通信接続を安定させるために、この制限にはさらに余裕を持たせておく必要があります。ファイル記述子の制限を設定する方法については、オペレーティングシステムのマニュアルを参照してください。
並行動的イベントクライアントの数は、ファイル記述子の数によって制限されます。デフォルトは 99 です。動的イベントクライアントとは、qsub -sync コマンドと DRMAA セッションで発行されるジョブのことです。動的イベントクライアントの数は、グローバルクラスタ構成の qmaster_params パラメータで制限できます。このパラメータは MAX_DYN_EC= n に設定します。詳細は、sge_conf(5) のマニュアルページを参照してください。
ARCo モジュールは、Solaris SPARC、Solaris SPARC 64 ビット、Solaris x86、Solaris x64、Linux x86、および Linux 64 ビットカーネルでのみ使用できます。
現在のリリースでは、ARCo に付属する定義済みクエリーの数は限定的です。将来のリリースでは、より多くの定義済みクエリーが付属する予定です。
リソースの予約において、リソースの量に INFINITY を要求するジョブは正しく処理されません。特定のリソースに対して明示的な要求が行われていない場合、デフォルトで INFINITY が要求されることがあります。したがって、リソースの予約において、すべてのリソースの量を明示的に指定することが重要です。
リソースの予約で考慮されるジョブは、現在のところ、保留中のジョブだけです。結果として、発行オプション -a time と -hold_jid joblist のためにホールド状態 であるが保留中ではないジョブは予約されません。このようなジョブは、発行オプション -R n が指定されているように処理されます。
Berkeley DB では、Solaris 10 で qmaster を実行しない場合および NFSv4 マウントを使用する場合は、データベースファイルがローカルディスクに存在する必要があります。ほかのベンダー製の NFSv4 完全準拠のクライアントおよびサーバーもサポートされていますが、テストはされていません。スプーリングデータを格納するファイルサーバー上で sge_qmaster を実行できない場合 (たとえば、シャドウマスター機能を使用する場合) には、Berkeley DB の RPC サーバーを使用できます。この RPC サーバーはファイルサーバー上で動作し、Berkeley DB の sge_qmaster インスタンスと接続します。ただし、Berkeley DB の RPC サーバーがこの通信に使用するプロトコルは安全でないため、セキュリティー上の問題が発生します。セキュリティーが重要なサイトでは、この RPC サーバーを使用してはなりません。その代わりに、スプーリング用には sge_qmaster ローカルディスクを使用して、フェイルオーバー用には Sun Cluster のような 高可用性ソリューションを使用します。そしてフェイルオーバーが発生しても、ホストのローカルのファイルにアクセスできるようにします。
大きなアレイタスク番号を使用すると QMON がビジーになります。大きなアレイタスク番号を使用した場合、QMON の Job Control ダイアログボックスのカスタマイズにおいて「compact job array display」を使用する必要があります。そうでないと、QMON の GUI によって CPU の負荷が高くなり、パフォーマンスが低下します。
自動インストールオプションは、インストールに失敗した場合に完全な診断情報を提供しません。インストールプロセスが中断した場合、qmaster-spool-dir/install_ hostname_timestamp.log または /tmp/install.pid にあるインストールログファイルの存在とその内容をチェックしてください。
IBM AIX、HP/UX 11、および SGI IRIX 6.5 システムでは、sge_qmaster、 spooldefaults、および spoolinit 用に 2 つの異なるバイナリが提供されています。これらのバイナリの 1 つは Berkeley DB のスプーリング方式用であり、ほかのバイナリは従来のスプーリング方式用です。これらのバイナリの名前は binary.spool_db と binary.spool_classic です。
希望のスプーリング方式に変更するには、マスターホストをインストールする前に、これらのシンボリックリンクを変更します。次のコマンドを実行します。
# cd sge-root/bin/arch # rm sge_qmaster # ln -s sge_qmaster.spool_classic sge_qmaster # cd sge-root/utilbin/arch # rm spooldefaults spoolinit # ln -s spooldefaults.spool_classic spooldefaults # ln -s spoolinit.spool_classic spoolinit |
デフォルトの Mac OS X インストールには、QMON が必要とする OpenMotif ライブラリが含まれません。PowerPC および x86 アーキテクチャー用 OpenMotif ライブラリは、http://dryden.biol.yorku.ca/macosx/ などのさまざまな Web サイトから入手できます。
ARCo の PDF エクスポートには多くのメモリーが必要です。非常に大きなレポートを PDF にエクスポートすると、OutOfMemoryException が発生することがあります。
回避策 – Sun Java Web コンソールの JVM ヒープサイズを増やします。次のコマンドは最大ヒープサイズを 512M バイトに設定します。
# smreg add -p java.options="... -Xmx512M ..."
このコマンドで変更した値を有効にするには、Sun Java Web コンソールを再起動する必要があります。
# smcwebserver restart
Solaris SPARC 64 ビット、Solaris x64、および Linux 64 ビットカーネルでは、ARCo の一部である DBWriter を動作させるためには、64 ビットの Java 仮想マシンのサポートをインストールする必要があります。
DRMAA を使用して Java バインドを使用する場合は、LD_LIBRARY_PATH が正しく設定されていることを確認してください。
32 ビット Java 仮想マシン (JVM) を使用する場合は、実際にはアプリケーションが 64 ビットオペレーティングシステムプラットフォームで実行される場合でも、$SGE_ROOT/lib/sol-sparc などの LD_LIBRARY_PATH に 32 ビット共有 DRMAA ライブラリを設定します。
N1 Grid Engine 6.1 version の drmaa.jar ファイルは、以前の drmaa.jar ファイルと互換性がありません。古い drmaa.jar ファイルは、 drmaa-0.5.jar という名前に変更されています。
CSP を使用せずに十分な機能を持つ自動インストールを行うには、rsh または ssh によるリモートログインに対し、パスワードを要求せずに root ユーザー権限を付与する必要があります。これにより、インストールスクリプトはリモートホストでインストールを開始できます。この設定が正しく行われていない場合、実行ホストごとにログインし、次のコマンドを使用して自動インストールを手動で実行する必要があります。
inst_sge -x -auto <conf-file> -noremote |
ローカルの execd スプールディレクトリを使用すると、自動インストールで問題が起きます。ローカルの execd スプールディレクトリは、ローカルハードディスク上に定義されています。それらローカル execd スプールディレクトリを使用すると、自動インストールがハングアップすることがあります。