Sun Cluster Data Service for Sun Grid Engine ガイド (Solaris OS 版)

Sun Cluster HA for Sun Grid Engine の概要

Sun Grid Engine は分散型リソース管理プログラムであり、複数のジョブを複数のマシンで同時に実行します。マシンの障害による作業の損失を最小限に抑えるため、管理層のノードを障害から保護する必要があります。しかし、グリッド内にある個々の実行ノードは障害から保護する必要はありません。グリッド内にある個々の実行ノードに障害が発生しても、作業の損失は小さいためです。

Sun Grid Engine システムの管理層でのシングルポイント障害を排除するために、Sun Cluster HA for Sun Grid Engine は、次の Sun Grid Engine デーモンに障害監視および自動障害回復を提供します。

Sun Cluster HA for Sun Grid Engine はフェイルオーバーサービスとして構成する必要があります。

フェイルオーバーデータサービスやスケーラブルデータサービスの概念については、Sun Cluster の概念 (Solaris OS 版)を参照してください。

管理層は Sun Grid Engine ファイルシステムに依存するため、このファイルシステムをエクスポートする NFS サーバーも障害から保護する必要があります。NFS サーバーのシングルポイント障害を排除するには、Sun Cluster HA for NFS データサービスを使用します。このデータサービスについての詳細は、Sun Cluster Data Service for Network File System (NFS) ガイド (Solaris OS 版)を参照してください。

Sun Grid Engine の各コンポーネントが Sun Cluster に構成されている場合、それらのコンポーネントは各自のデータサービスによって保護されます。次の表を参照してください。

表 1–1 Sun Cluster データサービスによる Sun Grid Engine コンポーネントの保護

Sun Grid Engine コンポーネント 

データサービス 

Sun Grid Engine のデーモン 

  • 通信デーモン (sge_commd)

  • 待ち行列マスターデーモン (sge_qmaster)

  • スケジューリングデーモン (sge_schedd)

Sun Cluster HA for Sun Grid Engine 

リソースタイプは SUNW.gds です。

ネットワークファイルシステム (NFS) サーバー 

Sun Cluster HA for NFS 

リソースタイプは SUNW.nfs です。