Sun Cluster 3.0 U1 データサービスのインストールと構成

第 1 章 Sun Cluster データサービスの計画

この章では、Sun Cluster データサービスのインストールと構成を計画するにあたってのガイドラインを説明します。

この章の内容は次のとおりです。

データサービス、リソースタイプ、リソースグループについての概念的な情報については、『Sun Cluster 3.0 U1 の概念』を参照してください。

Sun Cluster データサービスとして現在提供されていないアプリケーションについては、『Sun Cluster 3.0 U1 データサービス開発ガイド』を参照してください。アプリケーションを高可用性データサービスとして構成する方法について説明されています。

Sun Cluster データサービスのインストールと構成作業

表 1-1 に、Sun Cluster データサービスのインストールと構成について説明している章を示します。

表 1-1 作業マップ: Sun Cluster データサービスのインストールと構成


作業	参照箇所
Sun Cluster HA for Oracle データサービスのインストールと構成	第 2 章「Sun Cluster HA for Oracle のインストールと構成」
Sun Cluster HA for iPlanet Web Server データサービスのインストールと構成	第 3 章「Sun Cluster HA for iPlanet Web Server のインストールと構成」
Sun Cluster HA for Netscape LDAP データサービスのインストールと構成	第 4 章「Sun Cluster HA for Netscape Directory Server のインストールと構成」
Sun Cluster HA for Apache データサービスのインストールと構成	第 5 章「Sun Cluster HA for Apache のインストールと構成」
Sun Cluster HA for Domain Name Service (DNS) データサービスのインストールと構成	第 6 章「Sun Cluster HA for Domain Name Service (DNS) のインストールと構成」
Sun Cluster HA for Network File System (NFS) データサービスのインストールと構成	第 7 章「Sun Cluster HA for Network File System (NFS) のインストールと構成」
Sun Cluster HA for Oracle Parallel Server データサービスのインストールと構成	第 8 章「Sun Cluster HA for Oracle Parallel Server のインストールと構成」
Sun Cluster HA for SAP データサービスのインストールと構成	第 9 章「Sun Cluster HA for SAP のインストールと構成」
Sun Cluster HA for Sybase ASE データサービスのインストールと構成	第 10 章「Sun Cluster HA for Sybase ASE のインストールと構成」
データサービスリソースの管理	第 11 章「データサービスリソースの管理」

Sun Cluster データサービスの構成ガイドライン

この節では、Sun Cluster データサービスを構成するためのガイドラインを説明します。

アプリケーションバイナリの格納先の決定

アプリケーションソフトウェアおよびアプリケーション構成ファイルは、次のいずれかの場所にインストールできます。

各クラスタノードのローカルディスク-クラスタノードごとにソフトウェアと構成ファイルを置いた場合には、アプリケーションソフトウェアを後でアップグレードするときに、クラスタを停止せずに行えるという利点があります。ただし、ソフトウェアや構成ファイルの異なるコピーが存在するため、保守や管理をするファイルが増えるという欠点があります。
クラスタファイルシステム-アプリケーションバイナリをクラスタファイルシステムに格納した場合、保守や管理をするコピーが 1 つだけになります。ただし、アプリケーションソフトウェアをアップグレードするためには、クラスタ全体でデータサービスを停止する必要があります。アップグレード時に多少の時間停止できるようであれば、アプリケーションおよび構成ファイルの 1 つのコピーをクラスタファイルシステムに格納するようにしてください。

クラスタファイルシステムの作成については、『Sun Cluster 3.0 U1 ソフトウェアのインストール』の計画に関する章を参照してください。

`nsswitch.conf` ファイルの内容の確認

nsswitch.conf ファイルは、ネームサービスの検索用の構成ファイルです。このファイルは次の情報を指定します。

ネームサービスの検索に使用する Solaris 環境内のデータベース
データベースの検索順序

一部のデータサービスについては、「group」検索の対象をまず「files」に変更してください。これらのデータサービスは、nsswitch.confファイル内の「group」行を変更し、「files」エントリが最初にリストされるようにします。「group」行を変更するかどうかを判断するには、構成するデータサービスに関する章を参照してください。

Sun Cluster 環境の nsswitch.conf ファイルの構成方法については、『Sun Cluster 3.0 U1 ソフトウェアのインストール』の計画に関する章を参照してください。

クラスタファイルシステムの構成の計画

データサービスによっては、Sun Cluster の要件を満たす必要があります。特別な検討事項が必要かどうかを判断するには、そのデータサービスに関する章を参照してください。

クラスタファイルシステムの作成については、『Sun Cluster 3.0 U1 ソフトウェアのインストール』の計画に関する章を参照してください。

リソースグループとディスクデバイスグループの関連性

Sun Cluster は、ディスクデバイスグループとリソースグループに関し、ノードリストという概念を持っています。ノードリストには、ディスクデバイスグループまたリソースグループの潜在的マスターであるノードが順にリストされています。ダウンしていたノードがクラスタに再結合し、そのノードがノードリストで現在の主ノードより前にきたときにどうなるかは、「フェイルバックポリシー」の設定によって異なります。フェイルバックが True に設定されていると、デバイスグループまたはリソースグループが現在の主ノードから、再結合したノードに切り替えられ、このノードが新しい主ノードになります。

フェイルオーバーリソースグループの高可用性を保証するには、そのグループのノードリストと関連するディスクデバイスグループのノードリストとを一致させます。スケーラブルリソースグループの場合、そのリソースグループのノードリストは必ずしもデバイスグループのノードリストと一致するとは限りません。これは、現段階では、デバイスグループのノードリストには 2 つのノードしか含むことができないためです。2 ノードを超えるクラスタの場合は、スケーラブルリソースグループのノードリストに、3 ノード以上を含むことができます。

たとえば、ノード phys-schost-1 と phys-schost-2 が含まれるノードリストを持つ、ディスクデバイスグループ disk-group-1 があるとします。このノードリストとフェイルバックポリシーは Enabled に設定されています。さらに、アプリケーションデータの保持に disk-group-1 を使用する resource-group-1 というフェイルオーバーリソースグループも持っているとします。このような場合は、resource-group-1 を設定するときに、リソースグループのノードリストに phys-schost-1 と phys-schost-1 も指定し、フェイルバックポリシーを True に設定します。

スケーラブルリソースグループの高可用性を保証するためには、そのスケーラブルサービスグループのノードリストをディスクデバイスグループのノードリストのスーパーセットにします。スーパーセットにすることで、ディスクに直接接続されるノードは、スケーラブルリソースグループを実行するノードになります。この利点は、データに接続されている少なくとも 1 つのクラスタノードがクラスタで起動されているときに、スケーラブルリソースグループがこれらと同じノード上で実行されても、スケーラブルサービスは利用できることです。

ディスクデバイスグループの設定については、『Sun Cluster 3.0 U1 ソフトウェアのインストール』を参照してください。ディスクデバイスグループとリソースグループの関連性については、『Sun Cluster 3.0 U1 の概念』を参照してください。

`SUNW.HAStorage` リソースタイプ

リソースタイプの SUNW.HAStorage は、次の機能を提供します。

SUNW.HAStorage リソースを含む同じリソースグループ内の他のリソースの START メソッドを、ディスクデバイスリソースが利用可能になるまで待機させることで、ディスクデバイスとリソースグループの起動順序を調整します。
AffinityOn を True に設定することで、リソースグループとディスクデバイスグループを同一ノード上におき、ディスクに負荷がかかることの多いデータサービスのパフォーマンスを向上します。

注 -

SUNW.HAstorage リソースがオンラインの間にデバイスグループが別のノードに切り替えられた場合、AffinityOn の設定は無視され、リソースグループはデバイスグループと共に別のノードに移行することはありません。一方、リソースグループが別のノードに切り替えられた場合には、AffinityOn が True に設定されていれば、デバイスグループは、リソースグループとともに新しいノードに切り替えられます。

推奨事項

データサービスリソースグループ内に SUNW.HAStorage リソースを作成するかどうかを判断するには、次のことを検討してください。

データサービスリソースグループがノードリストを持っており、その一部のノードが記憶装置に直接接続されていない場合は、リソースグループ内で SUNW.HAStorage リソースを構成し、他のデータサービスリソースの依存性を SUNW.HAStorage に設定する必要があります。これは、記憶装置とデータサービス間で起動順序を調整するためのものです。
Sun Cluster HA for Oracle や Sun Cluster HA for NFS データサービスなど、ディスクに負荷がかかることの多いデータサービスを使用する場合は、SUNW.HAStorage リソースをデータサービスリソースグループに追加し、データサービスリソースの依存性を SUNW.HAStorage に設定し、AffinityOn を True に設定します。この手順を行うことで、リソースグループとディスクデバイスグループが同一ノード上に置かれます。
一方、必要なファイルを起動時に読み込むデータサービスのように (たとえば、Sun Cluster HA for DNS データサービス)、ディスクに負荷があまりかからない場合は、SUNW.HAStorage リソースタイプの設定は任意です。
クラスタに含まれるのが 2 ノードだけの場合は、SUNW.HAStorage リソースタイプの設定は任意です。ただし、後でノードを追加してスケーラブルサービスを実行する予定の場合には、SUNW.HAStorage リソースタイプを設定する必要があります。このための準備として SUNW.HAStorage リソースタイプの設定をしておき、後でノードリストにノードを追加します。

特定の推奨事項については、このマニュアルのデータサービスに関する各章を参照してください。

「新しいリソース用に SUNW.HAStorage リソースタイプを設定する」の設定方法については、「新しいリソース用に SUNW.HAStorage リソースタイプを設定する」を参照してください。詳細は、SUNW.HAStorage(5) のマニュアルページを参照してください。

ノードリストプロパティ

データサービスを構成するときに、3 つのノードリストを指定できます。

installed_nodes - リソースタイプのプロパティ。このプロパティには、リソースタイプがインストールされ、そこで実行が可能になるクラスタノード名の一覧が含まれます。
nodelist - リソースグループのプロパティ。優先順位に基づいて、グループをオンラインにできるクラスタノード名の一覧が含まれます。これらのノードは、リソースグループの潜在的な主ノードまたはマスターノードになります。フェイルオーバーサービスについては、リソースグループノードリストを 1 つだけ設定します。スケーラブルサービスの場合は、2 つのリソースグループを設定するため、ノードリストも 2 つ必要になります。一方のリソースグループとノードリストには、共有アドレスをホストするノードが含まれます。このリソースグループとノードリストは、スケーラブルリソースが依存するフェイルオーバーリソースグループになります。もう一方のリソースグループとノードリストには、アプリケーションリソースをホストするノードの一覧が含まれます。アプリケーションリソースは、共有アドレスに依存します。共有アドレスを含むリソースグループ用のノードリストは、アプリケーションリソース用のノードリストのスーパーセットになる必要があるためです。
auxnodelist - 共有アドレスリソースのプロパティ。このプロパティは、クラスタノードを識別する物理ノード ID の一覧が含まれます。このクラスタノードは共有アドレスをホストできますが、フェイルオーバー時に主ノードになることはありません。これらのノードは、リソースグループのノードリストで識別されるノードとは、相互に排他的な関係になります。このノードリストは、スケーラブルサービスにのみ適用されます。詳細は、scrgadm(1M) のマニュアルページを参照してください。

インストールと構成プロセスの概要

データサービスをインストールして構成するには、次の手順を使用します。

Sun Cluster Agents CD からデータサービスパッケージをインストールする。
クラスタ環境で実行するアプリケーションをインストールして構成する。
データサービスが使用するリソースおよびリソースグループを構成する。データサービスを構成するときは、Resource Group Manager (RGM) によって管理される、リソースタイプ、リソース、リソースグループを指定します。これらの手順は、各データサービスに関する章で説明されています。

データサービスのインストールと構成を開始する前に、『Sun Cluster 3.0 U1 ソフトウェアのインストール』を参照してください。このマニュアルには、データサービスソフトウェアパッケージのインストール方法、ネットワークリソースが使用するネットワークアダプタフェイルオーバー (NAFO) グループの構成方法についての説明があります。

注 -

SunPlex Manager では、次のデータサービス、Sun Cluster HA for Oracle、Sun Cluster HA for iPlanet Web Server、Sun Cluster HA for Netscape Directory Server、Sun Cluster HA for Apache、Sun Cluster HA for DNS、および、Sun Cluster HA for NFS のインストールと構成を行うことができます。詳細は、SunPlex Manager のオンラインヘルプを参照してください。

インストールと構成の作業の流れ

表 1-2 に、Sun Cluster フェイルオーバーデータサービスのインストールおよび構成作業と、その手順が説明されている参照先を示します。

表 1-2 作業マップ: Sun Cluster データサービスのインストールと構成


作業	参照箇所
Solaris と Sun Cluster ソフトウェアのインストール	『Sun Cluster 3.0 U1 ソフトウェアのインストール』
NAFO グループの設定	『Sun Cluster 3.0 U1 ソフトウェアのインストール』
多重ホストディスクの設定	『Sun Cluster 3.0 U1 ソフトウェアのインストール』
リソースとリソースグループの計画	『 Sun Cluster 3.0 U1 ご使用にあたって』
アプリケーションバイナリの格納先の決定 (`nsswitch.conf` の構成)	第 1 章「Sun Cluster データサービスの計画」
アプリケーションソフトウェアのインストールと構成	データサービスに関する各章
データサービスソフトウェアパッケージのインストール	『Sun Cluster 3.0 U1 ソフトウェアのインストール』、データサービスに関する各章
データサービスの登録と構成	データサービスに関する各章

例

この節では、高可用性フェイルオーバーデータサービスとして設定されている Oracle アプリケーション用に、リソースタイプ、リソース、リソースグループを設定する方法を紹介します。

この例とスケーラブルデータサービスの例では、ネットワークリソースを含むフェイルオーバーリソースグループが異なります。さらに、スケーラブルデータサービスには、アプリケーションリソースごとに別のリソースグループ (スケーラブルリソースグループ) が必要です。

Oracle アプリケーションは、サーバーとリスナーの 2 つのコンポーネントを持ちます。Sun Cluster HA for Oracleis データサービスは、Sun が提供しているので、これらのコンポーネントは、すでに Sun Cluster リソースタイプにマップされています。これら両方のリソースタイプが、リソースとリソースグループに関連付けられます。

この例は、フェイルオーバーデータサービスの例なので、論理ホスト名ネットワークリソースを使用し、主ノードから二次ノードにフェイルオーバーする IP アドレスを使用します。フェイルオーバーリソースグループに論理ホスト名リソースを入れ、Oracle サーバーリソースとリスナーリソースを同じリソースグループに入れます。この順に入れることで、フェイルオーバーを行うすべてのリソースが 1 つのグループになります。

Sun Cluster HA Oracle データサービスをクラスタで実行するには、次のオブジェクトを定義する必要があります。

LogicalHostname リソースタイプ ― このリソースタイプは組み込まれているため、明示的に登録する必要はありません。
Oracle リソースタイプ ― Sun Cluster HA for Oracle データサービスは、2 つの Oracle リソースタイプ (データベースサーバーとリスナー) を登録します。
論理ホスト名リソース ― これらのリソースは、ノードで障害が発生した場合にフェイルオーバーする IP アドレスをホストします。
Oracle リソース ― Sun Cluster HA for Oracle データサービス用に、2 つのリソースインスタンス (サーバーとリスナー) を指定する必要があります。
フェイルオーバーリソースグループ ― 1 つのグループでフェイルオーバーを行う、Oracle サーバーとリスナー、および論理ホスト名リソースで構成されています。

データサービスリソースを管理するためのツール

この節では、インストールや構成の作業に使用するツールについて説明します。

SunPlex Manager のグラフィカルユーザーインタフェース (GUI)

SunPlex Manager は Web ベースのツールです。このツールでは、次の作業を行うことができます。

クラスタのインストール
クラスタの管理
リソースやリソースグループの作成と構成
Sun Cluster ソフトウェアを使ったデータサービスの構成

SunPlex Manager を使ってクラスタソフトウェアをインストールする手順については、『Sun Cluster 3.0 U1 ソフトウェアのインストール』を参照してください。SunPlex Manager のオンラインヘルプには、ほとんどの管理作業の説明が載っています。

Sun Management Center GUI 向けの Sun Cluster モジュール

Sun Management Center GUI からクラスタを監視したり、リソースやリソースグループの作成や削除を行うには、Sun Cluster モジュールが必要です。Sun Cluster モジュールのインストール要件やインストール手順については、『Sun Cluster 3.0 U1 ソフトウェアのインストール』を参照してください。Sun Management Center の詳細は、http://docs.sun.comにある Sun Management Center ソフトウェアのマニュアルを参照してください。

`scsetup` ユーティリティ

Tscsetup ユーティリティは、Sun Cluster の一般的な管理に使用するメニュー駆動型のインタフェースです。このユーティリティは、さらに、データサービスのリソースやリソースグループの構成にも使用できます。この場合には、scsetup のメインメニューからオプション 2 を選択して、「Resource Group Manager」というサブメニューを起動してください。

`scrgadm` コマンド

scrgadm コマンドにより、データサービスリソースの登録や構成を行うことができます。この手順については、このマニュアルの該当する各章に記載されているデータサービスの登録と構成の項を参照してください。たとえば、Sun Cluster HA for Oracle データサービスを使用する場合には、「Sun Cluster HA for Oracle を登録して構成する」を参照してください。第 11 章「データサービスリソースの管理」にも、scrgadm コマンドを使ってデータサービスリソースを管理する方法が記載されています。さらに、scrgadm(1M) のマニュアルページも参照してください。

データサービスリソースの管理作業

次の表に、データサービスリソースの管理作業に使用できるツール (コマンド行以外の) を示します。これらの作業の詳細や、関連する手順をコマンド行から行う方法については、第 11 章「データサービスリソースの管理」を参照してください。

表 1-3 データサービスリソースの管理作業に使用できるツール


作業	SunPlex Manager	Sun Management Center	`scsetup`ユーティリティ
リソースタイプを登録する	可	不可	可
リソースグループを作成する	可	可	可
リソースをリソースグループに追加する	可	可	可
リソースグループをオンラインにする	可	可	不可
リソースグループを削除する	可	可	不可
リソースを削除する	可	可	不可
リソースグループの現在の主ノードを切り替える	可	不可	不可
リソースを無効にする	可	可	不可
無効なリソースのリソースグループを非管理状態にする	可	不可	不可
リソースタイプ、リソースグループ、リソース構成の情報を表示する	可	可	不可
リソースプロパティを変更する	可	不可	不可
リソースの `STOP_FAILED` エラーフラグを消去する	可	不可	不可
ノードをリソースグループに追加する	可	不可	不可

Sun Cluster データサービスの障害モニター

この節では、データサービス障害モニターの一般的な事項について説明します。Sun が提供するデータサービスには、パッケージに組み込まれている障害モニターがあります。障害モニター (または障害検証機能) は、データサービスの状態を検証するプロセスです。

障害モニターの呼び出し

障害モニターは、リソースグループとそのリソースをオンラインにしたときに、RGM によって呼び出されます。この呼び出しによって、RGM はそのデータサービスの MONITOR_START メソッドの呼び出しを内部で行います。

障害モニターは、次の 2 つの機能を実行します。

データサービスのサーバープロセスまたはプロセスの異常終了の監視
データサービスの状態の検査

サーバープロセスの異常終了の監視

プロセスモニター (PMF: Process Monitor Facility) は、データサービスプロセスを監視します。

データサービスの障害検証は、無限ループで実行され、 Thorough_probe_interval リソースプロパティによって設定された調整可能な期間に休止状態 (スリープ) になります。休止している間に、検証機能はプロセスが終了したかどうかについて PMF により検査します。サーバープロセスが終了した場合は、その後、検証機能はデータサービスの状態を「Service daemon not running」で更新し、操作を実行します。実行する操作には、データサービスをローカルで再起動する、または二次クラスタノードにデータサービスをフェイルオーバーするなどが含まれます。検証機能は、そのデータサービスアプリケーションリソースの Retry_count および Retry_interval リソースプロパティで設定されている値を調べ、データサービスを再起動するか、フェイルオーバーするかどうかを決定します。

データサービスの状態の検査

通常、検証機能とデータサービスとの間の通信は、専用のコマンドまたは指定したデータサービスポートとの正常な接続によって行われます。

検証機能は主に以下のことを行います。

休止します (Thorough_probe_interval)。
タイムアウトプロパティ Probe_timeout で状態検査を実行します。Probe_timeoutは、ユーザーが設定可能な各データサービスのリソース拡張プロパティです。
手順 2 を実行し、サービスの状態に異常がなければ、正常/異常の履歴を更新します。Retry_interval リソースプロパティに設定されている値よりも古い履歴を消去 (パージ) することで、正常/異常の履歴を更新します。検証機能は、リソースの状態メッセージを「Service is online」に設定し、手順 1 に戻ります。

手順 2 の結果、サービスの状態に異常があれば、検証機能は異常履歴を更新します。その後、状態検査に失敗した総数を計算します。

状態検査の結果は、致命的な異常から正常までの範囲があります。結果の判断は、個々のデータサービスに依存します。たとえば、検証機能が正常にサーバーに接続でき、ハンドシェイクメッセージをサーバーに送信することはできるにも関わらず、タイムアウト前に一部の応答しか受け取ることができない場合を考えてみます。これは、システムの過負荷の結果、最も発生する可能性があることです。サービスの再起動など、操作を何か実行すると、クライアントはそのサービスに再び接続するため、さらにシステムの負荷が増大します。このような場合に、データサービスの障害モニターが、この「一部」の異常を致命的なものとして扱わないようにします。代わりに、モニターは、サービスの致命的ではない検証としてこの異常を追跡します。これらの一部の異常は、Retry_interval プロパティによって指定された期間、累積されます。

ただし、検証機能がまったくサーバーに接続できない場合は、致命的な異常であると認識されます。一部の異常が、断片的な量によって異常カウントの増加につながります。致命的な異常、または一部の異常の累積のいずれかによって、異常カウントが合計カウントに到達するたびに、検証機能はデータサービスの再起動またはフェイルオーバによってこの状況を修正しようとします。
手順 3 (履歴期間内での異常の数)での計算の結果、Retry_count リソースプロパティの値よりも少ない場合は、検証機能は、状況をローカルで修正しようとします (たとえば、サービスの再起動)。検証機能は、リソースの状態メッセージを「Service is degraded」に設定し、手順 1 に戻ります。
Retry_interval で指定した期間内で発生した異常の数が Retry_count の値を超える場合、検証機能は、scha_control を「giveover」オプション付きで呼び出します。このオプションは、サービスのフェイルオーバーを要求します。この要求によって異常が修正されると、このノードでの障害モニターが停止されます。検証機能は、リソースの状態メッセージを「Service has failed」に設定します。
さまざまな理由により、前の手順で発行された scha_control 要求が Sun Cluster によって拒否されることがあります。この理由は、scha_control のリターンコードで識別できます。検証機能は、リターンコードを調べます。scha_control が拒否される場合、検証機能は異常/正常履歴をリセットし、新たに開始します。検証機能が履歴をリセットするのは、異常の数がすでに Retry_count を超えているため、障害モニターが各後続の繰り返しで scha_control を発行しようとするためです (ただし、再び拒否されます)。この要求によってさらにシステムに負荷がかかることになり、過剰に負荷がかかっているシステムでサービスの異常が発生する場合には、サービスの異常がさらに生じる可能性が増大します。

その後、検証機能は、手順 1 に戻ります。