この章では、Sun Cluster をインストールする際の計画情報とガイドラインについて説明します。
この章の内容は、次のとおりです。
次の表は、Sun Cluster ソフトウェアのインストール作業手順の参照箇所です。
表 1–1 Sun Cluster ソフトウェアのインストール作業の参照箇所
この節では、クラスタ環境への Solaris ソフトウェアのインストールを計画するうえでのガイドラインを説明します。Solaris ソフトウェアの詳細については、Solaris のインストールマニュアルを参照してください。
Solaris ソフトウェアは、ローカルの CD-ROM から、あるいはJumpStartTM によるインストール方法でネットワークインストールサーバーからインストールできます。また Sun Cluster では、JumpStart インストール方法を使用して、Solaris オペレーティング環境と Sun Cluster ソフトウェアを同時にインストールするカスタマイズ方法もあります。複数のクラスタノードをインストールする場合は、ネットワークインストールを検討してください。
scintall JumpStart によるインストール方法の詳細については、Solaris と Sun Cluster ソフトウェアをインストールする (JumpStart) を参照してください。Solaris の標準的なインストール方法の詳細については、Solaris のインストールマニュアルを参照してください。
Solaris オペレーティング環境の以下の機能は、Sun Cluster 構成ではサポートされません。
Solaris インタフェースグループ機能は、Sun Cluster 構成ではサポートされません。 Solaris のインタフェースグループ機能は、Solaris ソフトウェアのインストール中にデフォルトで無効に設定されます。Solaris インタフェースグループ機能は有効にしないでください。 Solaris インタフェースグループの詳細については、 ifconfig(1M) のマニュアルページを参照してください。
省電力のための自動シャットダウンは、Sun Cluster 構成ではサポートされないため、有効にしないでください。 詳細については、pmconfig(1M) と power.conf(4) のマニュアルページを参照してください。
Sun Cluster 3.1 ソフトウェアには少なくとも Solaris の「エンドユーザーシステムサポート (End User System Support)」ソフトウェアグループが必要です。 ただし、クラスタ構成の他のコンポーネントによっては、独自の Solaris ソフトウェアが必要となる場合があります。どの Solaris ソフトウェアグループをインストールするかを決定する際には、次の点を考慮してください。
使用するサーバーのマニュアルを参照し、Solaris ソフトウェアの必要条件を確認してください。 たとえば、Sun Enterprise 10000 サーバーには、「Entire Distribution + OEM」ソフトウェアグループが必要です。
SCI-PCI アダプタまたは Remote Shared Memory Application Programming Interface (RSMAPI) を使用する予定である場合は、かならず RSMAPI ソフトウェアパッケージ (SUNWrsm、SUNWrsmx、SUNWrsmo、および SUNWrsmox) をインストールしてください。 RSMAPI ソフトウェアパッケージは、一部の Solaris ソフトウェアグループのみに含まれます。 たとえば、Solaris の「開発者システムサポート (Developer System Support)」ソフトウェアグループは、RSMAPI ソフトウェアパッケージを含みますが、「エンドユーザーシステムサポート (End User System Support)」ソフトウェアグループは、このパッケージを含みません。
インストールするソフトウェアグループが、RSMAPI ソフトウェアパッケージを含まない場合は、RSMAPI ソフトウェアパッケージを手動でインストールしてから、Sun Cluster ソフトウェアをインストールしてください。 手動でソフトウェアパッケージをインストールするには pkgadd(1M) コマンドを使用します。RSMAPI の使用方法については、Solaris 8 セクション (3RSM) のマニュアルページを参照してください。
「エンドユーザーシステムサポート (End User System Support)」ソフトウェアグループに含まれていないほかの Solaris ソフトウェアパッケージのインストールが必要になる場合があります。Apache HTTP サーバパッケージがその例です。 ORACLE® などの Sun 以外のソフトウェアの場合も、追加の Solaris ソフトウェアパッケージが必要になる場合があります。Solaris ソフトウェアの必要条件については、各製品のマニュアルを参照してください。
ローカルファイルシステム配置のワークシート に、次の情報を追加してください。
Solaris オペレーティング環境をインストールするときは、必要な Sun Cluster パーティションを作成し、すべてのパーティションが各領域の最小必要条件を満たすようにします。
スワップ – Solaris と Sun Cluster ソフトウェアを合わせて 750M バイト以上を割り当てます。 最適な結果を得るには、Solaris オペレーティング環境に必要とされるスワップに少なくとも 512M バイトを Sun Cluster ソフトウェア用に追加します。さらに、クラスタノード上で実行されるアプリケーションが必要とする追加のスワップを割り当てます。
/globaldevices – scinstall(1M) ユーティリティーが広域デバイスのために使用する 512M バイトのファイルシステムを作成します。
ボリューム管理 – ボリューム管理が使用できるように、ディスクの終端のスライス (スライス 7) に 20M バイトのパーティションを作成します。クラスタで VERITAS Volume Manager (VxVM) を使用しており、ルートディスクをカプセル化する予定の場合は、VxVM で使用できるように、2 つの未使用スライスを用意します。
Solaris オペレーティング環境を対話的にインストールする場合は、上記の必要条件を満たすためにパーティションをカスタマイズする必要があります。
追加のパーティションを計画する際の情報については、次のガイドラインを参照してください。
Solaris オペレーティング環境を実行するほかのシステムと同様、ルート (/)、/var、/usr、/opt の各ディレクトリは、別個のファイルシステムとして構成できます。または、ルート (/) ファイルシステムにすべてのディレクトリを含めることもできます。 次に、Sun Cluster 構成でのルート (/), /var, /usr、/opt の各ディレクトリのソフトウェアの内容を示します。パーティション分割案を計画するときは、次の情報を検討してください。
ルート (/) – Sun Cluster ソフトウェア自体は、ルート (/) ファイルシステムの領域を 40M バイト未満しか占有しません。Solstice DiskSuite/Solaris Volume Manager ソフトウェアが必要とする領域は 5M バイト未満、VxVM ソフトウェアは 15M バイト未満です。十分な追加領域と i ノード容量を構成するには、一般的にルート (/) ファイルシステムに割り当てる容量に、100M バイト以上を追加します。 この領域は、ブロック特殊デバイスと文字特殊デバイスの両方を作成するために、Solstice DiskSuite/Solaris Volume Manager または VxVM ソフトウェアによって使用されます。クラスタ内に多数の共有ディスクがある場合は、特に、十分な領域を割り当てる必要があります。
/var – Sun Cluster ソフトウェアは、インストール時には /var ファイルシステム領域をわずかしか占有しません。ただし、ログファイル用に十分な領域を別途用意しておく必要があります。また、クラスタ化されたノードでは、標準的なスタンドアロンサーバーよりも、ログに記録されるメッセージが増えることがあります。したがって、/var ファイルシステムには最低でも 100M バイトの余裕を設けてください。
/usr – Sun Cluster ソフトウェアは、/usr ファイルシステムの領域を 25M バイト未満占有します。Solstice DiskSuite/Solaris Volume Manager および VxVM ソフトウェアが必要とする領域は、それぞれ 15M バイト未満です。
/opt – Sun Cluster フレームワークソフトウェアは、/opt ファイルシステムの領域を 2M バイト未満使用します。ただし、各 Sun Cluster データサービスで 1M から 5M バイトが使用されることがあります。Solstice DiskSuite/Solaris Volume Manager ソフトウェアは /opt ファイルシステムの領域をまったく使用しません。VxVM ソフトウェアは、そのパッケージとツールをすべてインストールした場合、40M バイト以上を使用することがあります。
また、ほとんどのデータベースおよびアプリケーションソフトウェアは、/opt ファイルシステムにインストールされます。Sun Management Center ソフトウェアを使用してクラスタを監視する場合、Sun Management Center エージェントと Sun Cluster モジュールパッケージをサポートするために、ノードごとに 25M バイトの追加の空間が必要です。
Sun Cluster ソフトウェアでは、広域デバイスの管理に使用するローカルディスクのいずれかに、特殊なファイルシステムを別途用意しておく必要があります。このファイルシステムは、後にクラスタファイルシステムとしてマウントされます。 このファイルシステムには、scinstall(1M) コマンドで認識されるデフォルトの名前 /globaldevices を付けます。
scinstall コマンドは、あとでファイルシステム /global/.devices/node@nodeid の名前を変更します。 ここで、nodeid は、クラスタメンバーになったときにノードに割り当てられる番号を表します。 元の /globaldevices マウントポイントは、削除されます。
/globaldevices ファイルシステムには、ブロック特殊デバイスと文字特殊デバイスの両方を作成するための十分な領域と十分な i ノード容量が必要です。このガイドラインは、クラスタ内に多数のディスクがある場合に、特に重要です。通常のクラスタ構成の場合、ファイルシステムのサイズは 512M バイトで十分です。
Solstice DiskSuite/Solaris Volume Manager ソフトウェアを使用する場合、状態データベースの複製の作成に使用できるように、ルートディスク上にスライスを別途用意しておく必要があります。つまり、各ローカルディスク上に、複製のためのスライスを別に用意します。ただし 1 つのノードにローカルディスクが 1 つしかない場合は、Solstice DiskSuite/Solaris Volume Manager ソフトウェアが正しく動作するように、同じスライス内に 3 つの状態データベースの複製を作成する必要が生じることがあります。詳細については、Solstice DiskSuite/Solaris Volume Manager のマニュアルを参照してください。
VxVM を使用しており、ルートディスクをカプセル化する予定の場合は、VxVM で使用できるように、2 つの未使用スライスを用意します。さらに、ディスクの始点または終点に若干の割り当てられていない空き領域が必要になります。ルートディスクのカプセル化については、VxVM のマニュアルを参照してください。
表 1–2 に、750M バイト未満の物理メモリーを持つクラスタノードのパーティション分割案を示します。この案では、Solaris オペレーティング環境の「エンドユーザーシステムサポート」ソフトウェアグループ、Sun Cluster ソフトウェア、および Sun Cluster HA for NFS データサービスをインストールします。ディスク上の最後のスライスであるスライス 7 には、ボリューム管理ソフトウェア用に若干の量を割り当てます。
この配置は、Solstice DiskSuite/Solaris Volume Manager ソフトウェアまたは VxVM の使用を意図したものです。Solstice DiskSuite/Solaris Volume Manager ソフトウェアを使用する場合は、状態データーベースの複製用にスライス 7 を使用します。VxVM を使用する場合は、スライスに 0 の長さを割り当てることで、後でスライス 7 を解放できます。この配置によって 必要な 2 つの空きスライス 4 と 7 が確保され、ディスクの終端に未使用領域が確保されます。
表 1–2 ファイルシステム割り当ての例
スライス |
内容 |
割り当て (M バイト) |
説明 |
---|---|---|---|
0 |
/ |
6.75GB |
スライス 1 から 7 にディスク容量を割り当てた後の、残りの空き容量。Solaris オペレーティング環境ソフトウェア、Sun Cluster ソフトウェア、データサービスソフトウェア、ボリューム管理ソフトウェア、Sun Management Center エージェントおよび Sun Cluster モジュールエージェントパッケージ、ルートファイルシステム、データーベースおよびアプリケーションソフトウェアに使用します。 |
1 |
スワップ |
1GB |
512M バイト - Solaris オペレーティング環境ソフトウェア用 512M バイト - Sun Cluster ソフトウェア用 |
2 |
オーバーラップ |
8.43GB |
ディスク全体 |
3 |
/globaldevices |
512MB |
このスライスは、Sun Cluster ソフトウェアによって後で別のマウントポイントに割り当てられ、クラスタファイルシステムとしてマウントします。 |
4 |
未使用 |
- |
VxVM でルートディスクをカプセル化するための空きスライスとして確保します。 |
5 |
未使用 |
- |
- |
6 |
未使用 |
- |
- |
7 |
ボリューム管理ソフトウェア |
20MB |
Solstice DiskSuite/Solaris Volume Manager ソフトウェアにより状態データベースの複製用に使用するか、VxVM によりスライス解放後のインストールに使用します。 |
この節では、Sun Cluster ソフトウェアのインストールの計画と、以下のコンポーネントの準備について説明します。
Sun Cluster コンポーネントの詳細については、『Sun Cluster 3.1 10/03 の概念』を参照してください。
ソフトウェアのインストールを開始する前に、必要なすべてのライセンス証明書を用意しておきます。Sun Cluster ソフトウェアにはライセンス証明書は必要ありませんが、Sun Cluster ソフトウェアがインストールされる各ノードが、Sun Cluster ソフトウェア使用許諾契約書に準拠している必要があります。
ボリューム管理ソフトウェアやアプリケーションソフトウェアのライセンス必要条件については、該当する製品のインストールマニュアルを参照してください。
各ソフトウェア製品をインストールした後に、必要なパッチもインストールする必要があります。
必須パッチの最新のリストについては、『Sun Cluster 3.1 10/03 ご使用にあたって』の「パッチと必須ファームウェアのレベル」を参照するか、ご購入先にお問い合わせください。
パッチを適用するうえでの一般的なガイドラインと手順については、『Sun Cluster 3.1 10/03 のシステム管理』の「Sun Cluster ソフトウェアとファームウェアのパッチ」を参照してください。
クラスタ構成によっては、Sun Cluster のさまざまなコンポーネントに多数の IP アドレスを設定する必要があります。クラスタ構成内の各ノードには、サブネットの同じセットのパブリックネットワーク接続が少なくとも 1 つ必要です。
次の表に、IP アドレスの割り当てが必要なコンポーネントの一覧を示します。使用する任意のネームサービスにこれらの IP アドレスを追加してください。また、Solaris ソフトウェアをインストールした後で、各クラスタノード のローカルの /etc/inet/hosts ファイルにもこれらの IP アドレスを追加します。
IP アドレスの詳細については、『Solaris のシステム管理 (第 3 巻)』(Solaris 8) または『Solaris のシステム管理 (IP サービス)』(Solaris 9) を参照してください。
IP マルチパス をサポートするテスト IP アドレスの詳細については、『IP ネットワークマルチパスの管理』を参照してください。
構成要素 |
必要な IP アドレス |
---|---|
サブネットあたり 1 つ |
|
|
|
クラスタノード |
ノードおよびサブネットごとに 1 つずつ |
ドメインごとに 1 つ |
|
1 |
|
論理アドレス |
サブネットごとの論理ホストリソースあたり 1 つ |
すべてのクラスタノードにはコンソールアクセスが必要です。クラスタコントロールパネル (CCP) ソフトウェアを管理コンソールにインストールする場合、クラスタノードと通信するために使用されるコンソールアクセスデバイスのホスト名を提供する必要があります。
管理コンソールとクラスタノードコンソール間の通信には、端末集配信装置 (コンセントレータ) を使用します。
Sun Enterprise 10000 サーバーは、端末集配信装置の代わりにシステムサービスプロセッサ (SSP) を使用します。
Sun FireTM サーバは、端末集配信装置の代わりにシステムコントローラを使用します。
コンソールアクセスの詳細については、『Sun Cluster 3.1 10/03 の概念』を参照してください。
論理アドレスを使用する各データサービスリソースグループには、論理アドレスへのアクセス元となる各パブリックネットワークに指定されているホスト名を設定する必要があります。
詳細については、『Sun Cluster 3.1 データサービスの計画と管理』を参照してください。
データサービスとリソースの詳細については、『Sun Cluster 3.1 10/03 の概念』を参照してください。
この節では、インストール中に構成する Sun Cluster コンポーネントのガイドラインについて説明します。
クラスタ名とノード名のワークシート に次の計画情報を追加してください。
クラスタ名は、Sun Cluster のインストールの際に指定します。クラスタ名は、インストール環境全体で一意にする必要があります。
クラスタ名とノード名のワークシート に次の計画情報を追加してください。 その他のほとんどのワークシートに関する情報は、ノード名ごとにまとめられています。
ノード名とは、Solaris オペレーティング環境のインストール中にマシンに割り当てる名前のことです。Sun Cluster のインストール中に、クラスタとしてインストールするすべてのノード名を指定します。単一ノードのクラスタインストールでは、デフォルトのノード名とクラスタ名とが同じになります。
クラスタ名とノード名のワークシート に次の計画情報を追加してください。
単一ノードのクラスタの場合、プライベートネットワークを構成する必要はありません。
Sun Cluster ソフトウェアは、ノード間の内部通信にプライベートネットワークを使用します。Sun Cluster 構成では、プライベートネットワーク上のクラスタインターコネクトへの接続が少なくとも 2 つ必要です。クラスタの最初のノードに Sun Cluster ソフトウェアをインストールするときに、プライベートネットワークアドレスとネットマスクを指定します。デフォルトのプライベートネットワークアドレス (172.16.0.0) とネットマスク (255.255.0.0) をそのまま使用するように選択するか、デフォルトのネットワークアドレスがすでに使用中の場合は別のアドレスを入力できます。
ノードをクラスタメンバーとして正常にインストールした後で、プライベートネットワークアドレスとネットマスクを変更することはできません。
デフォルト以外のプライベートネットワークアドレスを指定する場合は、アドレスは次の条件を満たす必要があります。
アドレスの最後の 2 つのオクテットにはゼロを使用します。
RFC 1597 のネットワークアドレス割り当てガイドラインに従います。
InterNIC に問い合わせて RFCs のコピーを入手できます。入手方法については、『Solaris のシステム管理 (第 3 巻)』(Solaris 8) の「TCP/IP ネットワークの計画」を参照するか、『Solaris のシステム管理 (IP サービス) 』(Solaris 9) の「TCP/IP ネットワークの計画 (手順)」を参照してください。
デフォルト以外のネットマスクを指定する場合は、少なくとも、プライベートネットワークアドレスに指定したすべてのビットをマスクする必要があります。
クラスタ名とノード名のワークシート に次の計画情報を追加してください。
プライベートホスト名とは、プライベートネットワークインタフェースを介したノード間の通信に使用される名前のことです。プライベートホスト名は、Sun Cluster のインストール中に自動的に作成されます。これらのプライベートホスト名は、clusternodenodeid-priv という命名規則に従います。ここで、nodeid は、内部ノード ID の数値になります。ノード ID 番号は、Sun Cluster のインストール中に各ノードがクラスタメンバーとなる際に、自動的に各ノードに割り当てられます。インストール後に、scsetup(1M) ユーティリティーを使用してプライベートホスト名を変更できます。
クラスタインターコネクトのワークシート に次の計画情報を追加してください。
単一ノードのクラスタの場合、クラスタインターコネクトを構成する必要はありません。ただし、単一ノードのクラスタ構成に後でノードを追加する可能性がある場合は、将来の使用のためにクラスタインターコネクトを構成することもできます。
クラスタインターコネクトは、クラスタノード間のプライベートネットワーク通信にハードウェアパスを提供します。各インターコネクトは、次のいずれかの方法で接続されるケーブルで構成されます。
2 つのトランスポートアダプタの間
トランスポートアダプタとトランスポート接続点の間
2 つのトランスポート接続点の間
Sun Cluster のインストール中に、2 つのクラスタインターコネクトに対して以下の構成情報を指定します。
トランスポートアダプタ – ネットワークインタフェースのポートなどのトランスポートアダプタ用に、トランスポートアダプタ名とトランスポートの種類を指定します。構成が 2 ノードクラスタの場合は、インターコネクトを直接接続 (アダプタからアダプタ) するか、トランスポート接続点を使用するかも指定します。2 ノードクラスタが直接接続されている場合でも、インターコネクトのトランスポート接続点を指定できます。
トランスポート接続点を指定すると、その後クラスタに別のノードを追加しやすくなります。
特定のトランスポートアダプタに関する詳細については、scconf_trans_adap_*(1M) のマニュアルページを参照してください。
トランスポート接続点 – ネットワークスイッチなどのトランスポート接続点を使用する場合、各インターコネクトのトランスポート接続点名を指定します。デフォルト名の switchN (N は、インストール中に自動的に割り当てられた数)を使用するか、他の名前を作成します。
また、接続点のポート名を指定するか、デフォルト名をそのまま使用します。デフォルトのポート名は、ケーブルのアダプタ側が接続されているノードの内部ノード ID 番号と同じです。ただし、SCI-PCI などの特定の種類のアダプタではデフォルトのポート名は使用できません。
3 つ以上のノードを持つクラスタでは、必ずトランスポート接続点を使用してください。クラスタノード間の直接接続は、2 ノードクラスタの場合だけサポートされています。
インストール後に、scsetup(1M) ユーティリティーを使用して、追加のプライベートネットワーク接続を構成できます。
クラスタインターコネクトの詳細については、『Sun Cluster 3.1 10/03 の概念』を参照してください。
パブリックネットワークのワークシートに次の計画情報を追加してください。
パブリックネットワークはクラスタの外部と通信します。パブリックネットワーク構成を計画する際は、次のことを考慮してください。
パブリックネットワークとプライベートネットワーク (クラスタインターコネクト) には、別のアダプタを使用する必要があります。
すべてのクラスタノードに接続されているパブリックネットワークが少なくとも 1 つ存在する必要があります。
パブリックネットワーク接続は、ハードウェア構成の許容範囲であればいくつでも追加できます。
イーサネットアダプタの local-mac-address? 変数は、デフォルト値で true である必要があります。Sun Cluster 3.1 ソフトウェアは、イーサネットアダプタの、local-mac-address? の値として false をサポートしません。この必要条件は、local-mac-address? の値としてfalse を必要とした Sun Cluster 3.0 から変更されています。
パブリックネットワークアダプタのバックアップグループの計画のガイドラインについては、IP マルチパスグループを参照してください。パブリックネットワークインタフェースの詳細については、『Sun Cluster 3.1 10/03 の概念』を参照してください。
ディスクデバイスグループ構成のワークシートに次の計画情報を追加してください。
すべてのボリューム管理ソフトウェアディスクグループを Sun Cluster ディスクデバイスグループとして構成する必要があります。このように構成することで、主ノードに障害が発生した場合でも、2 つ目のノードで多重ホストディスクをホストできるようになります。ディスクデバイスグループを計画する際は、次の点を考慮してください。
フェイルオーバー – 多重ポートディスクと、適切に構成したボリューム管理ソフトウェアデバイスをフェイルオーバーデバイスとして構成できます。ボリューム管理ソフトウェアデバイスの適切な構成には、多重ポートディスクや、ボリューム管理ソフトウェア自体の正しい設定が含まれます。この構成により、複数のポートがエクスポートしたデバイスをホストできるようになります。テープドライブ、CD-ROM、単一ポートのディスクは、フェイルオーバーデバイスとして構成できません。
ミラー化 – ディスクをミラー化して、ディスクの障害からデータを保護する必要があります。詳細は、ミラー化に関するガイドラインを参照してください。ミラー化の方法については、Solstice DiskSuite/Solaris Volume Manager ソフトウェアのインストールと構成または VxVM ソフトウェアのインストールと構成、およびボリューム管理ソフトウェアのマニュアルを参照してください。
ディスクデバイスグループの詳細については、『Sun Cluster 3.1 10/03 の概念』を参照してください。
パブリックネットワークのワークシート に次の計画情報を追加してください。
ネットワークアダプタフェイルオーバー (NAFO) グループに代わるインターネットプロトコル (IP) マルチパスグループは、パブリックネットワークアダプタの監視とフェイルオーバーを提供する、 ネットワークアドレスリソースの基盤構造です。マルチパスグループは、 2 つ以上のアダプタで構成されている場合に、高い可用性を提供します。1 つのアダプタで障害が発生しても、障害のあるアダプタ上のすべてのアドレスが、マルチパスグループ内の別のアダプタにフェイルオーバーされるからです。このようにして、マルチパスグループのアダプタは、マルチパスグループ内のアダプタが接続するサブネットへのパブリックネットワーク接続を維持します。
マルチパスグループを計画する際は、次の点を考慮してください。
各パブリックネットワークアダプタは、マルチパスグループに属している必要があります。
2 つ以上のアダプタを含むマルチパスグループについては、そのグループ内の各アダプタにテスト IP アドレスを構成する必要があります。マルチパスグループに含まれるアダプタが 1 つだけの場合には、テスト IP アドレスを構成する必要はありません。
同一マルチパスグループ内のすべてのアダプタ用のテスト IP アドレスは、単一の IP サブネットに属する必要があります。
テスト IP アドレスは高可用性ではないため、通常のアプリケーションでは使用しないようにします。
/etc/default/mpathd ファイルの TRACK_INTERFACES_ONLY_WITH_GROUPS の値を yes から no に変更しないでください。
マルチパスグループの名前に、必要条件はありません。
IP マルチパス の詳細については、『IP ネットワークマルチパスの管理』(Solaris 8) の「ネットワークマルチパスの導入」を参照するか、『Solaris のシステム管理 (IP サービス)』(Solaris 9) の「ネットワークマルチパスの管理 (手順)」を参照してください。
Sun Cluster 構成では、定足数 (quorum) デバイスを使用して、データとリソースの整合性を保持します。クラスタがノードとの接続を一時的に失っても、定足数デバイスによって、クラスタノードがクラスタに再結合しようとしたときの amnesia や split-brain といった問題を防止できます。定足数デバイスは、scsetup(1M) ユーティリティーを使用して割り当てることができます。
単一ノードのクラスタの場合、定足数 (quorum) を構成する必要はありません。
定足数デバイスを計画する際は、次の点を考慮してください。
最定数 – 2 ノードクラスタには、少なくとも 1 つの共有ディスクが定足数デバイスとして割り当てられている必要があります。その他のトポロジの場合は、定足数デバイスはオプションです。
奇数の規則 – 複数の定足数デバイスが、2 ノードクラスタまたは定足数デバイスに直接接続されているノードペアで構成されている場合、奇数個の定足数デバイスを構成します。このように構成することで、定足数デバイスが完全に独立した障害パスを持つようになります。
接続 – 定足数デバイスは 2 つ以上のノードに接続する必要があります。
定足数デバイスの詳細については、『Sun Cluster 3.1 10/03 の概念』を参照してください。
この節では、広域デバイスとクラスタファイルシステムを計画するうえでのガイドラインについて説明します。
広域デバイスとクラスタファイルシステムの詳細については、『Sun Cluster 3.1 10/03 の概念』を参照してください。
Sun Cluster ソフトウェアは、特定のディスクレイアウトやファイルシステムサイズを必要としません。広域デバイスとクラスタファイルシステムを計画する際は、次の点を考慮してください。
ミラー化 – 広域デバイスの高可用性を実現するには、すべての広域デバイスをミラー化する必要があります。ストレージデバイスがハードウェア RAID とディスクへの冗長パスを提供する場合は、ソフトウェアミラー化を使用する必要はありません。
ディスク – ミラー化するときは、複数のディスクアレイにまたがってミラー化されるようにファイルシステムを配置してください。
可用性 – 広域デバイスの高可用性を実現するには、広域デバイスがクラスタ内の複数のノードに物理的に接続されている必要があります。複数の物理的な接続を持つ広域デバイスは、単一のノードでの障害に対応できます。物理的な接続を 1 つしか持たない広域デバイスもサポートされていますが、そのノードがダウンした場合、ほかのノードからはその広域デバイスにアクセスできなくなります。
クラスタファイルシステムのマウントポイントを計画する際は、次の点を考慮してください。
マウントポイントの場所 – マウントポイントは、別のソフトウェア製品によって禁止されていない限り、/global ディレクトリに作成します。/global ディレクトリを使用することで、広域的に使用できるクラスタファイルシステムと、ローカルファイルシステムを簡単に区別できるようになります。
次の VxFS 機能は Sun Cluster 3.1 構成ではサポートされません。
クイック入出力
スナップショット
記憶装置チェックポイント
convosync (Convert O_SYNC)
mincache
qlog、delaylog、tmplog
VERITAS CFSには VERITAS クラスタ機能および VCS が必要
キャッシュアドバイザリは使用可能、効果が認められるのは特定のノードのみ
クラスタ構成でサポートされる VxFS のその他の機能とオプションはすべて、Sun Cluster 3.1 ソフトウェアでサポートされます。クラスタ構成でサポートされる VxFS オプションの詳細については、VxFS のマニュアルを参照してください。
VxFS のマウント要件 – 主ノードから VxFS ファイルシステムを広域的にマウントまたはマウント解除します。主ノードとは、VxFS ファイルシステムが存在するディスクをマスターするノードです。 この方法では、マウントまたはマウント解除の操作が確実に成功します。二次ノードから行った VxFS ファイルシステムのマウントやマウント解除の操作は正常に動作しないことがあります。
マウントポイントを入れ子にする – 通常は、クラスタファイルシステムのマウントポイントは入れ子にしないでください。 たとえば、あるファイルシステムを /global/a にマウントし、別のファイルをシステムは /global/a/b にマウントするような設定は避けてください。この規則を無視すると、可用性とノードの起動順序に問題が発生することがあります。このような問題は、システムがファイルシステムの子をマウントしようとして、親マウントポイントが存在しない場合に発生します。この規則の唯一の例外は、2 つのファイルシステムのデバイスが同じ物理ノード接続を使用している場合です。同じディスク上の異なるスライスがこれに該当します。
ディスクデバイスグループ構成のワークシートと ボリューム管理ソフトウェア構成のワークシートに次の計画情報を追加してください。Solstice DiskSuite/Solaris Volume Manager については、メタデバイスのワークシート (Solstice DiskSuite/Solaris Volume Manager)に次の計画情報を追加してください。
この節では、クラスタ構成のボリューム管理を計画する上でのガイドラインについて説明します。
Sun Cluster は、ボリューム管理ソフトウェアを使用して、ディスクをディスクデバイスグループにまとめ、1 つの単位で管理できるようにします。Sun Cluster ソフトウェアは、次の方法でインストールまたは使用する Solstice DiskSuite/Solaris Volume Manager ソフトウェアと VERITAS Volume Manager (VxVM) ソフトウェアをサポートします。
表 1–4 サポートされているボリューム管理ソフトウェアと Sun Cluster ソフトウェアの使用
ボリューム管理ソフトウェア |
要件 |
---|---|
Solstice DiskSuite/Solaris Volume Manager |
一部のノードで VxVM を使用してディスクを管理する場合でも、クラスタのすべてのノードに Solstice DiskSuite/Solaris Volume Manager ソフトウェアをインストールする必要があります。 |
クラスタ機能を持つ VxVM |
クラスタのすべてのノード上に、クラスタ機能を持つ VxVM をインストールして、それらにライセンスを付与する必要があります。 |
クラスタ機能を持たない VxVM |
VxVM は、VxVM が管理する記憶装置に接続されているノードにのみインストールして、それらにライセンスを付与します。 |
Solstice DiskSuite/Solaris Volume Manager と VxVM の両方 |
これらのボリューム管理ソフトウェアを同じノードにインストールする場合は、Solstice DiskSuite/Solaris Volume Manager ソフトウェアを使用して、各ノードにローカルに接続されているディスクを管理します。ルートディスクもローカルディスクに含まれます。VxVM を使用して、すべての共有ディスクを管理します。 |
ボリューム管理ソフトウェアのインストールと構成方法については、ボリューム管理ソフトウェアのマニュアル、および Solstice DiskSuite/Solaris Volume Manager ソフトウェアのインストールと構成 または VxVM ソフトウェアのインストールと構成 を参照してください。クラスタ構成におけるボリューム管理の詳細については、『Sun Cluster 3.1 10/03 の概念』を参照してください。
ボリューム管理ソフトウェアでディスクを構成する際は、次の一般的なガイドラインを考慮してください。
ミラー化多重ホストディスク – すべての多重ホストディスクは、複数のディスク拡張装置にまたがるようにミラー化する必要があります。多重ホストディスクのガイドラインについては、多重ホストディスクのミラー化 を参照してください。ストレージデバイスがハードウェア RAID とディスクへの冗長パスを提供する場合は、ソフトウェアミラー化を使用する必要はありません。
ミラー化ルート – ルートディスクをミラー化することにより高可用性を保証できますが、このようなミラー化は必要ありません。ルートディスクをミラー化するかどうかを判断する際のガイドラインについては、ミラー化に関するガイドライン を参照してください。
一意の命名 – ローカル Solstice DiskSuite メタデバイス、ローカル Solaris Volume Manager、ボリューム、または VxVM ボリュームが必要です。これらは、/global/.devices/node@nodeid ファイルシステムでマウントされるデバイスとして使用されます。マウントされるデバイスとして使用される場合、各ローカルメタデバイスまたはローカルボリュームの名前は、クラスタ全体で一意にする必要があります。
ノードリスト – ディスクデバイスグループの高可用性を実現するには、これらの潜在マスターのノードリストとフェイルバックポリシーを、関連付けられているリソースグループと同一にします。または、スケーラブルなリソースグループで、それと関連付けられているディスクデバイスグループ以上のノードが使用されている場合、スケーラブルなリソースグループのノードリストをディスクデバイスグループのノードリストのスーパーセットにします。ノードリストの詳細については、『 Sun Cluster 3.1 データサービスの計画と管理』のリソースグループの計画情報を参照してください。
多重ポートディスク – クラスタ内でディスクグループの構築に使用されているディスクはすべて、そのデバイスグループのノードリストで構成されているすべてのノードに接続 (またはポート) する必要があります。Solstice DiskSuite/Solaris Volume Manager ソフトウェアは、ディスクセットにディスクを追加したときに、この接続を自動的に確認します。しかし、構成した VxVM ディスクグループは、ノードの特定のセットには関連を持ちません。
ディスクの配置の推奨事項とその他の制限については、ボリューム管理ソフトウェアのマニュアルを参照してください。
Solstice DiskSuite/Solaris Volume Manager の構成を計画する際は、次の点を考慮してください。
ローカルメタデバイス名またはボリューム名 – 各ローカル Solstice DiskSuite メタデバイスまたは Solaris Volume Manager ボリュームの名前は、クラスタ全体で一意にする必要があります。 また、その名前はどのデバイス ID (DID) 名とも同じであってはなりません。
メディエータ – 2 つの列だけで構成されていて、2 つのノードでマスターされている各ディスクセットでは、そのディスクセット用に構成されている Solstice DiskSuite/Solaris Volume Manager メディエータを使用する必要があります。列は、ディスク格納装置、その物理ディスク、格納装置からノードへのケーブル、インタフェースアダプタカードで構成されます。メディエータの構成には、次の規則に従ってください。
各ディスクセットは、メディエータホストとして機能する 2 つのノードで構成します。
メディエータを必要とするすべてのディスクセットに対して、2 つの同じノードを使用する必要があります。これら 2 つのノードがディスクセットをマスターする必要があります。
メディエータは、列およびホストが 2 つずつという要件を満たしていないディスクセットに対しては構成できません。
詳細は、mediator(7D) のマニュアルページを参照してください。
/kernel/drv/md.conf 設定 – それぞれのディスクセットが使用するすべての Solstice DiskSuite メタデバイスまたは Solaris Volume Manager ボリュームは、再構成起動時にあらかじめ作成されます。再構成は、/kernel/drv/md.conf ファイルに含まれる構成パラメータに基づいています。
すべてのクラスタノードの /kernel/drv/md.conf ファイルの内容は、それぞれのノードがサービスを提供するディスクセット数に関係なく、同一である必要があります。このガイドラインに従わないと、重大な Solstice DiskSuite/Solaris Volume Manager エラーが発生し、データが失われることがあります。
nmd および md_nsets フィールドを次のように変更して、Sun Cluster 構成をサポートする必要があります。
md_nsets – md_nsets フィールドは、クラスタ全体のニーズを満たすためにシステムで作成できるディスクセットの総数を定義します。md_nsets の値は、クラスタ内で予想されるディスクセットの数に 1 を加えた値に設定します。Solstice DiskSuite/Solaris Volume Manager ソフトウェアは、追加のディスクセットを使用して、ローカルホスト上のプライベートディスクを管理します。 プライベートディスクとは、ローカルディスクセットに含まれないメタデバイスまたはボリュームのことです。
1 つのクラスタで使用できるディスクセットの最大数は、32 です。32 のうち、31 ディスクセットは 一般的な使用のためで、1 ディスクセットは、プライベートディスクの管理用に使われます。md_nsets のデフォルト値は 4 です。
nmd – nmd フィールドは、各ディスクセットに対して作成するメタデバイスまたはボリュームの個数を定義します。nmd の値には、クラスタ内の任意の 1 つのディスクセットが使用するメタデバイスまたはボリューム名の予想最大数を設定する必要があります。たとえば、最初の 15 のディスクセットは 10 個のメタデバイスまたはボリュームを使用し、16 番目のディスクセットは 1000 個のメタデバイスまたはボリュームを使用するという場合は、nmd の値は最低でも 1000 に設定する必要があります。また、nmd の値は、各 DID 名用に十分な数が存在するように、大きな値を設定する必要があります。この値は、各ローカルメタデバイス名またはローカルボリューム名がクラスタ全体で一意になるように十分に大きな値を設定してください。
1 つのディスクセットで使用できるメタデバイス名またはボリューム名の最大数は 8192 です。 nmd のデフォルト値は、128 です。
インストール時、これら 2 つのフィールドに、将来予想されるクラスタの拡張を考慮した値を設定してください。クラスタの使用を開始した後で、これらのフィールド値を増やそうとすると、時間がかかります。値を変更すると、すべてのノードで再構成再起動が必要になるからです。また、後でこれらの値を増やす場合、要求されたデバイスを作成するには、ルート (/) ファイルシステムに確保された領域では不十分である可能性が高まります。
同時に、nmd フィールドおよび md_nsets フィールドには、できる限り小さい値を使用してください。デバイスを作成していなくても nmd および md_nsets によって指定された値に基づいて、可能性のあるすべてのデバイス分をメモリー構造上に確保します。最適なパフォーマンスを得るには、nmd と md_nsets の値を、使用するメタデバイスまたはボリュームの数よりもわずかに高く維持します。
md.conf ファイルの詳細については、『Solstice DiskSuite 4.2.1 リファレンス』の「システムファイルと起動ファイル」を参照するか、『Solaris ボリュームマネージャの管理』の「システムファイルと始動ファイル」を参照してください。
VERITAS Volume Manager (VxVM) の構成を計画する際は、次の点を考慮してください。
筐体ベースのネーミング (Enclosure-Based Naming) – 筐体ベースのネーミングは、VxVM バージョン 3.2 で導入された機能です。 デバイスの筐体ベースのネーミングを使用する場合、同じストレージを共有するすべてのクラスタノードにおいて整合性のあるデバイス名を使用してください。VxVM はこのような名前を調節しないため、VxVM が各ノードから同じデバイスに同じ名前を割り当てているかどうかは、管理者が確認する必要があります。整合性のある名前を割り当てなくても、クラスタの動作に悪影響はありません。ただし、整合性のない名前だと、クラスタの管理が極端に複雑になり、構成エラーが発生し、データが失われる可能性が高くなります。
ルートディスクグループ – 各ノードにデフォルトのルートディスクグループ (rootdg) を作成する必要があります。rootdg ディスクグループは次のディスク上に作成できます。
ルートディスク (カプセル化されている必要がある)
ルート以外の 1 つまたは複数のローカルディスク (カプセル化または初期化できるもの)
ルートディスクとルート以外のローカルディスクの組み合わせ
rootdg ディスクグループは、ノードに対してローカルである必要があります。
ボリューム数 – ディスクデバイスグループを作成するときに任意のディスクデバイスグループが使用するボリュームの最大数を確認します。
ボリューム数が 1000 未満の場合は、デフォルトのミラー数を使用できます。
ボリューム数が 1000 以上の場合は、ディスクデバイスグループボリュームへのマイナー番号の割り当て方を慎重に計画する必要があります。2 つのディスクデバイスグループに、オーバーラップするマイナー番号を割り当てることはできません。
ダーティリージョンログ – ダーティリージョンロギング (DRL) を使用すると、ノードに障害が発生した後に、ボリュームの回復時間を短縮できます。また、DRL を使用することで入出力のスループットを低減できることがあります。
Dynamic Multipathing (DMP) – Sun Cluster 構成で DMP はサポートされていません。1 つのノードに複数のパスが存在する構成で VxVM を使用する場合は、ほかのマルチパスソリューション (Sun StorEdge Traffic Manager や EMC PowerPath など) を使用する必要があります。ただし、1 つのノードに 1 つのパスしか存在しないシステムでは、DMP を有効にしても問題は生じません。
ロギングはクラスタファイルシステムに必要です。Sun Cluster ソフトウェアでは、次のロギングファイルシステムがサポートされています。
Solaris UFS ロギング – 詳細については、mount_ufs(1M) のマニュアルページを参照してください。
Solstice DiskSuite トランスメタデバイスロギング または Solaris Volume Manager トランザクションボリュームロギング – 詳細については、『Solstice DiskSuite 4.2.1 ユーザーズガイド』の「DiskSuite オブジェクトの作成」を参照するか、『Solaris ボリュームマネージャの管理』の「トランザクションボリューム (概要)」を参照してください。
VERITAS File System (VxFS) ロギング – 詳細については、VxFS ソフトウェアに付属の mount_vxfs マニュアルページを参照してください。
次の表に、各ボリューム管理ソフトウェアでサポートされているロギングファイルシステムを示します。
表 1–5 サポートされているファイルシステムのロギング
ボリュームマネージャ |
サポートされているファイルシステムのロギング |
---|---|
Solstice DiskSuite/Solaris Volume Manager |
Solaris UFS ロギング、Solstice DiskSuite トランスメタデバイスロギング または Solaris Volume Manager トランザクションボリュームロギング、VxFS ロギング |
VERITAS Volume Manager |
Solaris UFS ロギング, VxFS ロギング |
Solaris UFS ロギング と Solstice DiskSuite トランスメタデバイスロギング/Solaris Volume Manager トランザクションボリュームロギング のどちらを使用するかを選択するときには、次の点を考慮してください。
Solaris Volume Managerトランザクションボリュームロギング (旧 Solstice DiskSuite トランスメタデバイスロギング) は、将来の Solaris リリースで、Solaris オペレーティング環境から削除される予定です。Solaris UFS ロギング は、より低い管理条件とオーバーヘッドで、同様の機能を高いパフォーマンスで提供します。
Solaris UFS ログサイズ – Solaris UFS ロギングは、常に UFS ファイルシステム上の空き領域を使用し、ファイルシステムのサイズに応じてログを確保します。
1G バイト未満のファイルシステムの場合、ログのサイズは 1M バイトになります。
1G バイト以上のファイルシステムの場合は、ログのサイズはファイルシステム 1G バイトあたり 1M バイトになり、最大 64M バイトです。
ログメタデバイス/トランザクショナルボリューム – Solstice DiskSuite トランスメタデバイスまたは Solaris Volume Manager トランザクショナルボリュームは、UFS ロギングを管理します。トランスメタデバイスまたはトランザクショナルボリュームのロギングデバイスコンポーネントは、ミラー化とストライプ化が可能なメタデバイスまたはボリュームです。最大 1G バイトのログを作成できますが、ほとんどのファイルシステムでは 64M バイトで十分です。最小のログサイズは 1M バイトです。
この節では、クラスタ構成のミラー化を計画する際のガイドラインについて説明します。
Sun Cluster 構成で多重ホストディスクをミラー化することにより、構成は単一のディスク障害に耐えることができます。Sun Cluster ソフトウェアでは、すべての多重ホストディスクは、複数のディスク拡張装置にまたがるようにミラー化する必要があります。ストレージデバイスがハードウェア RAID とディスクへの冗長パスを提供する場合は、ソフトウェアミラー化を使用する必要はありません。
多重ホストディスクをミラー化する際は、次の点を考慮してください。
独立したディスク拡張装置 – ミラーまたはプレックスのサブミラーは、それぞれ異なる多重ホストディスク拡張装置に分散してください。
ディスク領域 – ミラー化すると、2 倍のディスク領域が必要になります。
3 方向のミラー化 – Solstice DiskSuite/Solaris Volume Manager ソフトウェアと VERITAS Volume Manager (VxVM) は、3 方向のミラー化をサポートしています。ただし、Sun Cluster ソフトウェアが必要とするのは、2 方向のミラー化だけです。
メタデバイスまたはボリュームの数 – Solstice DiskSuite/Solaris Volume Manager ソフトウェアでは、ミラーは連結やストライプなどの他の Solstice DiskSuite メタデバイスまたは Solaris Volume Manager ボリュームで構成されます。大規模な構成では、大量のメタデバイスまたはボリュームが含まれることがあります。
異なるディスクサイズ – 異なるサイズのディスクにミラーを作成した場合、ミラーの容量は、最小のサブミラーまたはプレックスのサイズに制限されます。
多重ホストディスクの詳細については、『Sun Cluster 3.1 10/03 の概念』を参照してください。
ローカルファイルシステム配置のワークシートに次の計画情報を追加してください。
最高の可用性を得るには、ローカルディスク上のルート (/)、/usr、/var、/opt、swap をミラー化してください。VxVM では、ルートディスクをカプセル化し、生成されたサブディスクをミラー化します。ただし、Sun Cluster ソフトウェアでは、ルートディスクのミラー化を要求しません。
ルートディスクをミラー化するかどうかを決定する前に、危険性、複雑さ、コスト、保守時間の面から、ルートディスクに関するさまざまな方法を検討してください。どの構成でも有効に機能するというような汎用的なミラー化はありません。ルートをミラー化するかどうかを決定する際は、ご購入先に相談してください。
ルートディスクのミラー化については、使用するボリューム管理ソフトウェアのマニュアルと、Solstice DiskSuite/Solaris Volume Manager ソフトウェアのインストールと構成 または VxVM ソフトウェアのインストールと構成 を参照してください。
ルートディスクをミラー化するかどうかを決定する際は、次のことを考慮してください。
起動ディスク – 起動可能ルートディスクをミラーとして設定できます。主起動ディスクに障害が発生した場合に、ミラーから起動できます。
複雑さ – ルートディスクをミラー化すると、システム管理の複雑さが増します。また、シングルユーザーモードでの起動も複雑になります。
バックアップ – ルートディスクをミラー化するかどうかに関係なく、ルートは定期的にバックアップしてください。ミラー化だけで、管理上の誤りが防げるわけではありません。誤って変更あるいは削除したファイルは、バックアップによってのみ復元できます。
定足数 (Quorum) デバイス – 定足数デバイスとして構成されたディスクは、ルートディスクのミラー化に使用しないでください。
定足数 (Quorum) – Solstice DiskSuite/Solaris Volume Manager ソフトウェアの構成で、状態データベースの定足数が失われるという障害が発生した場合は、保守を行わない限り、システムを再起動できなくなります。状態データベースと状態データベースの複製の詳細については、Solstice DiskSuite/Solaris Volume Manager のマニュアルを参照してください。
独立したコントローラ – 独立したコントローラにルートディスクをミラー化するという方法は、最高の可用性を得る手段の 1 つです。
二次ルートディスク – ミラー化したルートディスクを使用すると、主ルートディスクに障害が発生しても、二次 (ミラー) ルートディスクで動作を継続できます。その後、主ルートディスクは、電源を入れ直すか、一時的な入出力エラーの後に、正常に戻ることがあります。以降の起動は、OpenBootTM PROM boot-device フィールドに指定された主ルートディスクを使用して行われます。 このような場合、手作業による修復作業は発生しませんが、起動に問題がないようにドライブは動作を開始します。Solstice DiskSuite/Solaris Volume Manager では、再同期が行われます。再同期をするには、ドライブが正常に戻ったときに手作業が必要になります。
二次 (ミラー) ルートディスク上のファイルが変更された場合、起動中に、その変更が主ルートディスクに反映されることはありません。これにより古いサブミラーが生じます。たとえば、/etc/system ファイルに対する変更が失われることがあります。Solstice DiskSuite/Solaris Volume Manager では、主ルートディスクが休止している間に、一部の管理コマンドによって /etc/system ファイルが変更されることがあります。
起動プログラムは、システムがミラーまたは元の物理デバイスのどちらから起動されているのかを確認しません。起動プロセスの途中(メタデバイスまたはボリュームが読み込まれた後) でミラー化はアクティブになります。これより前の時点で、古いサブミラー問題が発生しやすくなります。