この節では、確実に Sun Cluster 構成の可用性を高めるのに役立つ規則を説明します。これらの規則はまた、Sun Cluster 構成に適切なハードウェアを決定するのにも役立ちます。
構成によりますが、一般に、Sun Cluster ノードのハードウェア構成は同じにしてください。このことは、クラスタノードの 1 つを 2 枚の FC/S カードで構成した場合は、クラスタ内の他のすべての Sun Cluster ノードも FC/S カード 2 枚の構成にすることを意味します。
ノードごとに冗長なハードウェアを特定し、配置計画を立てて、1 つのハードウェア障害で両方のコンポーネントが失われないようにしてください。たとえば、Sun Enterprise 10000 システムに対するプライベートネットワークを検討する場合、最小構成は入出力ボード 2 つで、それぞれプライベートネットワーク接続の 1 つと多重ホストディスク接続の 1 つをサポートするようにします。このような構成にすれば、入出力ボードでローカルに障害が発生しても、両方のプライベートネットワーク接続や両方の多重ホストディスク接続が影響を受ける可能性が少なくなります。
冗長なハードウェア構成は、常に可能なわけではありませんが (構成によっては、システムボードが 1 枚だけのこともあります)、問題点のいくつかは、ハードウェアオプションを使用することによって対処できます。たとえば、SPARCstorage Array を 2 つ持つ Sun Enterprise 2 Cluster の構成では、プライベートネットワークの一方を Sun Quad FastEthernetTM Controller カード (SQEC) に接続し、もう一方をオンボードのインタフェースに接続できます。
RAID5 構成を使用しない場合は、Sun Cluster 構成では、あらゆる多重ホストディスクをミラー化する必要があります。ミラー化することにより、構成は単一ディスク障害に耐えることができます。
多重ホストディスクをミラー化するにあたっては、次のことを考慮してください。
ミラーまたはプレックスのサブミラーは、それぞれ異なる多重ホストディスク拡張装置に分散してください。
ミラー化すると、2 倍のディスク空間が必要になります。
Solstice DiskSuite、および VERITAS Volume Manager は、3 方向のミラー化をサポートしています。ただし、Sun Cluster が必要とするのは、2 方向のミラー化だけです。
Solstice DiskSuite では、ミラーは連結やストライプなどの他のメタデバイスで構成されます。大規模な構成では、大量のメタデバイスが含まれることがあります。たとえば、UFS ロギングファイルシステムごとに 7 つのメタデバイスが作成されます。
異なるサイズのディスクにミラーを作成した場合、ミラーの容量は、最小のサブミラーまたはプレックスのサイズに制限されます。
最高の可用性を得るには、ローカルディスク上のルート (/)、/usr、/var、/opt、swap をミラー化してください。VERITAS Volume Manager では、このことは、ルートディスクをミラー化し、生成されたサブディスクをミラー化することを意味します。ただし、Sun Cluster では、ルートディスクのミラー化が必須というわけではありません。
リスク、複雑さ、コスト、保守時間の面からルートディスクに関するさまざまな方法を検討してください。どの構成にも当てはまるものはありません。ルートをミラー化するかどうかを決定するにあたっては、ご購入先に相談してください。
ルートのミラー化方法については、ボリュームマネージャのマニュアルを参照してください。
ルートファイルシステムをミラー化するかどうかを決定するにあたっては、次のことを考慮してください。
ルートをミラー化すると、システム管理の複雑さが増し、シングルユーザーモードでの起動が複雑になります。
ルートをミラー化するかどうかに関係なく、ルートは定期的にバックアップしてください。ミラー化だけで、管理上の誤りが防げるわけではありません。誤って変更あるいは削除したファイルは、バックアップによってのみ復元できます。
Solstice DiskSuite の構成で、メタデバイス状態データベースの定足数が失われるという障害が発生した場合は、保守を行わない限り、システムを再起動できなくなります。
Solstice DiskSuite のマニュアルのメタデバイス状態データベースとメタデバイス状態データベースの複製の説明を参照してください。
独立したコントローラにルートをミラー化するという方法は、最高の可用性を得る手段の 1 つです。
兄弟ノードをミラーと見なし、ローカルディスクドライブに障害が発生した場合にテイクオーバーが行われるようにすることができます。この場合は、ディスクが回復したときに、兄弟ノードのルートディスクからデータをコピーして、復元できます。
ただし、Sun Cluster ソフトウェアに即時テイクオーバーを保証する機能はないことに注意してください。実際問題として、テイクオーバーがまったく行われないことも考えられます。たとえば、ディスクの一部セクターが不良で、特定のデータサービスに不可欠のファイルのユーザーデータ部分が存在すると仮定します。その場合、データサービスは起動して入出力エラーになりますが、Sun Cluster ノードは動作を継続します。
ミラーを起動可能なルートディスクに設定して、主起動ディスクで問題が発生した場合に、そのミラーから起動が行えるようにすることができます。
ミラー化されたルートがあると、主ルートディスクで問題が発生しても、二次 (ミラー) ルートディスクで動作を継続することができます。
電源を入れ直したために、あるいは一時的に入出力エラーであったために、後で主ルートディスクが正常に戻った場合、以降の起動は、OpenBootTM PROM の -boot-device フィールドに指定された主ルートディスクを使用して行われます。このとき、Solstice DiskSuite の再同期は行われません。再同期をするには、ドライブが正常に戻ったときに手作業が必要になります。
この状況では、手動の修復作業はありません。ドライブが単に、起動できる状態になっただけです。
二次 (ミラー) ルートディスク上のファイルに変更が加えられている場合、起動中に、その変更が主ルートデバイスに反映されることはなく、サブミラーは無効になります。たとえば、/etc/system に対する変更が失われることがあります (主ルートディスクが休止している間に、一部の Solstice DiskSuite 管理コマンドによって、/etc/system が変更されることがあります)。
起動プログラムは、起動がミラーまたは元の物理デバイスのどちらから行われているのかを検出しません。起動プロセスの途中 (メタデバイスが読み込まれた後) でミラー化はアクティブになります。これより前の時点では、サブミラーが無効になる問題が発生しやすくなっています。
ボリューム管理ソフトウェアを使用してルートをミラー化している状態で Solaris 環境を新しいバージョンにアップグレードするには、現在の Solaris のマニュアルには記載されていない作業が必要になります。現在の Solaris のアップグレード方法を、Sun Cluster が使用するボリューム管理ソフトウェアに対して使用することはできません。このため、Solaris をアップグレードする前に、ルートのミラーを 1 方向のミラーに変更する必要があります。また、使用しているボリュームマネージャごとに、別の作業が必要になります。詳細は、使用しているボリューム管理ソフトウェアのマニュアルを参照してください。
Solstice DiskSuite でルート (/) ファイルシステムをミラー化するかどうかを決定するにあたっては、次の方法を検討してください。この節の説明は、VERITAS Volume Manager 構成には当てはまりません。
独立したコントローラ上にルートをミラー化して、3 つあるコントローラにメタデバイス状態データベースの複製を分散させる。これは、最高の可用性を実現する方法です。この構成にするによって、ディスクとコントローラ両方の障害に耐えることができます。
Solstice DiskSuite でディスク媒体障害に耐えるには、次の方法を検討します。
2 つ目のコントローラ上にルートディスクをミラー化して、メタデバイス状態データベースのコピーをコントローラの 1 つの 3 つ目のディスクに保持する。
同じコントローラ上にルートディスクをミラー化して、メタデバイス状態データベースのコピーを同じコントローラの 3 つ目のディスクに保持する。
これらの構成では、ディスク媒体に障害が発生した後も定足数が維持されるため、保守する前にシステムを再起動することができます。ただし、これらの構成では、1 つのディスクにメタデバイス状態データベースの複製を含むコントローラの障害以外のコントローラ障害に耐えられません。
2 つのディスクに複製を保持するコントローラで問題が発生した場合、定足数は失われます。
同じコントローラ上にルートディスクをミラー化して、両方のディスクにメタデバイス状態データベースの複製を格納する。この方法では、ディスク媒体の障害に耐えられますが、即時テイクオーバーは行われません。しかし、この構成では、障害発生後、半分以上のメタデバイス状態データベースの複製が使用できなくなるため、保守を終了するまでマシンを再起動することはできなくなります。
ルートディスクをミラー化しないで、dd(1) またはその他のユーティリティを使用し、ルートディスクで問題が発生したときに起動に使用できる 2 つ目のディスクに、毎日手動でルートディスクをバックアップする。この方法では、OpenBoot PROM に 2 つ目のディスクを代替起動デバイスとして設定します。dd(1) の使用後は、ルートパーティションの変更を反映させるために、/etc/vfstab ファイルの更新が必要になることがあります。2 つ目のディスクのスライス 4 に追加のメタデバイス状態データベースの複製を設定してください。1 つ目のディスクに障害が発生した場合、それらの複製は、引き続き多重ホストディスクの複製を指定します。手動でメタデバイス状態データベースをコピーして、復元しないでください。複製は、Solstice DiskSuite で行なってください。