この章では、Sun Cluster に関して最も頻繁に寄せられる質問に対する回答を示します。回答は、トピックごとに構成されています。
可用性の高いシステムとは何ですか。
Sun Cluster では、高可用性 (HA) を、通常サーバーシステムを使用不能にするような障害が発生した場合でも、クラスタがアプリケーションを起動して実行できる能力として定義しています。
クラスタが高可用性を提供するプロセスは何ですか。
クラスタフレームワークは、フェイルオーバーとして知られるプロセスによって可用性の高い環境を提供します。フェイルオーバーとは、障害の発生したノードからクラスタ内の別の動作可能ノードにアプリケーションを移行するために、クラスタによって実行される一連のステップです。
HA サービスとスケーラブルサービスの違いは何ですか。
HA サービスとは、アプリケーションが一度に 1 つのクラスタ内の主ノードだけで実行されることを示します。他のノードは他のアプリケーションを実行できますが、各アプリケーションは単一のノードでのみ実行されます。主ノードに障害が発生すると、障害が発生したノードで実行されていたアプリケーションは、別のノードに処理を引き継いで実行を続けます。
スケーラブルサービスは、アプリケーションを複数のノードに広げて、単一の論理サービスを作成します。スケーラブルサービスは、実行されるクラスタ全体のノードとプロセッサの数を強化します。1 つのノードがすべてのアプリケーション要求を受け取り、アプリケーションサーバーが実行されている複数のノードにその要求を振り分けます。このノード (広域インタフェースノードまたは GIF と呼ばれる) に障害が発生すると、広域インタフェースは存続するノードに処理を引き継ぎます。アプリケーションが実行されているノードに障害が発生すると、アプリケーションは別のノードで実行を続けますが、障害が発生したノードがクラスタに戻るまで多少のパフォーマンス低下が生じます。
1 つまたは複数のクラスタノードを、他のクラスタノードをクライアントとして使用して、可用性の高い NFS サーバーとして実行できますか。
実行できません。ローカルロックに関する問題が lockd の強制終了と再起動 (NFS フェイルオーバー中に発生する) の機能を妨害します。終了と再起動の間で、阻止されたローカルプロセスにロックが付与される可能性があるため、ロックを所有するクライアントシステムがフェイルオーバー後にロックを再利用できなくなります。
リソースグループマネージャー (RGM) によって制御されていないアプリケーションでクラスタファイルシステムを使用できますか。
使用できます。ただし、RGM の制御下にないと、アプリケーションは、実行されているノードに障害があった場合に存続できません。
すべてのクラスタファイルシステムのマウントポイントが、/global/device-group ディレクトリになければなりませんか。
いいえ。ただし、クラスタファイルシステムを /global/device-group などの同一のマウントポイントのもとに置くと、これらのファイルシステムの構成と管理は簡単になります。
クラスタファイルシステムを使用した場合と NFS ファイルシステムをエクスポートした場合の違いは何ですか。
次に示すいくつかの違いがあります。
クラスタファイルシステムは広域デバイスをサポートします。NFS は、デバイスへの遠隔アクセスをサポートしません。
クラスタファイルシステムには広域名前空間があります。したがって、必要なのは 1 つのマウントコマンドだけです。これに対し、NFS では、ファイルシステムを各ノードにマウントする必要があります。
クラスタファイルシステムは、NFS よりも多くの場合でファイルをキャッシュします。たとえば、ファイルが、読み取り、書き込み、ファイルロック、非同期入出力のために複数のノードからアクセスされている場合です。
クラスタファイルシステムは、1 つのサーバーに障害が生じた場合のシームレスなフェイルオーバーをサポートします。NFS は複数のサーバーをサポートしますが、フェイルオーバーは読み取り専用ファイルシステムにのみ可能です。
クラスタファイルシステムは、リモート DMA とゼロコピー機能を提供する、将来の高速クラスタインターコネクトを利用するために組み込まれています。
クラスタファイルシステムのファイルの属性を (chmod(1M) などを使用して) 変更すると、変更内容はすべてのノードでただちに反映されます。エクスポートされた NFS ファイルシステムでは、この処理に時間がかかる場合があります。
すべてのディスクデバイスをミラー化する必要がありますか。
ディスクデバイスの可用性を高くするには、それをミラー化するか、RAID-5 ハードウェアを使用する必要があります。すべてのデータサービスは、可用性の高いディスクデバイスか、可用性の高いディスクデバイスにマウントされたクラスタファイルシステムのどちらかを使用する必要があります。このような構成では、単一のディスク障害に耐えられます。
利用可能な Sun Cluster データサービスは何ですか。
サポートされているデータサービスについては、『Sun Cluster 3.0 ご使用にあたって』を参照してください。
Sun Cluster データサービスによってサポートされているアプリケーションのバージョンは何ですか。
サポートされているアプリケーションのバージョンについては、『Sun Cluster 3.0 Error Messages Manual』を参照してください。
独自のデータサービスを作成できますか。
できます。詳細については、『Sun Cluster 3.0 データサービス開発ガイド』と DSDL API と共に提供される文書「Data Service Enabling Technologies」を参照してください
ネットワークリソースを作成する場合に、IP アドレスで指定するのですか。またはホスト名で指定するのですか。
ネットワークリソースを指定する場合には、IP アドレスではなく、UNIX のホスト名を使用することを推奨します。
ネットワークリソースを作成する場合に、論理ホスト名 (LogicalHostname リソース) または共有アドレス (SharedAddress リソース) を使用した場合の違いは何ですか。
Failover モードリソースグループの LogicalHostname リソースを使用する場合は、SharedAddress リソースと LogicalHostname リソースは同様に使用できます。SharedAdderss リソースを使用すると、クラスタネットワーキングソフトウェアが LogicalHostname ではなく、SharedAddress に合わせて構成されているために、多少のオーバーヘッドが生じます。
SharedAddress を使用する利点は、スケーラブルおよびファイルオーバーの両方のデータサービスを構成していて、クライアントが同じホスト名を使用して両方のサービスにアクセスできるようにする場合に得られます。この場合、SharedAddress リソースはフェイルオーバーアプリケーションリソースとともに 1 つのリソースグループに含まれますが、スケーラブルサービスリソースは個別のリソースグループに含まれ、SharedAddress を使用するように構成されます。スケーラブルおよびフェイルオーバーサービスはどちらも、SharedAddress リソースに構成された同じホスト名とアドレスのセットを使用します。
Sun Cluster がサポートするパブリックネットワークアダプタは何ですか。
現在、Sun Cluster は、Ethernet (10/100BASE-T および 1000BASE-SX Gb) パブリックネットワークアダプタをサポートしています。今後新しいインタフェースがサポートされる可能性があるため、最新情報については、ご購入先に確認してください。
フェイルオーバーでの MAC アドレスの役割は何ですか。
フェイルオーバーが発生すると、新しいアドレス解決プロトコル (ARP) パケットが生成されて伝送されます。これらの ARP パケットには、新しい MAC アドレス (ノードの処理が続行される新しい物理アダプタのアドレス) と古い IP アドレスが含まれます。ネットワーク上の別のマシンがこれらのパケットの 1 つを受け取ると、その ARP キャッシュから古い MAC-IP マッピングがフラッシュされて、新しいものが使用されます。
Sun Cluster では、ホストアダプタ用の OpenBoot PROM に local-mac-address?=true を設定できますか。
設定できません。この変数はサポートされていません。
すべてのクラスタメンバーが同じ root パスワードを持つ必要がありますか。
各クラスタメンバーに同じ root パスワードを設定する必要はありません。ただし、同じ root パスワードをすべてのノードに使用すると、クラスタの管理を簡略化できます。
ノードが起動される順序は重要ですか。
ほとんどの場合、重要ではありません。ただし、起動順序は、amnesia (詳細は、「定足数と定足数デバイス」を参照)を防止するために重要です。たとえば、ノード 2 が定足数デバイスの所有者であり、ノード 1 が停止してノード 2 を停止させた場合は、ノード 2 を起動してからノード 1 を起動する必要があります。これにより、古いクラスタ構成情報を持つノードを誤って起動するのを防ぐことができます。
クラスタノードのローカルディスクをミラー化する必要がありますか。
必要あります。このミラー化は必要条件ではありませんが、クラスタノードのディスクをミラー化すると、ノードを停止させる非ミラー化ディスクの障害を防止できます。ただし、クラスタノードのローカルディスクをミラー化すると、システム管理の負荷が増えます。
クラスタメンバーのバックアップの注意点は何ですか。
クラスタには、いくつかのバックアップ方式を使用できます。1 つの方法としては、ノードをテープドライブまたはライブラリが接続されたバックアップノードとして設定します。さらに、クラスタファイルシステムを使用してデータをバックアップします。このノードは共有ディスクには接続しないでください。
バックアップと復元の手順については、『Sun Cluster 3.0 のシステム管理』を参照してください。
多重ホスト記憶装置の可用性を高めるものは何ですか。
多重ホスト記憶装置は、単一のディスクが失われてもミラー化 (またはハードウェアベースの RAID-5 コントローラ) のために存続できるので、可用性が高くなります。多重ホスト記憶装置には複数のホスト接続があるため、接続先の単一ノードが失われても耐えることができます。
サポートされている多重ホスト記憶装置構成は何ですか。
現在、2 ノードを超える接続はサポートされていません。単一の格納装置内にあるすべての多重ホストディスクが、同じ 2 つのノードに接続しなければなりません。詳細については、「Sun Cluster トポロジ」を参照してください。
SCSI-3 PGR 用に構成されたディスクを広域デバイスとして使用できますか。
現在、SCSI-3 PGR は Sun Cluster ではサポートされていません。SCSI-2 方式だけが広域ディスクデバイスとしてサポートされています。SCSI-3 ディスクはサポートされていないため、scdidadm(1M) の -R オプションを使用して、クラスタで広域デバイスとして使用するすべての SCSI-3 ディスクに対して、正しい SCSI 方式を設定する必要があります。
Sun Cluster がサポートするクラスタインターコネクトは何ですか。
現在、Sun Clusterは、Ethernet (100BASE-T Fast Ethernet および 1000BASE-SX Gb) クラスタインターコネクトをサポートしています。Scalable Coherent Interface (SCI) のサポートも計画されています。
クラスタでの使用における特殊なクライアントの要求や制約について考慮する必要がありますか。
クライアントシステムは、他のサーバーに接続する場合と同様にクラスタに接続します。データサービスアプリケーションによっては、クライアント側ソフトウェアをインストールするか、別の構成変更を行なって、クライアントがデータサービスアプリケーションに接続できるようにしなければならないこともあります。クライアント側の構成条件の詳細については、『Sun Cluster 3.0 データサービスのインストールと構成』を参照してください。
Sun Cluster には管理コンソールが必要ですか。
必要です。
管理コンソールをクラスタ専用にする必要がありますか、または別の作業に使用することができますか。
Sun Cluster は、専用の管理コンソールを必要としません。ただし、専用のコンソールを使用すると、次の利点が得られます。
コンソールと管理ツールを同じマシンにグループ化することによって、集中的なクラスタ管理を行うことができます。
ハードウェアの保守担当者による迅速な問題解決が可能になります。
管理コンソールをクラスタの近く、たとえば同じ部屋に配置する必要がありますか。
ハードウェアの保守担当者に確認してください。保守作業上、コンソールをクラスタの近くに配置する必要がある場合があります。コンソールを同じ部屋に配置する必要性は、技術的にはありません。
距離の条件すべてが合致するかぎり、1 台の管理コンソールが複数のクラスタにサービスを提供できますか。
提供できます。複数のクラスタを1 台の管理コンソールから制御できます。また、1 台の端末集配信装置 (コンセントレータ) をクラスタ間で共有することもできます。
Sun Cluster は端末集配信装置を必要としますか。
Sun Cluster 3.0 を実行するために端末集配信装置は必要はありません。障害による影響防止に端末集配信装置を必要とした Sun Cluster 2.2 とは異なり、Sun Cluster 3.0 は端末集配信装置に依存しません。
ほとんどの Sun Cluster サーバーは端末集配信装置を使用していますが、E10000 は使用していないのはなぜですか。
端末集配信装置は、ほとんどのサーバーで効率的なシリアル - Ethernet コンバータです。そのコンソールポートはシリアルポートです。Sun Enterprise E10000 サーバーには、シリアルコンソールがありません。システムサービスプロセッサ (SSP) は Ethernet または jtag ポートを介したコンソールです。Sun Enterprise E10000 サーバーの場合は、コンソールに対して常に SSP を使用します。
端末集配信装置を使用した場合の利点は何ですか。
端末集配信装置を使用すると、ノードが OpenBoot PROM (OBP) にある場合でも、ネットワーク上の任意の場所にある遠隔ワークステーションから各ノードに対して、コンソールレベルのアクセスを行えます。
Sun がサポートしていない端末集配信装置を使用する場合に注意する点は何ですか。
Sun がサポートする端末集配信装置と他のコンソールデバイスの主な違いは、Sun の端末集配信装置には、端末集配信装置がコンソールに対して起動時にブレークを送信するのを防ぐ特殊なファームウェアがあるという点です。ブレーク、またはコンソールに対してブレークと解釈されることがある信号を送信するコンソールデバイスである場合、ノードが停止されることに注意してください。
Sun がサポートする端末集配信装置を再起動しないで、そこにあるロックされたポートを開放できますか。
開放できます。リセットする必要があるポート番号を書きとめて、次のコードを実行してください。
telnet tc Enter Annex port name or number: cli annex: su - annex# admin admin : reset port_number admin : quit annex# hangup # |
Sun がサポートする端末集配信装置の構成と管理の詳細については、『Sun Cluster 3.0 のシステム管理』を参照してください。
端末集配信装置自体に障害が発生した場合はどうしたらいいですか。別の装置を用意しておく必要がありますか。
ありません。端末集配信装置に障害が発生しても、クラスタの可用性はまったく失われません。端末集配信装置が再び機能するまで、ノードコンソールに接続できなくなります。
端末集配信装置を使用する場合に、セキュリティはどのように制御しますか。
通常、端末集配信装置は、他のクライアントアクセスに使用されるネットワークではなく、システム管理者が使用する小規模なネットワークに接続されています。この特定のネットワークに対するアクセスを制限することでセキュリティを制御できます。