この章では、SunPlex システムに関して最も頻繁に寄せられる質問に対する回答を示します。回答は、トピックごとに構成されています。
可用性の高いシステムとは何ですか。
SunPlex システムでは、高可用性 (HA) を、通常サーバーシステムを使用不能にするような障害が発生した場合でも、クラスタがアプリケーションを実行し続けることができる能力として定義しています。
クラスタが高可用性を提供するプロセスは何ですか。
クラスタフレームワークは、フェイルオーバーとして知られるプロセスによって可用性の高い環境を提供します。フェイルオーバーとは、障害の発生したノードからクラスタ内の別の動作可能ノードにデータサービスリソースを移行するために、クラスタによって実行される一連のステップです。
フェイルオーバーとスケーラブルデータサービスの違いは何ですか。
高い可用性を備えたデータサービスには、フェイルオーバーデータサービスとスケーラブルデータサービスがあります。
フェイルオーバーデータサービスとは、アプリケーションが一度に 1 つのクラスタ内の主ノードだけで実行されることを示します。他のノードは他のアプリケーションを実行できますが、各アプリケーションは単一のノードでのみ実行されます。主ノードに障害が発生すると、障害が発生したノードで実行されていたアプリケーションは、別のノードに処理を引き継いで実行を続けます。
スケーラブルサービスは、アプリケーションを複数のノードに広げて、単一の論理サービスを作成します。スケーラブルサービスは、実行されるクラスタ全体のノードとプロセッサの数を強化します。
クラスタへの物理インタフェースは、アプリケーションごとに 1 つのノードに設定されます。このノードを広域インタフェース (GIF) ノードといいます。クラスタには、複数の GIF ノード が存在することがあります。個々の GIF には、スケーラブルサービスから使用する 1 つまたは複数の論理インタフェースがあります。この論理インタフェースを「広域インタフェース」と呼びます。GIF ノードは、特定のアプリケーションに対するすべての要求を広域インタフェースを介して受け取り、それらを、そのアプリケーションサーバーが動作している複数のノードに振り分けます。GIF に障害が発生すると、広域インタフェースは別のノードにフェイルオーバーされます。
アプリケーションが実行されているノードに障害が発生すると、アプリケーションは別のノードで実行を続けますが、障害が発生したノードがクラスタに戻るまで多少のパフォーマンス低下が生じます。
1 つまたは複数のクラスタノードを、他のクラスタノードをクライアントとして使用して、可用性の高い NFS サーバーとして実行できますか。
実行できません。ループバックマウントは行わないでください。
リソースグループマネージャー (RGM) によって制御されていないアプリケーションでクラスタファイルシステムを使用できますか。
使用できます。ただし、RGM の制御下にないと、アプリケーションは、実行されているノードに障害があった場合、手動で再起動する必要があります。
すべてのクラスタファイルシステムのマウントポイントが、/global ディレクトリになければなりませんか。
いいえ。ただし、クラスタファイルシステムを /global などの同一のマウントポイントのもとに置くと、これらのファイルシステムの構成と管理が簡単になります。
クラスタファイルシステムを使用した場合と NFS ファイルシステムをエクスポートした場合の違いは何ですか。
次に示すいくつかの違いがあります。
クラスタファイルシステムは広域デバイスをサポートします。NFS は、デバイスへの遠隔アクセスをサポートしません。
クラスタファイルシステムには広域名前空間があります。したがって、必要なのは 1 つのマウントコマンドだけです。これに対し、NFS では、ファイルシステムを各ノードにマウントする必要があります。
クラスタファイルシステムは、NFS よりも多くの場合でファイルをキャッシュします。たとえば、ファイルが、読み取り、書き込み、ファイルロック、非同期入出力のために複数のノードからアクセスされている場合です。
クラスタファイルシステムは、1 つのサーバーに障害が生じた場合のシームレスなフェイルオーバーをサポートします。NFS は複数のサーバーをサポートしますが、フェイルオーバーは読み取り専用ファイルシステムにのみ可能です。
クラスタファイルシステムは、リモート DMA とゼロコピー機能を提供する、将来の高速クラスタインターコネクトを利用するよう作られています。
クラスタファイルシステムのファイルの属性を (chmod(1M) などを使用して) 変更すると、変更内容はすべてのノードでただちに反映されます。エクスポートされた NFS ファイルシステムでは、この処理に時間がかかる場合があります。
クラスタノードに /global/.devices/node@<nodeID> というファイルシステムがあります。高い可用性と広域属性を与えたいデータをこのファイルシステムに格納できますか。
広域デバイス名前空間が格納されているこれらのファイルシステムは、一般的な使用を目的としたものではありません。これらのファイルシステムは広域的な属性をもっていますが、広域的にアクセスされることはありません。つまり、個々のノードは、自身の広域デバイス名前空間にしかアクセスしません。あるノードが停止しても、他のノードがこのノードに代わってこの名前空間にアクセスすることはできません。これらのファイルシステムは、高可用性を備えてはいません。したがって、高可用性や広域属性を与えたいデータをこれらのファイルシステムに格納すべきではありません。
すべてのディスクデバイスをミラー化する必要がありますか。
ディスクデバイスの可用性を高くするには、それをミラー化するか、RAID-5 ハードウェアを使用する必要があります。すべてのデータサービスは、可用性の高いディスクデバイスか、可用性の高いディスクデバイスにマウントされたクラスタファイルシステムのどちらかを使用する必要があります。このような構成にすることで、単一のディスク障害に耐えることができます。
ローカルディスク (起動ディスク) に対してあるボリューム管理ソフトウェアを使用し、多重ホストディスクに対して別のボリューム管理ソフトウェアを使用することはできますか。
この構成は、ローカルディスクを管理する Solaris Volume Manager ソフトウェアと、多重ホストディスクを管理する VERITAS Volume Manager の組み合わせによってサポートされます。これ以外の組み合わせではサポートされません。
利用可能な SunPlex データサービスは何ですか。
サポートされているデータサービスについては、『Sun Cluster 3.1 ご使用jにあたって』を参照してください。
SunPlex データサービスによってサポートされているアプリケーションのバージョンは何ですか。
サポートされているアプリケーションのバージョンについては、『Sun Cluster 3.1 ご使用jにあたって』を参照してください。
独自のデータサービスを作成できますか。
作成できます。詳細については、『Sun Cluster 3.1 データサービス開発ガイド』と Data Service Development Library API と共に提供される文書「Data Service Enabling Technologies」を参照してください。
ネットワークリソースを作成する場合に、IP アドレスで指定するのですか。またはホスト名で指定するのですか。
ネットワークリソースを指定する場合には、IP アドレスではなく、UNIX のホスト名を使用することを推奨します。
ネットワークリソースを作成する場合に、論理ホスト名 (LogicalHostname リソース) または共有アドレス (SharedAddress リソース) を使用した場合の違いは何ですか。
Sun Cluster HA for NFS の場合を除き、フェイルオーバーモードリソースグループの論理ホスト名リソースを使用するときは、共有アドレスリソースと論理ホスト名リソースは同様に使用できます。共有アドレスリソースを使用すると、クラスタネットワーキングソフトウェアが論理ホスト名ではなく、共有アドレスに合わせて構成されているために、多少のオーバーヘッドが生じます。
共有アドレスを使用する利点は、スケーラブルおよびファイルオーバーの両方のデータサービスを構成していて、クライアントが同じホスト名を使用して両方のサービスにアクセスできるようにする場合に得られます。この場合、共有アドレスリソースはフェイルオーバーアプリケーションリソースとともに 1 つのリソースグループに含まれますが、スケーラブルサービスリソースは個別のリソースグループに含まれ、共有アドレスを使用するように構成されます。スケーラブルおよびフェイルオーバーサービスはどちらも、共有アドレスリソースに構成された同じホスト名とアドレスのセットを使用します。
SunPlex システムがサポートするパブリックネットワークアダプタは何ですか。
現在、SunPlex システムは、Ethernet (10/100BASE-T および 1000BASE-SX Gb) パブリックネットワークアダプタをサポートしています。今後新しいインタフェースがサポートされる可能性があるため、最新情報については、ご購入先に確認してください。
フェイルオーバーでの MAC アドレスの役割は何ですか。
フェイルオーバーが発生すると、新しいアドレス解決プロトコル (ARP) パケットが生成されて伝送されます。これらの ARP パケットには、新しい MAC アドレス (ノードの処理が続行される新しい物理アダプタのアドレス) と古い IP アドレスが含まれます。ネットワーク上の別のマシンがこれらのパケットの 1 つを受け取ると、その ARP キャッシュから古い MAC-IP マッピングがフラッシュされて、新しいものが使用されます。
SunPlex システムでは、ホストアダプタ用の OpenBootTM PROM (OBP) に local-mac-address?=true を設定できますか。
設定できます。IP マルチパスでは、local-mac-address? に true を設定する必要があります。
IP マルチパス がアダプタの切り替えを行う際に、どの程度の遅延がありますか。
この遅延は数分に及ぶことがあります。これは、IP マルチパス スイッチオーバーが行われる際に余分な ARP を送信する必要があるためです。ただし、クライアントとクラスタ間のルーターが、この余分な ARP を必ず使用するとは限りません。ルーターは、この IP アドレスの ARP キャッシュエントリがタイムアウトになるまで、停止状態の MAC アドレスを使用する可能性があります。
ネットワークアダプタの障害の検出にはどの程度の時間が必要ですか。
デフォルトの障害検出時間は 10 秒です。アルゴリズムは障害をこの時間内に検出しようとしますが、実際の時間はネットワークの負荷によって異なります。
すべてのクラスタメンバーが同じ root パスワードを持つ必要がありますか。
各クラスタメンバーに同じ root パスワードを設定する必要はありません。ただし、同じ root パスワードをすべてのノードに使用すると、クラスタの管理を簡略化できます。
ノードが起動される順序は重要ですか。
ほとんどの場合、重要ではありません。ただし、起動順序は、amnesia (詳細は、定足数と定足数デバイスを参照) を防止するために重要です。たとえば、ノード 2 が定足数デバイスの所有者であり、ノード 1 が停止してノード 2 を停止させた場合は、ノード 2 を起動してからノード 1 を起動する必要があります。これにより、古いクラスタ構成情報を持つノードを誤って起動するのを防ぐことができます。
クラスタノードのローカルディスクをミラー化する必要がありますか。
必要があります。このミラー化は必要条件ではありませんが、クラスタノードのディスクをミラー化すると、ノードを停止させる非ミラー化ディスクの障害を防止できます。ただし、クラスタノードのローカルディスクをミラー化すると、システム管理の負荷が増えます。
クラスタメンバーのバックアップの注意点は何ですか。
クラスタには、いくつかのバックアップ方式を使用できます。1 つの方法としては、1 つのノードをテープドライブまたはライブラリが接続されたバックアップノードとして設定します。さらに、クラスタファイルシステムを使用してデータをバックアップします。このノードは共有ディスクには接続しないでください。
バックアップと復元の手順については、『Sun Cluster 3.1 のシステム管理』を参照してください。
ノードが、二次ノードとして使用できる状態にあるのはいつですか。
再起動後にノードがログインプロンプトを表示しているときです。
多重ホスト記憶装置の可用性を高めるものは何ですか。
多重ホスト記憶装置は、単一のディスクが失われてもミラー化 (またはハードウェアベースの RAID-5 コントローラ) のために存続できるので、可用性が高くなります。多重ホスト記憶装置には複数のホスト接続があるため、接続先の単一ノードが失われても耐えることができます。さらに、各ノードから、接続されている記憶装置への冗長パスは、ホストバスアダプタやケーブル、ディスクコントローラの障害に対する備えとなります。
SunPlex システムがサポートするクラスタインターコネクトは何ですか。
現在、SunPlex システムがサポートするクラスタインターコネクトは、Ethernet (100BASE-T Fast Ethernet および 1000BASE-SX Gb) と SCI ネットワークインターフェースです。
「ケーブル」とトランスポート「パス」の違いは何ですか。
クラスタトランスポートケーブルは、トランスポートアダプタとスイッチを使用して構成されます。ケーブルは、アダプタやスイッチをコンポーネント対コンポーネントとして結合します。クラスタトポロジマネージャーは、利用可能なケーブルを使用し、ノード間にエンドツーエンドのトランスポートパスを構築します。ただし、ケーブルとトランスポートパスが 1 対 1 で対応しているわけではありません。
ケーブルは、管理者によって静的に「有効」または「無効」にされます。ケーブルには「状態」(有効または無効) はありますが、「ステータス」はありません。無効なケーブルは、構成されていない状態と同じです。無効なケーブルをトランスポートパスとして使用することはできません。ケーブルを検査することはできないため、そのステータスを知ることはできません。ケーブルの状態を見るには scconf -p を使用します。
トランスポートパスは、クラスタトポロジマネージャーによって動的に確立されます。トランスポートパスの「ステータス」はトポロジマネージャーによって決められますが、パスのステータスには「オンライン」と「オフライン」があります。トランスポートパスのステータスを知るには scstat(1M) を使用します。
次のような 2 ノードクラスタがあるとします。これには、4 つのケーブルが使用されています。
node1:adapter0 to switch1, port0 node1:adapter1 to switch2, port0 node2:adapter0 to switch1, port1 node2:adapter1 to switch2, port1 |
これらの 4 つのケーブルを使用して設定できるトランスポートパスには、次の 2 つがあります。
node1:adapter0 から node2:adapter0 node2:adapter1 から node2:adapter1 |
クラスタでの使用における特殊なクライアントの要求や制約について考慮する必要がありますか。
クライアントシステムは、他のサーバーに接続する場合と同様にクラスタに接続します。データサービスアプリケーションによっては、クライアント側ソフトウェアをインストールするか、別の構成変更を行なって、クライアントがデータサービスアプリケーションに接続できるようにしなければならないこともあります。クライアント側の構成条件の詳細については、『Sun Cluster 3.1 データサービスのインストールと構成』を参照してください。
SunPlex システムには管理コンソールが必要ですか。
必要です。
管理コンソールをクラスタ専用にする必要がありますか、または別の作業に使用することができますか。
SunPlex システムは、専用の管理コンソールを必要としません。ただし、専用のコンソールを使用すると、次の利点が得られます。
コンソールと管理ツールを同じマシンにまとめることで、クラスタ管理を一元化できます。
ハードウェアサービスプロバイダによる問題解決が迅速に行われます。
管理コンソールをクラスタの近く、たとえば同じ部屋に配置する必要がありますか。
ハードウェアの保守担当者に確認してください。保守作業上、コンソールをクラスタの近くに配置する必要がある場合があります。コンソールを同じ部屋に配置する必要性は、技術的にはありません。
距離の条件すべてが合致するかぎり、1 台の管理コンソールが複数のクラスタにサービスを提供できますか。
提供できます。複数のクラスタを1 台の管理コンソールから制御できます。また、1 台の端末集配信装置 (コンセントレータ) をクラスタ間で共有することもできます。
SunPlex システムは端末集配信装置を必要としますか。
Sun Cluster 3.0 以降のすべてのソフトウェアリリースの実行には、端末集配信装置は必要はありません。障害による影響防止に端末集配信装置を必要とした Sun Cluster 2.2 とは異なり、Sun Cluster 3.0 以降の製品では端末集配信装置に依存しません。
ほとんどの SunPlex サーバーは端末集配信装置を使用していますが、Sun Enterprise E10000 サーバーが使用していないのはなぜですか。
端末集配信装置は、ほとんどのサーバーで効率的なシリアル - Ethernet コンバータです。そのコンソールポートはシリアルポートです。Sun Enterprise E10000 サーバー サーバーには、シリアルコンソールがありません。システムサービスプロセッサ (SSP) は Ethernet または jtag ポートを介したコンソールです。Sun Enterprise E10000 サーバー サーバーの場合は、コンソールに対して常に SSP を使用します。
端末集配信装置を使用した場合の利点は何ですか。
端末集配信装置を使用すると、ノードが OpenBoot PROM (OBP) にある場合でも、ネットワーク上の任意の場所にある遠隔ワークステーションから各ノードに対して、コンソールレベルのアクセスを行えます。
Sun がサポートしていない端末集配信装置を使用する場合に注意する点は何ですか。
Sun がサポートする端末集配信装置と他のコンソールデバイスの主な違いは、Sun の端末集配信装置には、端末集配信装置がコンソールに対して起動時にブレークを送信するのを防ぐ特殊なファームウェアがあるという点です。ブレーク、またはコンソールに対してブレークと解釈されることがある信号を送信するコンソールデバイスの場合、ノードが停止されることに注意してください。
Sun がサポートする端末集配信装置を再起動しないで、そこにあるロックされたポートを開放できますか。
開放できます。リセットする必要があるポート番号を書きとめて、次のコードを実行してください。
telnet tc Enter Annex port name or number: cli annex: su - annex# admin admin : reset port_number admin : quit annex# hangup # |
Sun がサポートする端末集配信装置の構成と管理の詳細については、『Sun Cluster 3.1 のシステム管理』を参照してください。
端末集配信装置自体に障害が発生した場合はどうしたらいいですか。別の装置を用意しておく必要がありますか。
ありません。端末集配信装置に障害が発生しても、クラスタの可用性はまったく失われません。ただし端末集配信装置が再び機能するまでは、ノードコンソールに接続できなくなります。
端末集配信装置を使用する場合に、セキュリティはどのように制御しますか。
通常、端末集配信装置は、他のクライアントアクセスに使用されるネットワークではなく、システム管理者が使用する小規模なネットワークに接続されています。この特定のネットワークに対するアクセスを制限することでセキュリティを制御できます。
テープドライブやディスクドライブに対して動的再構成をどのように使用するのですか。
ディスクドライブやテープドライブが、アクティブなデバイスグループに属しているかどうかを確認します。ドライブがアクティブなデバイスグループに属していない場合は、そのドライブに対して DR 切り離し操作を行うことができます。
DR 切り離し操作によってアクティブなディスクドライブやテープドライブに影響がある場合には、システムは操作を拒否し、操作によって影響を受けるドライブを特定します。そのドライブがアクティブなデバイスグループに属している場合は、ディスクドライブやテープドライブに関連する DR クラスタリングの考慮点 に進みます。
ドライブが主ノードのコンポーネントであるか、二次ノードのコンポーネントであるかを確認します。ドライブが二次ノードのコンポーネントである場合は、そのドライブに対して DR 切り離し操作を行うことができます。
ドライブが主ノードのコンポーネントである場合は、主ノードと二次ノードを切り替えてから、そのデバイスに対して DR 切り離し操作を行う必要があります。
二次ノードに対して DR 操作を行っているときに現在の主ノードに障害が発生すると、クラスタの可用性が損なわれます。これは、新しい二次ノードが提供されるまでは、主ノードのフェイルオーバー先が存在しないためです。