Sun Cluster 2.2 API 開発ガイド

HA データサービスの検証

データサービス実装を実際の環境に組み込む前に、データサービス実装を完全に検証します。この節では、高可用性環境における実装を検証する方法について説明します。この検証は一例であり、完全ではないことに注意してください。検証を行う場合、実際に稼動させるマシンに影響しないように、検証用の Sun Cluster 構成にアクセスする必要があります。

論理ホストが物理ホスト間を移動するあらゆる場面において、HA データサービスが適切に動作するかどうかを検証します。たとえば、システムに障害が発生したときや、haswitch(1M) コマンドや scadm(1M) stopnode コマンドを使用したときなどです。このような事態が発生した後でも、クライアントマシンがサービスを受け続けることができるかどうかを検証します。

メソッドの呼び出し回数への非依存性を検証します。この検証では、論理ホストのマニュアルモードを有効にし、物理ホストには論理ホストの haswitch(1M) を行わずに、1 つの物理ホストを繰り返し中止および再接続します。ホストを中止するときは、再接続したホストでクラスタ再構成が完了するまで待ちます。ホストを再接続してクラスタを再接続すると、クラスタ再構成が行われます。しかし、再構成中には、論理ホストは物理ホスト間を移動しないことに注意してください。

呼び出し回数への非依存性を検証するもう一つの方法は、各メソッドを一時的に、元のメソッドを 2 回呼び出す短いシェルスクリプトに変更します。

データサービスが abort メソッドと abort_net メソッドを適切に実装しているかどうかを検証するには、1 つの物理ホストを Sun Cluster から見ると異常であるが、完全には障害が発生していない状態にします。すると、Sun Cluster は最終手段のパスを使用し、この物理ホストをシステムから取り外そうとします。具体的には、まず、この物理ホストにすべての論理ホストの switch(1M) を実行します。次に、ホストが異常に見えるように、このホストに接続されているすべてのパブリックネットワーク接続のプラグを外します。すると、Sun Cluster ネットワーク障害監視機能に問題があったことが認識され、最終手段のパスを使用し、この物理ホストをクラスタから取り外そうとします。