クラスタ構成データベース (CCD) の管理作業には、ccdadm(1M) コマンドを使用します。詳細は、ccdadm(1M) のマニュアルページを参照してください。
ccdadm(1M) コマンドは、root として任意のアクティブノードで実行できます。このコマンドは、クラスタ内のすべてのノードを更新します。
クラスタ構成が更新されるごとに、ccdadm(1M) に -c (checkpoint) オプションを使用し、CCD の状態を記録することをお勧めします。Sun Cluster フレームワークは、論理ホストと HA データサービスに関連した構成データを格納するために CCD を頻繁に使用します。CCD は、PNM が使用するネットワークアダプタ構成データの格納にも使用されます。クラスタの HA 構成または PNM 構成を変更した後は、将来障害が発生する場合に起き得る問題への対応策として、-c オプションを使用して CCD の現在の有効スナップショットをキャプチャすることを強くお勧めします。この必要性は、データベース管理者やシステム管理者が、予測できない状況によって起きる将来のデータ損失を防ぐためにデータを頻繁にバックアップしなければならないのと同じです。
動的 CCD を検証する場合は、-v オプションを実行してください。
このオプションは、すべてのクラスタノード上の各 CCD コピーの整合性記録を比較します。この比較により、すべてのノードに渡ってデータベースに矛盾がないことを検証できます。この検証が行われる間、CCD の照会は無効になります。
# ccdadm clustername -v |
-c オプションは、週に 1 度実行するか、CCD のバックアップごとに実行してください。
このオプションは、動的 CCD のバックアップコピーを作成します。作成したバックアップコピーは、-r オプションで動的 CCD を復元する場合に使用できます。詳細は、「CCD を復元するには」を参照してください。
CCD をバックアップする場合は、ccdadm -c コマンドを実行する前にすべての論理ホストを保守モードにしてください。論理ホストは、CCD データベースの復元時にも保守モードにする必要があります。したがって、復元状態に近いバックアップファイルを用意すれば、不要なエラーや問題を防止できます。
# ccdadm clustername -c checkpoint-filename |
checkpoint-filename には、バックアップコピーの名前を指定します。
CCD が破損した場合は、-r オプションを指定して ccdadm(1M) を実行してください。このオプションは、動的 CCD の現在のコピーを破棄し、指定される復元ファイルの内容を使用して復元を行います。このコマンドは、クラスタの再起動時に、ccdd(1M) 再構成アルゴリズムが有効な CCD コピーを選択するのに失敗した後、動的 CCD を初期化または復元する場合に使用してください。復元が終わると、CCD は有効と見なされます。
必要に応じて、定足数を無効にします。
詳細は 「CCD 定足数を有効 / 無効にするには」を参照してください。
# ccdadm clustername -q off |
論理ホストを保守モードにします。
# haswitch -m logicalhost |
CCD を復元します。
restore-filename には、復元するファイルの名前を指定します。
# ccdadm clustername -r restore-filename |
必要に応じて、CCD 定足数を有効に戻します。
# ccdadm clustername -q on |
論理ホストをオンラインに戻します。
次に例を示します。
# haswitch phys-host1 logicalhost1 # haswitch phys-host2 logicalhost2 |
一般に、クラスタソフトウェアは、CCD を更新する前に定足数を必要とします。-q オプションを使用すると、この制限を無効にし、任意の数のノードで CCD を更新できます。
-q オプションは、動的 CCD の更新または復元時に定足数を有効または無効にする場合に使用します。quorum_flag は、オン (定足数を有効にする) とオフ (定足数を無効にする) のトグルになっています。定足数は、デフォルトでは有効に設定されています。
たとえば、3 つの物理ノードが存在する場合、更新を行うには少なくても 2 つのノードが必要です。ハードウェア障害のために 1 つのノードしか起動できない場合は、クラスタソフトウェアは CCD の更新を認めません。しかし、ccdadm -q コマンドを実行すると、ソフトウェアの制御を無効にして CCD を更新できます。
# ccdadm clustername -q on|off |
-p オプションは、CCD データベースファイルを浄化 (内容を検証して構文をチェックする) します。このオプションは、CCD データベースファイルに構文エラーがある場合に実行してください。
# ccdadm -p CCD-filename |
-p オプションは、指定されたファイル内の書式エラーを報告し、修正されたコピーを .pure という拡張子の付いたファイルに書き込みます。この「浄化された」ファイルは、新しい CCD データベースとして復元に使用できます。詳細は、「CCD を復元するには」を参照してください。
障害追跡を行う場合や、共有 CCD が不要になるように 2 ノードクラスタを 3 ノードクラスタに変更するような場合は、共有 CCD を無効にできます。
クラスタ内の 1 つのノードを停止します。
次のコマンドは、phys-hahost2 を停止します。
phys-hahost2# scadmin stopnode |
共有 CCD を安全な位置にバックアップします。
scconf(1M) コマンドを使用して、共有 CCD を無効にします。
このコマンドは、すべてのノードで実行してください。
phys-hahost1# scconf -S none |
共有ディスクセットから両方のノードに CCD をコピーします。
共有 CCD ボリュームのマウントを解除します。
phys-hahost1# umount /etc/opt/SUNWcluster/conf/ccdssa |
共有 CCD が存在するディスクグループをデポートします。
phys-hahost1# vxdg deport sc_dg |
停止したノードを再起動します。
phys-hahost2# scadmin startnode |
以上の作業で、各ノードのプライベート CCD が同じになります。共有 CCD を元どおり有効にするには、『Sun Cluster 2.2 ソフトウェアのインストール』の SSVM の構成に関する付録に示された手順に従ってください。
システムは、CCD 内のエラーを /var/opt/SUNWcluster/ccd/ccd.log ファイルに記録します。重大なエラーメッセージは、クラスタコンソールにも渡されます。さらに、クラッシュというまれな状況が発生した場合は、/var/opt/SUNWcluster/ccd にコアファイルが作成されます。
次に、ccd.log ファイルの例を示します。
lpc204# cat ccd.log Apr 16 14:54:05 lpc204 ID[SUNWcluster.ccd.ccdd.1005]: (info) starting `START' transition with time-out 10000 Apr 16 14:54:05 lpc204 ID[SUNWcluster.ccd.ccdd.1005]: (info) completed `START' transition with status 0 Apr 16 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1005]: (info) starting `STEP1' transition with time-out 20000 Apr 16 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1000]: (info) Nodeid = 0 Up = 0 Gennum = 0 Date = Feb 14 10h30m00 1997 Restore = 4 Apr 16 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1002]: (info) start reconfiguration elected CCD from Nodeid = 0 Apr 16 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1004]: (info) the init CCD database is consistent Apr 16 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1001]: (info) Node is up as a one-node cluster after scadmin startcluster; skipping ccd quorum test Apr 16 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1005]: (info) completed `STEP1' transition with status 0 |
次の表は、主なエラーメッセージと問題の解決方法を示しています。エラーメッセージの一覧は、『Sun Cluster 2.2 Error Messages Manual』を参照してください。
表 4-1 クラスタ構成データベースの主なエラーメッセージ