Sun Cluster 2.2 のシステム管理

クラスタ構成データベースの管理

クラスタ構成データベース (CCD) の管理作業には、ccdadm(1M) コマンドを使用します。詳細は、ccdadm(1M) のマニュアルページを参照してください。


注 -

ccdadm(1M) コマンドは、root として任意のアクティブノードで実行できます。このコマンドは、クラスタ内のすべてのノードを更新します。


クラスタ構成が更新されるごとに、ccdadm(1M)-c (checkpoint) オプションを使用し、CCD の状態を記録することをお勧めします。Sun Cluster フレームワークは、論理ホストと HA データサービスに関連した構成データを格納するために CCD を頻繁に使用します。CCD は、PNM が使用するネットワークアダプタ構成データの格納にも使用されます。クラスタの HA 構成または PNM 構成を変更した後は、将来障害が発生する場合に起き得る問題への対応策として、-c オプションを使用して CCD の現在の有効スナップショットをキャプチャすることを強くお勧めします。この必要性は、データベース管理者やシステム管理者が、予測できない状況によって起きる将来のデータ損失を防ぐためにデータを頻繁にバックアップしなければならないのと同じです。

CCD の全体的な整合性を検証するには

動的 CCD を検証する場合は、-v オプションを実行してください。

このオプションは、すべてのクラスタノード上の各 CCD コピーの整合性記録を比較します。この比較により、すべてのノードに渡ってデータベースに矛盾がないことを検証できます。この検証が行われる間、CCD の照会は無効になります。

# ccdadm clustername -v

CCD のバックアップをとるには

-c オプションは、週に 1 度実行するか、CCD のバックアップごとに実行してください。

このオプションは、動的 CCD のバックアップコピーを作成します。作成したバックアップコピーは、-r オプションで動的 CCD を復元する場合に使用できます。詳細は、「CCD を復元するには」を参照してください。


注 -

CCD をバックアップする場合は、ccdadm -c コマンドを実行する前にすべての論理ホストを保守モードにしてください。論理ホストは、CCD データベースの復元時にも保守モードにする必要があります。したがって、復元状態に近いバックアップファイルを用意すれば、不要なエラーや問題を防止できます。


# ccdadm clustername -c checkpoint-filename

checkpoint-filename には、バックアップコピーの名前を指定します。

CCD を復元するには

CCD が破損した場合は、-r オプションを指定して ccdadm(1M) を実行してください。このオプションは、動的 CCD の現在のコピーを破棄し、指定される復元ファイルの内容を使用して復元を行います。このコマンドは、クラスタの再起動時に、ccdd(1M) 再構成アルゴリズムが有効な CCD コピーを選択するのに失敗した後、動的 CCD を初期化または復元する場合に使用してください。復元が終わると、CCD は有効と見なされます。

  1. 必要に応じて、定足数を無効にします。

    詳細は 「CCD 定足数を有効 / 無効にするには」を参照してください。

    # ccdadm clustername -q off
    
  2. 論理ホストを保守モードにします。

    # haswitch -m logicalhost
    
  3. CCD を復元します。

    restore-filename には、復元するファイルの名前を指定します。

    # ccdadm clustername -r restore-filename
    
  4. 必要に応じて、CCD 定足数を有効に戻します。

    # ccdadm clustername -q on
    
  5. 論理ホストをオンラインに戻します。

    次に例を示します。


    # haswitch phys-host1 logicalhost1
     # haswitch phys-host2 logicalhost2

CCD 定足数を有効 / 無効にするには

一般に、クラスタソフトウェアは、CCD を更新する前に定足数を必要とします。-q オプションを使用すると、この制限を無効にし、任意の数のノードで CCD を更新できます。

-q オプションは、動的 CCD の更新または復元時に定足数を有効または無効にする場合に使用します。quorum_flag は、オン (定足数を有効にする) とオフ (定足数を無効にする) のトグルになっています。定足数は、デフォルトでは有効に設定されています。

たとえば、3 つの物理ノードが存在する場合、更新を行うには少なくても 2 つのノードが必要です。ハードウェア障害のために 1 つのノードしか起動できない場合は、クラスタソフトウェアは CCD の更新を認めません。しかし、ccdadm -q コマンドを実行すると、ソフトウェアの制御を無効にして CCD を更新できます。

# ccdadm clustername -q on|off

CCD を浄化 (purify) するには

-p オプションは、CCD データベースファイルを浄化 (内容を検証して構文をチェックする) します。このオプションは、CCD データベースファイルに構文エラーがある場合に実行してください。

# ccdadm -p CCD-filename

-p オプションは、指定されたファイル内の書式エラーを報告し、修正されたコピーを .pure という拡張子の付いたファイルに書き込みます。この「浄化された」ファイルは、新しい CCD データベースとして復元に使用できます。詳細は、「CCD を復元するには」を参照してください。

共有 CCD を無効にするには

障害追跡を行う場合や、共有 CCD が不要になるように 2 ノードクラスタを 3 ノードクラスタに変更するような場合は、共有 CCD を無効にできます。

  1. クラスタ内の 1 つのノードを停止します。

    次のコマンドは、phys-hahost2 を停止します。

    phys-hahost2# scadmin stopnode
    
  2. 共有 CCD を安全な位置にバックアップします。

  3. scconf(1M) コマンドを使用して、共有 CCD を無効にします。

    このコマンドは、すべてのノードで実行してください。

    phys-hahost1# scconf -S none
    
  4. 共有ディスクセットから両方のノードに CCD をコピーします。

  5. 共有 CCD ボリュームのマウントを解除します。

    phys-hahost1# umount /etc/opt/SUNWcluster/conf/ccdssa
    
  6. 共有 CCD が存在するディスクグループをデポートします。

    phys-hahost1# vxdg deport sc_dg
    
  7. 停止したノードを再起動します。

    phys-hahost2# scadmin startnode
    

    以上の作業で、各ノードのプライベート CCD が同じになります。共有 CCD を元どおり有効にするには、『Sun Cluster 2.2 ソフトウェアのインストール』の SSVM の構成に関する付録に示された手順に従ってください。

CCD の障害追跡

システムは、CCD 内のエラーを /var/opt/SUNWcluster/ccd/ccd.log ファイルに記録します。重大なエラーメッセージは、クラスタコンソールにも渡されます。さらに、クラッシュというまれな状況が発生した場合は、/var/opt/SUNWcluster/ccd にコアファイルが作成されます。

次に、ccd.log ファイルの例を示します。

lpc204# cat ccd.log
Apr 16 14:54:05 lpc204 ID[SUNWcluster.ccd.ccdd.1005]: (info) starting `START' transition 
with time-out 10000
Apr 16 14:54:05 lpc204 ID[SUNWcluster.ccd.ccdd.1005]: (info) completed `START' transition 
with status 0
Apr 16 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1005]: (info) starting `STEP1' transition 
with time-out 20000
Apr 16 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1000]: (info) Nodeid = 0 Up = 0 Gennum = 0 
Date = Feb 14 10h30m00 1997 Restore = 4
Apr 16 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1002]: (info) start reconfiguration elected 
CCD from Nodeid = 0
Apr 16 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1004]: (info) the init CCD database is 
consistent
Apr 16 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1001]: (info) Node is up as a one-node 
cluster after scadmin startcluster; skipping ccd quorum test
Apr 16 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1005]: (info) completed `STEP1' transition 
with status 0

次の表は、主なエラーメッセージと問題の解決方法を示しています。エラーメッセージの一覧は、『Sun Cluster 2.2 Error Messages Manual』を参照してください。

表 4-1 クラスタ構成データベースの主なエラーメッセージ

番号範囲 

説明 

処理 

4200 

Cannot open file 

ccdadm -r コマンドを実行して CCD を復元する

4302 

File not found 

ccdadm -r コマンドを実行して CCD を復元する

4307 

Inconsistent Init CCD 

Sun Cluster ソフトウェアを削除し、再度インストールする 

4402 

Error registering RPC server 

パブリックネットワークを確認する (ネットワーク障害) 

4403 

RPC client create failed 

パブリックネットワークを確認する (ネットワーク障害) 

5000 

System execution error 

スクリプトの権限を確認する (同期スクリプトにエラーがある) 

5300 

Invalid CCD, needs to be restored 

ccdadm -r コマンドを実行して CCD を復元する

5304 

Error running freeze command 

スクリプトの書式が正しいか確認する (実行された同期スクリプトに不正な引数が存在する) 

5306 

Cluster pointer is null 

入力したクラスタ名が正しいか確認する (このメッセージは ccdadm cluster に指定されたクラスタが存在しないことを示す)