複数のノードを持ち、記憶装置が直接接続されているクラスタにおいて、クラスタの最後のノードに障害が発生した場合、あるいはクラスタを異常に (stopnode 移行を実行せずに) 終了した場合は問題が発生します。このような場合、すべてのノードがクラスタから削除され、クラスタは存在しなくなります。しかし、最後のノードがクラスタを異常な方法で残しているため、ノードロックがかかったままになります。これ以降、scadmin startcluster コマンドでノードロックを獲得しようとしても失敗します。
この問題を回避するには、クラスタを再起動する前に、ノードロックを手動で削除します。
クラスタが完全に異常終了した後、ノードロックを手動で削除し、クラスタを再起動するには、次の手順を使用します。
root として、クラスタ構成を表示します。
# scconf clustername -p |
出力から次の行を見つけます。
clustername Locking TC/SSP, port : A.B.C.D, E |
端末集配信装置 (TC) 上にノードロックがある場合は、次の手順を実行します。そうでない場合は、手順 3 に進みます。
端末集配信装置 tc-name への telnet 接続を起動します。
$ telnet tc-name Trying 192.9.75.51... Connected to tc-name. Escape character is `^]'. |
Return キーを押します。
-cli (コマンド行インタフェース) を指定します。
Enter Annex port name or number: cli |
root としてログインします。
admin コマンドを実行します。
annex# admin |
ポート E をリセットします。
admin : reset E |
telnet 接続を閉じます。
annex# hangup |
手順 4 に進みます。
SSP (システムサービスプロセッサ) 上にノードロックがある場合は、次の手順を実行します。
SSP に接続します。
$ telnet SSP_name |
ユーザー ssp としてログインします。
次のコマンドを使用し、clustername.lock ファイルの情報を表示します。このファイルは /proc/csh.pid へのシンボリックリンクです。
$ ls -l /var/tmp/clustername.lock |
プロセス csh.pid を探します。
$ ps -ef | grep csh.pid |
プロセス csh.pid が ps -ef の出力に存在する場合は、次のコマンドでこのプロセスを強制終了します。
$ kill -9 csh.pid |
clustername.lock ファイルを削除します。
$ rm -f /var/tmp/clustername.lock |
SSP からログアウトします。
クラスタを再起動します。
$ scadmin startcluster |