ディスクに 保守状態 (Needs Maintenance) のコンポーネントが存在する、ホットスペアがコンポーネントを交換した、あるいはディスクが断続的なエラーを生成していると判断した場合は、次の作業を行なってください。
次に、Solstice DiskSuite 環境で Sun StorEdge MultiPack ディスクまたは Sun StorEdge D1000 ディスクを交換する手順の概略を示します。
交換する必要のあるディスクを確認する
交換するディスクがどのディスク拡張装置に入っているか確認する
ディスクセットから障害のあるディスクを削除する
ディスクを停止し、ディスク格納装置を解放する
ディスクドライブを交換する
scdidadm -R コマンドを実行する
ディスクセットに新しいディスクを追加する
ディスクに対してフェイルファストの予約と有効化を行う
新しいディスクをパーティションに分割する
metastat(1M) コマンドを実行して、障害が修復されたことを確認する
次に、Solstice DiskSuite 環境で Sun StorEdge MultiPack ディスクまたは Sun StorEdge D1000 ディスクを交換する詳しい手順を示します。
この作業は、障害のあるディスクが含まれているディスクセットを制御するホストで行なってください。必要に応じて、haswitch(1M) コマンドを使用してディスクセットをスイッチオーバーしてください。
交換するディスクを確認します。
metastat(1M) コマンドと /var/adm/messages の出力を使用してください。
デバイスが保守状態にあるか、コンポーネントの一部がホットスペアに置き換わっていることを metastat(1M) が報告する場合は、そのデバイスを見つけ、交換する必要があります。次に、metastat(1M) の出力例を示します。この例では、デバイス c3t3d4s0 が保守状態 (Needs Maintenance) です。
phys-hahost1# metastat -s hahost1 ... d50:Submirror of hahost1/d40 State: Needs Maintenance Stripe 0: Device Start Block Dbase State Hot Spare c3t3d4s0 0 No Okay c3t5d4s0 ... |
/var/adm/messages を検査し、どのような問題が検出されたかを確認してください。
... Jun 1 16:15:26 host1 unix: WARNING: /io- unit@f,e1200000/sbi@0.0/SUNW,pln@a0000000,741022/ssd@3,4(ssd49): Jun 1 16:15:26 host1 unix: Error for command `write(I))' Err Jun 1 16:15:27 host1 unix: or Level: Fatal Jun 1 16:15:27 host1 unix: Requested Block 144004, Error Block: 715559 Jun 1 16:15:27 host1 unix: Sense Key: Media Error Jun 1 16:15:27 host1 unix: Vendor `CONNER': Jun 1 16:15:27 host1 unix: ASC=0x10(ID CRC or ECC error),ASCQ=0x0,FRU=0x15 ... |
障害のあるディスクを特定します。
mount(1M) コマンドまたは format(1M) コマンドを実行して、コントローラ番号を確認してください。
障害のあるディスクに複製が含まれる場合は、スライスと複製の数を記録してから複製を削除します。
metadb(1M) コマンドを実行して、複製を削除します。
交換するディスク上のコンポーネントを含んでいるサブミラーを切り離します。
障害が発生したコンポーネントを含むサブミラーを切り離す場合、metadetach -f コマンドを使用してください。次のコマンド例は、メタミラー d40 から サブミラー d50 を切り離します。
phys-hahost1# metadetach -s hahost1 -f d40 d50 |
metaclear(1M) コマンドを実行して、手順 5 で切り離されたサブミラーを消去します。
phys-hahost1# metaclear -s hahost1 -f d50 |
障害のあるディスクにホットスペアが含まれている場合は、デバイスの名前とホットスペアプールが入ったデバイスの一覧を記録し、その後ホットスペアを削除します。
metahs(1M) コマンドを実行してホットスペアを削除してください。
この情報は、オブジェクトを削除する前に記録してください。これは、ディスクを交換した後で逆の作業を行えるようにするためです。
metaset(1M) コマンドを使用して、ディスクセットから障害が発生したディスクを削除します。
このコマンドの構文を次に示します。diskset には、障害が発生したディスクを含むディスクセットの名前を指定します。drive には、ディスクの DID 名を dN (Sun Cluster を新たにインストールする場合) または cNtYdZ (HA 1.3 からアップグレードする場合) の形式で指定します。
phys-hahost1# metaset -s diskset -d drive |
この処理は、構成のサイズとディスクの数に応じて 15 分以上かかります。
障害のあるディスクを交換します。
この手順の詳細は、ディスク格納装置のハードウェアサービスマニュアルを参照してください。
新しいディスクが起動していることを確認します。
ディスクは、自動的に起動します。
新しいデバイス ID を使用して、DID ドライバのデータベースを更新します。
HA 1.3 からアップグレードした場合は、インストールは DID ドライバを使用しません。この場合、この手順を省略してください。
-l フラグを指定して scdidadm(1M) を実行し、交換されるドライブの低レベルデバイス名の DID 名を確認してください。続いて、-R フラグを指定して scdidadm(1M) を実行し、DID ドライブデータベースを更新してください。DID 疑似ドライバの詳細は、『Sun Cluster 2.2 ソフトウェアのインストール』を参照してください。
phys-hahost1# scdidadm -o name -l /dev/rdsk/c3t3d4 6 phys-hahost1:/dev/rdsk/c3t3d4 /dev/did/rdsk/d6 phys-hahost1# scdidadm -R d6 |
metaset(1M) コマンドを使用して、ディスクセットに新しいディスクを追加し直します。
この手順により、障害が発生したディスクから削除された正確な数の複製が自動的に追加し直されます。コマンド構文は次のとおりです。diskset には、障害が発生したディスクを含むディスクセットの名前を指定します。drive には、ディスクの DID 名を dN (Sun Cluster を新たにインストールする場合) または cNtYdZ (HA 1.3 からアップグレードする場合) の形式で指定します。
phys-hahost1# metaset -s diskset -a drive |
この処理は、構成のサイズとディスクの数に応じて 15 分以上かかります。
scadmin(1M) コマンドを使用して、ディスクセットに追加したディスクに対してフェイルファストの予約と有効化を行います。
phys-hahost1# scadmin reserve c3t3d4 |
format(1M) または fmthard(1M) コマンドを実行して、新しいディスクの再分割を行います。
新しいディスクが、交換されたディスクとまったく同じになるように分割してください (第 1 章「Sun Cluster の管理の準備」でディスクのフォーマット情報を保存するように推奨しています)。
metainit(1M) コマンドを使用して、手順 6 で消去したディスクの初期化を再度行います。
phys-hahost1# metainit -s hahost1 d50 |
手順 5で切り離したサブミラーを接続します。
この手順を行うには、metattach(1M) コマンドを使用してください。詳細は、metattach(1M) のマニュアルページを参照してください。
phys-hahost1# metattach -s hahost1 d40 d50 |
手順 7で削除したホットスペアをすべて復元します。
metahs(1M) コマンドを実行して、ホットスペアを追加し直してください。詳細は、metahs(1M) のマニュアルページを参照してください。
phys-hahost1# metahs -s hahost1 -a hsp000 c3t2d5s0 |
交換によって問題が解決されたことを確認します。
phys-hahost1# metastat -s hahost1 |